Inovação Cívica

Querido Diário é utilizado em estudo da UFRN sobre gastos públicos com a Covid-19

25 mar de 2022, por Ariane Alves

Compartilhar

“Querido Diário, hoje investiguei as compras de remédios não eficazes no combate à Covid-19 com dinheiro público…”

 

Foi o que fizeram três pesquisadores da Universidade Federal do Rio Grande do Norte em 2021! Como prática de estudos da disciplina de Ciência de Dados, Joseane Palhares, Rafael Bezerra e Wagner Gama utilizaram o Querido Diário para coletar os textos de centenas de publicações entre 2020 e 2021, e aplicar um modelo de aprendizado de máquina capaz de classificar as compras de medicamentos sem eficácia comprovada contra o coronavírus.

Todas as etapas do projeto estão explicadas neste texto publicado por Rafael. Os pesquisadores utilizaram os dois principais repositórios do projeto, o de raspadores e a toolbox, para coletar os diários e extrair o conteúdo textual a ser analisado pelos algoritmos.

Na fase de análise exploratória, a equipe buscou os trechos das publicações que citavam os medicamentos cloroquina, ivermectina, hidroxicloroquina e azitromicina e que também citavam palavras relacionadas à pandemia para assegurar a relação entre os tópicos. Entre os 16 municípios disponíveis na plataforma, Florianópolis (SC) foi a campeã de citações, seguida por São Paulo (SP) e Natal (RN).

A etapa seguinte foi a criação do modelo de aprendizagem de máquina, técnica utilizada para automatizar a análise de grandes quantidades de dados, como é feito na Operação Serenata de Amor. Mais de seis diferentes modelos foram testados. A eficácia – ou seja, a capacidade de classificar corretamente os trechos que indicavam compras públicas dos medicamentos selecionados com a finalidade de combater a pandemia – foi bem positiva, com os modelos atingindo mais de 90% de acurácia média.

A utilização do Querido Diário como ferramenta foi sugerida para o grupo pelo desenvolvedor e também pesquisador da universidade, Ítalo Epifânio, que participou da Sprint de desenvolvimento do projeto, coordenada por Giulio Carvalho na Python Brasil de 2021.

Por ser um projeto de código aberto e de contribuição voluntária, o Querido Diário sempre evolui quando é utilizado como ferramenta por estudantes e pesquisadores. Você pode relembrar a experiência com os alunos do IME-USP neste post de 2020.