O Programa de Inovação Cívica da Open Knowledge Brasil está convocando, até 26 de junho, entidades acadêmicas do campo de Ciência de Dados para firmar parcerias que utilizem a ferramenta Querido Diário como objeto de estudos ao longo do segundo semestre letivo de 2022.
O objetivo das parcerias – que não possuem caráter oneroso – é articular, junto à Academia, a superação de desafios técnicos para que o projeto possa seguir se beneficiando da colaboração para sua consolidação, ao mesmo tempo em que serve a estudantes e pesquisadores como aplicação prática dos conhecimentos aprendidos. Responsáveis em Faculdades, Universidades, Centros Técnicos e Centros de Pesquisa que atuem na área podem declarar interesse por meio deste formulário, e as propostas selecionadas serão acompanhadas pela equipe da OKBR.
Sobre o Querido Diário
O Querido Diário é um projeto de código aberto desenvolvido e mantido pela OKBR cujo objetivo é acessar, libertar e integrar informações contidas nos diários oficiais dos 5.570 municípios brasileiros para aprimorar o controle social da administração pública e aproximar os cidadãos das ações de seus governantes.
A ferramenta funciona com um caminho de processamento de dados que se inicia com a raspagem dos sites que publicam os diários oficiais, indo até a disponibilização de seu conteúdo textual em formatos abertos. Atualmente, os diários oficiais de 27 municípios brasileiros estão integrados à plataforma, e há cerca de 104 mil diários raspados cujos dados estão à disposição para serem analisados e utilizados em experimentações.
Desafios
Por oferecer uma enorme – e em constante crescimento – fonte de dados sobre a administração pública, seu buscador já foi utilizado como insumo para uma série de reportagens e análises acadêmicas sobre COVID-19 por discentes e pesquisadores da UFRN e do IME-USP. Dentre as áreas do conhecimento que podem ser mobilizadas para análises, destacamos:
- Análise de Dados (estruturados e não-estruturados);
- Visualização de Dados;
- Processamento de Linguagem Natural;
- Aprendizagem de Máquina;
- Gestão Pública.
Além de desafios relacionados ao uso dos dados disponibilizados pelo Querido Diário, há também ideias referentes ao enriquecimento dos dados dos Diários Oficiais e das funcionalidades do projeto, como no estudo feito em disciplina de pós-graduação na UNICAMP, que buscou segmentar os Diários Oficiais com auxílio do modelo de linguagem BERTimbau. Elencamos algumas ideias:
- Segmentação em seções como “Licitações Públicas”;
- Facilitar a indexação e categorização de diários com sumarização de conteúdo;
- Busca semântica para que buscas realizadas dependam menos de conhecimento técnico para escolha de ótimas palavras-chave;
- Recomendação de conteúdo para identificar documentos similares;
- Reconhecimento de entidades nomeadas enriquece os dados disponibilizados de forma raramente encontrada em publicações de diários.
Parceria
As parcerias podem ser construídas em forma de projetos de disciplinas, pesquisas de graduação, mestrado ou doutorado. Também podem acontecer em projetos de extensão ou grupos de estudo com a produção de conteúdos que possam reafirmar a importância da libertação dos dados presentes nos Diários Oficiais, seja por meio de artigos, publicações científicas ou projetos de fim de curso.
A OKBR apoiará a atividade por alguns meios, que podem ser adaptados mediante contato:
- Combinar junto ao(a) docente ou o(a) responsável, um ou mais desafios que serão tratados, os resultados esperados e a definição de como será feita a documentação da atividade;
- Acompanhamento, por parte da equipe de Ciência de Dados para Inovação Cívica da OKBR, por meio de reuniões periódicas de monitoria ou da evolução da pesquisa, com periodicidade e duração a combinar;
- Incentivo e apoio na divulgação dos resultados obtidos;
- Oferecer suporte procurando acolher sugestões baseadas nas necessidades percebidas pela parceria.
Para a OKBR e o projeto Querido Diário, qualquer resultado – mesmo os não atingidos por identificação de novas barreiras não previstas, que podem, inclusive, advir de limitações da ferramenta – tem uma enorme validade para a evolução da iniciativa.
Objetivando dar início às atividades no segundo semestre letivo de 2022, o chamamento seguirá o seguinte calendário:
- até 26 de junho: recebimento de contato de interessados(as) por meio deste formulário
- de 27 de junho a 01 de julho: respostas às submissões do formulário quanto a posição que a OKBR adotará diante da proposta.
- de 04 a 15 de julho: contatos para alinhar e confirmar as datas de reuniões com proponentes pré-selecionados(as).
- de 18 de julho a 22/julho: reuniões com proponentes pré-selecionados(as).
- de 25/julho a 29/julho: seleção final e confirmação da parceria para proponentes selecionados(as).
- agosto: início das atividades combinadas para a parceria.
Como a parceria exige acompanhamento por parte da OKBR, temos uma capacidade limitada de atendimento. Por isso, é essencial que as informações básicas indicadas no formulário sejam relatadas, já que elas contribuem para uma melhor avaliação das propostas.
Além da avaliação interna de nossa disponibilidade, critérios de destaque para a seleção das propostas são: (i) seus objetivos sociais, (ii) se a equipe envolvida for composta por pessoas em grupos minoritários em tecnologia e (iii) a maturidade da proposta de utilização do Querido Diário.
Para os proponentes que desejem estudar e realizar experiências com o Querido Diário que não demandem um acompanhamento próximo e contínuo da equipe da OKBR, apresentamos os detalhes deste segunda modalidade neste documento, e disponibilizamos este formulário para que tenhamos conhecimento do escopo que a equipe pretende desenvolver.