Por Williams Alcântara e Thiago Ávila*
Em qualquer organização (institucional ou administrativa) há produção de dados que podem, e devem, ser utilizados como um instrumento para avaliar a efetividade das ações adotadas, além de apoiar durante o planejamento de novas ações. Conforme já apresentado aqui, há uma forte tendência de aumento na publicação de dados na web, e dentre estes estão os dados educacionais. Apesar de estarem disponíveis na web em diversos formatos, ainda apresentam dificuldades para atingir ampla utilização quando o objetivo é conectá-los a dados de diferentes fontes.
A educação proporciona a formação e o desenvolvimento moral e intelectual de qualquer indivíduo. Ela é fundamental para que uma pessoa desenvolva habilidades de aspectos sociais, culturais e econômicos no convívio em sociedade. Os dados educacionais podem gerar benefícios para: i) o planejamento de metas e objetivos a serem alcançados pela educação, por gestores educacionais; ii) avaliar a efetividade de medidas adotadas no contexto educacional; iii) o desenvolvimento de pesquisas; e iv) propor soluções da indústria que atuam no campo educacional [1].
No Brasil, o Ministério da Educação (MEC), através do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) produz dados educacionais como o Índice de Desenvolvimento da Educação Básica (IDEB), Exame Nacional de Desempenho dos Estudantes (ENADE), Censo Escolar e Censo do Ensino Superior que avaliam a qualidade do ensino e estão publicados na web em formatos como pdf, xls, csv e doc. A análise sob os dados pode oferecer uma percepção do estado atual da educação brasileira e pode auxiliar na tomada de decisão à gestores educacionais.
Alcântara [2] pontua que a diversidade de formatos em que os dados são publicados é importante para atender as necessidades de usuários (consumidores) com diferentes habilidades para consumo de dados. Cumpre destacar os recentes avanços na oferta de dados educacionais no Brasil, onde o MEC, disponibiliza dados em vários formatos e que conta também com uma oferta extraoficial destes dados através de uma interface de programação (API) conforme a Figura 1. Complementarmente, o aprimoramento da oferta de dados que possam ser consumidos de forma automatizada é fundamental para o melhor aproveitamento e reuso destes dados para diversas finalidades de natureza governamental, empresarial, acadêmica e para a sociedade em geral.
Uma das alternativas encontradas pela comunidade Web para o problema da baixa qualidade de dados e da problemática de distribuição é a utilização de Dados Abertos Conectados (DAC) – são um conjunto de boas práticas para a publicação e consumo de dados abertos. Os princípios de DAC podem ser aplicados a vários contextos como saúde, segurança e educação [1].
Ao aplicar Dados Abertos Conectados em contextos educacionais, é possível: melhorar a qualidade de conteúdos publicados – através do uso de vocabulários que formalizam e descrevem os termos utilizados; melhorar a veracidade das informações através de links para a fonte de dados; e agilizar o processo de recuperação de conteúdo educacional – através da conexão entre repositórios com conteúdo educacional.
Classificando os dados publicados pelo MEC de acordo com o sistema de classificação proposto por Tim Berners Lee [3], ilustrado na Figura 1, para mensurar a qualidade de publicação de dados conectados, percebemos que são classificados no nível intermediário do sistema, atingindo, no máximo, 3 (três) estrelas. Fica evidente que para alcançar os benefícios gerados por Dados Conectados é necessário evoluir para o nível de 4 e 5 estrelas, e assim, publicar dados educacionais com alta capacidade de interoperabilidade com outros conjuntos de dados.
Analisando especificamente o uso de Dados Conectados no contexto educacional, Dietze [4] defende que a integração de dados e serviços educacionais são benefícios que podem ser alcançados. Para Vega-Gorgojo et. al [5] as vantagens obtidas são: o reuso de dados, o uso de vocabulários, a conexão com outros conjuntos de dados e a disponibilidade do dado. Apesar dos benefícios e vantagens apresentados, o uso de DC impõe limitações e desafios que ainda precisam ser superados. Este autor apresenta doze dificuldades encontradas ao trabalhar com Dados Abertos Conectados (DAC), dentre estas destacam-se a necessidade de lidar com conjuntos de dados incorretos e incompletos na web, além de que os dados podem apresentar indisponibilidade de acesso e até mesmo ausência de licença [5]. Por outro lado, o trabalho de Alcântara et. al [1] identifica cinco desafios relacionados a DAC considerando o cenário atual dos dados educacionais no Brasil, dentre eles estão a falta de estímulo à publicação de dados educacionais em formato aberto, publicar dados em diferentes formatos e aplicar dados conectados a repositórios educacionais abertos.Há uma diversidade de dados educacionais prontos para evoluir com a aplicação de Dados Conectados. Precisamos disseminar a cultura de publicação e consumo de Dados Conectados.
Até a próxima!!!
- Thiago Ávila é conselheiro consultivo da Open Knowledge Brasil.
* Estes artigos são oriundos de pesquisas científicas desenvolvidas no Núcleo de Excelência em Tecnologias Sociais (NEES), do Instituto de Computação da Universidade Federal de Alagoas (UFAL) e contam com a contribuição direta dos pesquisadores Dr. Ig Ibert Bittencourt (UFAL), Dr. Seiji Isotani (USP), e Armando Barbosa, Danila Oliveira, Judson Bandeira, Thiago Ávila e Williams Alcântara (UFAL).
[1] Bandeira, J., Ávila, T., Alcantara, W., Sobrinho, A., Bittencourt, I. I., & Isotani, S. (2015). Dados abertos conectados para a Educação. Jornada de Atualização em Informática na Educação, 4(1), 47-69.
[2] Alcantara, W., Bandeira, J., Barbosa, A., Lima, A., Ávila, T., Bittencourt, I., & Isotani, S. (2015). Desafios no uso de Dados Abertos Conectados na Educação Brasileira. In Anais do DesafiE-4º Workshop de Desafios da Computação Aplicada à Educação. CSBC.
[3] Berners-Lee, T. Linked data: Design issues, 2006. http://www.w3.org/DesignIssues/LinkedData.html.
[4] Dietze, S., Sanchez-Alonso, S., Ebner, H., Qing Yu, H., Giordano, D., Marenzi, I., & Pereira Nunes, B. (2013). Interlinking educational resources and the web of data: A survey of challenges and approaches. Program, 47(1), 60-91.
[5] Vega-Gorgojo, G., Asensio-Pérez, J. I., Gómez-Sánchez, E., Bote-Lorenzo, M. L., Munoz-Cristobal, J. A. & Ruiz-Calleja, A. (2015). A Review of Linked Data Proposals in the Learning Domain. Journal of Universal Computer Science, 21(2), 326-364.
Texto publicado no site Thiago Ávila. Ele faz parte da série de artigos Dados abertos conectados.