Deep Opendata – Dados Abertos Ocultos

14 jan de 2013, por OKBR

Compartilhar

 


Os dados que os mecanismos de busca utilizam no resultado de suas pesquisas como o Google, são baseados em informações públicas, ou seja, estão disponíveis para serem indexados.

Toda informação que não esta presente nestes buscadores geralmente é porque não são alcançáveis por eles,  e estes dados são conhecidos como a “Deep Web“. O autor da expressão, Mike Bergman, afirmou que a busca na Internet atualmente pode ser comparada com o arrastar de uma rede na superfície do oceano: pode-se pescar um peixe grande, mas há uma grande quantidade de informação que está no fundo, e, portanto, faltando. A explicação é simples, diversos sites são gerados dinamicamente, fazendo com que os robôs criados pelos buscadores, os responsáveis por vasculhar a Web, não encontrem eles.

Porém agora podemos descrever atualmente um cenário muito semelhante ocorrendo com as informações relativas a dados abertos, pois o movimento esta em crescimento, porém a utilização das técnicas para “linkar os dados” entre si esta muito lento.

Um exemplo recorrente, são os portais de governos em todo mundo, que oferecem os dados disponíveis em documentos para download, em formatos abertos como CSV ou XML, porém não para serem encontrados por humanos que estão navegando na web através de mecanismos de busca.

Atualmente os dados abertos governamentais de uma maneira geral, estão disponíveis para os buscadores apenas como arquivos, representando apenas a ponta do iceberg. Isto significa que para que qualquer um encontre informações que estejam dentro destes arquivos, ela terá que procurar pelos arquivos e não pelo conteúdo contido nele. A solução para isto, é representar estes dados de forma semântica na web e efetuar otimizações para motores de busca.