Por Thiago Ávila*
Com o crescimento da web e o uso massivo de tecnologias da informação, a quantidade de dados gerados e disponibilizados tem crescido exponencialmente. Neste contexto, é estabelecido um ciclo virtuoso de oferta e demanda, pois o aumento da necessidade de dados e informações impulsiona o desenvolvimento das Tecnologias da Informação e da Comunicação (TICs) e consequentemente, a evolução da capacidade e do volume de ferramentas tecnológicas viabilizou este crescimento expressivo da produção de dados e informações. Cumpre destacar que na atual dinâmica mundial, essa demanda por informações passa a se diversificar, seja pela sua rapidez na sua atualização, na sua distribuição geográfica ou ainda, em áreas do conhecimento que ainda apresentem carências na produção de informações a seu respeito.
Este tema passa a ganhar maior relevância quando se é observado os prognósticos referentes ao volume de dados que serão produzidos nas próximas décadas. O estudo “A Universe of Opportunities and Challenges”, desenvolvido pela consultoria EMC [1], aponta que de 2006 a 2010, o volume de dados digitais gerados cresceu de 166 Exabytes para 988 Exabytes. Conforme a figura 1, existe a perspectiva que o volume de dados alcance a casa dos 40.000 Exabytes, ou 40 Zettabytes (ou 40 trilhões de Gigabytes).
Este mesmo estudo apresenta outros dados relevantes. Até 2020, a perspectiva que o volume de investimentos no ecossistema digital cresça em 40% em todo o mundo e, no mesmo período, o custo do investimento por gigabyte entre 2012 e 2020 deve cair de $ 2,00 para $0,20. Ademais, a tendência é de forte descentralização da economia digital no mundo, onde os países emergentes devem responder por 62% do market share.E o que poderemos fazer com toda essa oferta de dados que não param de crescer?
Um importante estudo da consultoria McKinsey, denominado “Big Data: The Next Frontier For Innovation, Competition And Productivity”[2] aponta diversos potenciais para o uso massivo de grandes volumes dados na economia global, atualmente conhecido como Big Data. Segundo o estudo, existem cinco grandes maneiras em que usando dados grandes podem criar valor. Primeiro, o Big Data pode ajudar a descobrir um valor significativo nas bases de dados mediante a geração de informação transparente e utilizável em maior frequência. Em segundo lugar, as organizações poderão cada vez mais, criar e armazenar dados transacionais em formato digital, e obter informações muito mais precisas e detalhadas sobre diversas áreas, por exemplo, equilibrando seus estoques com as perspectivas de venda dos próximos meses ou semanas e com isto melhorar o seu desempenho.
Em terceiro lugar, Big Data permite o aprimoramento da relação com os clientes, viabilizando uma extração e segmentação cada vez maior do perfil dos clientes de uma empresa. Em quarto lugar, análises sofisticadas pode melhorar substancialmente a tomada de decisões. E ainda, Big Data pode ser utilizado para melhorar e criar uma nova geração de produtos e serviços. Por exemplo, os fabricantes estão usando dados obtidos de sensores incorporados em produtos para criar pós-venda ofertas de serviços inovadores, como a manutenção proativa (medidas preventivas que se realizam antes de ocorrer uma falha sequer são notados).
A Mckinsey prevê ainda que o Big Data poderá apoiar novas ondas de crescimento da produtividade, estimando um potencial de ampliação das margens operacionais na casa dos 60%. Ademais, o estudo prevê que o Big Data se tornará um dos diferenciais para o crescimento das empresas e diferenciação junto à concorrência. Diante de tais fatos, as empresas estão considerando o uso de grandes bases de dados cada vez mais a sério.
No campo governamental, especialmente em estudos sobre dados abertos governamentais, como o guia para abertura de dados do Chile[3], outros benefícios da oferta de dados são identificados como:
- Melhorar a eficiência da gestão pública e a qualidade das políticas públicas;
- Agregar valor às informações e decisões governamentais;
- Fomentar a inovação mediante a utilização de dados abertos no desenvolvimento de aplicações e serviços inovadores;
- Promover o crescimento econômico através de informações ofertadas de forma massiva, permanente e confiável, a ser utilizada ou transformada para a criação de novos negócios e melhoria dos serviços de governo.
Tudo bem. As perspectivas da economia digital e da oferta de dados são muito promissoras, mas existem problemas relevantes a serem considerados, como:
- Poderá haver uma escassez de talentos necessários para que as organizações possam aproveitar o potencial do Big Data. Em 2018, somente nos Estados Unidos da América, está previsto um gap de 140 a 190 mil profissionais com habilidades para análise de grandes bases de dados diante da demanda existente, e na camada gerencial, a previsão é que o gap seja de cerca de 1,5 milhões de gestores e analistas com o know-how necessário para usar o Big Data como subsídio para a tomada de decisão eficaz; [2]
- Algumas questões devem ser superadas para capturar o potencial do Big Data, como o estabelecimento de políticas para tratamento da privacidade, segurança da informação e propriedade intelectual, bem como a reorganização dos fluxos produtivos para incorporar este novo ativo [2];
- Para a tomada de decisão eficaz, as empresas poderão organizar não apenas as suas informações, mas também consumir cada vez mais as informações de terceiros (como fornecedores, governo, etc.) o que vai resultar em um esforço ainda maior para a melhoria da oferta de dados considerando o caráter cada vez mais descentralizado destes recursos de dados [2];
- No que tange a Dados Abertos Governamentais, em 2012, já existiam cerca de 115 catálogos de dados governamentais disponíveis, ofertando cerca de 710.000 conjuntos de dados [4]. Atualmente, em 2015, segundo o DataPortals.org, existem 417 catálogos de dados governamentais abertos disponíveis em todos os continentes, o que comprova a rápida ascensão e distribuição geográfica desta oferta de dados;
- Segundo a IBM[5], 80% dos dados produzidos nas empresas são desestruturados, ou seja, requerem um esforço muito maior para ser aproveitado para subsidiar a tomada de decisão, e certamente, parte destes dados não serão úteis para tal finalidade;
- Quanto ao potencial de uso dos dados digitais do mundo, o estudo da EMC aponta um dado preocupante: em 2012, apenas 23% da informação digital do mundo é útil para gerar novas informações e conhecimento e apoiar a tomada de decisão no âmbito do Big Data, e deste total, apenas 3% destas informações são úteis para uso imediato (os demais 20% ainda precisam ser tratados para estar aptas ao uso) [1];
- No cenário tecnológico atual, o volume de dados aptos a serem explorados para tomada de decisão (valor analítico) deve alcançar apenas 33% do volume total de 40 Zettabytes [1].
Em resumo, nas perspectivas atuais, 67% da oferta de dados em 2020 poderão ser inúteis para reuso e apoio à construção do conhecimento e subsidiar a tomada de decisão. Essa oferta de dados estará cada vez mais distribuída ao redor do globo.
Ou seja, poderemos fazer muita coisa com estes 40 trilhões de terabytes ou simplesmente NADA. Dependerá muito dos nossos esforços para melhorar a qualidade desta oferta de dados, tratando os pré-requisitos para a obtenção de valor a partir do seu uso, como descrito brevemente neste artigo.
Nos próximos artigos, exploraremos questões relevantes sobre os dados na economia digital, apresentando tendências e ações que estão sendo desenvolvidas no âmbito global para melhorar a oferta de dados na web e consequentemente explorar todo o seu potencial para a melhoria da ação governamental, empresarial, acadêmica, dentre outros.
Até a próxima.
Thiago Ávila é conselheiro consultivo da Open Knowledge Brasil.
* Estes artigos contam são oriundos de pesquisas científicas desenvolvidas no Núcleo de Excelência em Tecnologias Sociais (NEES), do Instituto de Computação da Universidade Federal de Alagoas (UFAL) e contam com a contribuição direta dos pesquisadores Dr. Ig Ibert Bittencourt (UFAL), Dr. Seiji Isotani (USP), e Armando Barbosa, Danila Oliveira, Judson Bandeira, Thiago Ávila e Williams Alcântara (UFAL).
[1] Gantz, John and Reinsel. (2012). David. The Digital Universe In 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East. EMC Corporation. Acesso em: jul. 2015. Disponível em: http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf
[2] Manyika, James; Chui, Michael; Brown, Brad; Bughin, Jacques; Dobbs, Richard; Roxburgh, Charles & Byers, Angela Hung. (2011). Big data: The Next Frontier For Innovation, Competition, And Productivity. McKinsey Global Institute. Disponível em: http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation. Acesso em: jul. 2015
[3] Norma Técnica para Publicación de Datos Abiertos en Chile (2013). Gobierno de Chile. Unidad de Modernización y Gobierno Digital. Disponível em: http://instituciones.gobiernoabierto.cl/NormaTecnicaPublicacionDatosChile_v2-1.pdf. Acesso em: maio. 2015.
[4] Hendler, James and Holm, Jeanne and Musialek, Chris and Thomas, George. (2012). US Government Linked Open Data: Semantic.data.gov. IEEE Intelligent Systems, p. 25-31, vol. 27. doi: 10.1109/MIS.2012.27.
[5] IBM. (n.d).Apply New Analytics Tools To Reveal New Opportunities. IBM. Acesso em: jul. 2015. Disponível em: http://www.ibm.com/smarterplanet/us/en/business_analytics/article/it_business_intelligence.html
Texto publicado no site Thiago Ávila. Ele faz parte da série de artigos Dados abertos conectados.