Advocacy e Pesquisa

Por que cobrar por dados públicos é uma má ideia

03 ago de 2022, por OKBR

Compartilhar

Preparamos uma lista de perguntas e respostas e “legendamos” todo o projeto de lei para explicar como a proposta pode restringir o acesso a dados públicos e limitar a inovação no Brasil 

O PL 2224/2021, que tramita na Câmara dos Deputados, pode ter um efeito desastroso sobre a política de dados abertos no Brasil. De autoria do deputado Felipe Rigoni (UNIÃO-ES), a proposta teve como relator na Comissão de Trabalho, de Administração e Serviço Público (CTASP) o deputado Tiago Mitraud (NOVO-MG), e recebeu substantivas alterações que agravaram mais os riscos de privatização de dados públicos. 

Nenhuma das propostas, no entanto, foi devidamente debatida no Congresso. Setores do governo federal, favoráveis à ideia, ainda não apresentaram dados ou estudos que comprovem a necessidade de cobrança por qualquer tipo de acesso automatizado. Enquanto esperamos e cobramos por esses esclarecimentos, fizemos esse FAQ para contrapor alguns dos primeiros argumentos favoráveis à proposta. O texto será atualizado com mais informações. Mais abaixo, também fizemos uma legenda explicativa para cada trecho do projeto de lei. Confira!

Perguntas & Respostas: por que o projeto não para em pé?

“O projeto trata apenas de acesso a dados por API. As bases de dados vão estar disponíveis para download de qualquer forma”

A proposta até indica que o acesso gratuito e em formato aberto deve ser assegurado nos casos em que “o serviço de interoperabilidade de dados em tempo real” for cobrado. Para além de questões conceituais, há dois problemas centrais: o texto abre espaço para que os dados acessados por diferentes vias sejam diferentes entre si e cria “castas” de usuários com direitos de acesso distintos. Tem os “melhores” dados, mais atuais, aqueles que podem pagar, tanto diretamente pelo consumo via API, tanto por meio de um serviço construído a partir dos dados — que nada garante que será gratuito, já que o texto prevê a possibilidade de exploração comercial, sem definição de critérios para precificação (Art. 41-B). Apenas neste trecho, três dos requisitos base para que dados sejam considerados abertos são contrariados de uma só vez: serem atuais, disponíveis a um público o mais amplo possível (“acessíveis”) e sem a exigência de identificações ou registros (“acesso não-discriminatório”). 

“Cobrar pelo acesso é uma questão de justiça”

O valor social dos dados abertos é muito maior do que a cobrança pode gerar de receita. Dados abertos permitem explorar a capacidade de inovação do ecossistema, permitindo que seus vários atores — cientistas, especialistas, pessoas desenvolvedoras, organizações da sociedade civil e do setor privado, Academia, entre outros — também pensem e desenvolvam soluções, além de ser um estímulo à construção colaborativa de iniciativas e respostas a problemas públicos. Aplicativos que disponibilizam rotas e horários de ônibus são exemplos desse potencial: com os dados abertos pelo Poder Público, a solução emergiu da sociedade civil como um serviço que hoje está disponível a qualquer pessoa com um smartphone. No fim, toda a sociedade se beneficia, seja acessando os dados diretamente, ou consumindo conhecimento, informações, serviços e soluções desenvolvidos a partir deles. 

“O valor recebido pelo governo vai ajudar a melhorar a infraestrutura de dados”

De acordo com o Art. 41-A, inciso VIII, as empresas de tecnologia que prestam serviços para o governo para manter as APIs poderão cobrar diretamente de quem acessar. Assim, nada garante que o recurso a ser cobrado será reinvestido para melhorar a infraestrutura pública. O governo nem poderia, aliás, regular como uma empresa privada deve reinvestir sua receita própria. 

“Sem cobrança, o governo não tem condições de criar APIs”

Toda API tem um custo de implantação, é verdade — assim como qualquer outra política pública, ela demanda investimento por parte do governo. Para fazer cumprir a própria Lei do Governo Digital, que defende a ideia de “governo como plataforma”, o poder público precisa disponibilizar esses dados para que a sociedade gere valor sobre eles. Uma forma de diminuir esse custo é absorvê-lo no desenvolvimento de sistemas, prevendo a interoperabilidade já em sua construção. Para sistemas já existentes, o custo pode ser marginal e os benefícios de oferecê-lo podem suplantar, em muito, a receita da cobrança. As APIs são ferramentas que possibilitam escalar o acesso aos dados, barateando a oferta e tornando o consumo mais eficiente.

“Mas em nenhuma situação faz sentido cobrar por acesso a APIs?”

Cobrança deve ser a exceção, não o ponto de partida para que o acesso a dados públicos seja discutido. Da forma como está, o texto é excessivamente genérico e abre caminho para que a cobrança seja a regra. Pode ter algum sentido cobrar por volume e situações muito específicas, mas é preciso que os legisladores e o governo apresentem estudos para delimitar esses casos. 

“Dados pessoais serão compartilhados de forma segura”

Um dos pontos mais contraditórios do texto é justamente a inclusão de “dados pessoais” e “dados restritos” entre aqueles que poderão ser acessados. Apesar de afirmar conformidade com a Lei Geral de Proteção de Dados (LGPD), o projeto prevê a possibilidade de explorar os dados acessados para “fornecimento de bens ou serviços com fins de exploração comercial”, mas a exploração econômica e revenda desses dados nem deveria ser cogitada. 

Exemplos de dados abertos via API

Quaisquer bases de dados podem ser disponibilizadas via API – é uma boa prática se o objetivo é ampliar o acesso e permitir a reutilização de múltiplas formas ou conectar serviços. Separamos alguns exemplos — nacionais e internacionais — para mostrar como elas são especialmente importantes em alguns casos. 

  • Situação de vôos em aeroportos.  Esse é um tipo de informação que muda constantemente e, se o interesse é consultar o status atual, só o download de bases de dados não funciona. Quando não existe API, desenvolvedores de aplicativos ou de sites que queiram exibir isso precisam fazer uma gambiarra chamada de “raspagem de dados” (a Escola de Dados ensina aqui a fazer isso com a página de voos da Infraero). Outros governos, como os Estados Unidos, disponibilizam APIs gratuitas sobre a situação de voos e que, segundo eles, “são a base de muitas aplicações da indústria com as quais interagimos toda vez que voamos”. 
  • Tramitação de projetos de lei. O Congresso Nacional tem ótimas APIs para disponibilizar o status da tramitação de projetos. 
  • Localização dos ônibus. A prefeitura de São Paulo oferece de forma gratuita, desde 2015, acesso à API que fornece a geolocalização dos ônibus a cada 80 segundos. Com isso, dezenas de aplicativos oferecem esse serviço aos usuários de transporte público, e a prefeitura não precisou investir recursos no desenvolvimento de aplicativos próprios, que demandam muita atualização e recursos para manutenção.
  • Dados meteorológicos.  O Instituto Nacional de Meteorologia (INMET) do Brasil disponibiliza uma série de APIs para que qualquer pessoa ou instituição consulte dados sobre a situação atual, condições de tempo nas capitais, previsão do tempo, mapa de precipitação etc. Imagina ter que fazer o download de uma base completa a cada atualização? Até empresas privadas percebem o valor social de disponibilizar APIs de forma gratuita: a Climatempo disponibiliza acesso gratuito para 10 requisições por minuto ou até 100 por dia. É o que basta para pequenos negócios e veículos de comunicação de todo o Brasil manterem atualizadas as informações de tempo nos seus sites. 
  • CNPJs de empresas: a Receita ainda não disponibiliza uma API para consulta ao cadastro de empresas, como faz, por exemplo, a França. Mas não é algo caro de se fazer. Um desenvolvedor criou voluntariamente uma API para uso gratuito, a partir dos dados abertos da própria Receita Federal.

Legendamos o PL de cobrança de dados públicos para você entender melhor

***

PROJETO DE LEI Nº 2.224, DE 2021 

EMENDA Nº DE DE 2022 

O art. 1º do Projeto de Lei nº 2.224, de 2021, passa a vigorar com a seguinte redação: 

 Art. 1º A Lei 14.129, de 29 de março de 2021, passa a vigorar com a seguinte redação: 

Este projeto de lei está alterando a chamada Lei do Governo Digital. O artigo 4º é onde estão definidos alguns conceitos-chave da Lei.

“Art.4º………………………………………………………………………..

……………………………………………………………………………………

VII – governo como plataforma: infraestrutura tecnológica que facilite o uso de dados e promova a interação entre diversos agentes, de forma segura, eficiente e responsável, para estímulo à inovação, à exploração de atividade econômica e à prestação de serviços à população; 

XII – setor não governamental: pessoas jurídicas de direito privado.

Aqui o projeto está retirando da Lei do Governo Digital uma expressão que muda bastante o significado original. Na Lei vigente, está assim: “infraestrutura tecnológica que facilite o uso de dados de acesso público”. Nesta proposta, “de acesso público” some. Isso abre caminho para, mais adiante no texto, os dados pessoais entrarem no escopo da Lei. Além disso, este trecho inclui um novo conceito, de “setor não governamental”, um “balaio de gato” que vai ser importante mais adiante.  

………………………………………………………………………… 

Art.29……………………………………………………………..…

 …………………………………………………………………………. 

§3º Os órgãos e entidades públicas deverão fomentar a oferta de serviços de interoperabilidade de dados em tempo real para promoção da transparência ativa, com acesso universal e preferencialmente gratuito, respeitadas as regras de precificação previstas no art. 41-A.

Serviços de interoperabilidade de dados são aqueles que permitem que sistemas se “conversem”, a partir de uma conexão de troca de dados de forma automatizada (ou seja, sem alguém precisar fazer download manual). Isso é feito por meio de mecanismos chamados “web services” ou APIs.  Esse serviço é importante e desejável, previsto inclusive na Lei de Acesso à Informação. Mas o objetivo do trecho não é falar disso (afinal, há toda uma seção mais adiante para tratar de interoperabilidade). O que este trecho faz é ressuscitar um parágrafo que havíamos conseguido que o presidente vetasse quando sancionou a Lei do Governo Digital. O Ministério da Ciência, Tecnologia e Inovação e a Controladoria Geral da União também haviam se manifestado pelo veto. 

O parágrafo inserido aqui fala em “preferencialmente gratuito” (ou seja, pode não ser gratuito) e anuncia que uma seção mais adiante vai tratar de como o serviço poderá ser cobrado. Nesse aspecto, a emenda de Mitraud piorou a situação, pois o PL original de Felipe Rigoni ao menos falava em “acesso universal e gratuito”.  Também vai ser importante mais adiante a expressão “tempo real”, que não é  definida em nenhum local do texto e traz implicações técnicas que  parecem estar sendo ignoradas pelos legisladores.

§4º Quando o serviço de interoperabilidade de dados em tempo real, a que se refere o § 3º, não for gratuito, deverá ser assegurado o acesso gratuito aos mesmos dados em formato aberto e com temporalidade de atualização menor, na forma da regulamentação.

Um trecho tão pequeno, mas que merece um textão.

Caso o órgão decida que vai cobrar pelo serviço de acesso automatizado aos dados, ele deve disponibilizar para todos o download gratuito bases de dados com esses mesmos dados que alguém está pagando para acessar, com a diferença de que os dados para download não precisam ser atuais. Parece justo, não? Mas tem um detalhe que muda tudo: o tempo de atualização pode ser um intervalo maior (o termo “menor” ali deve ser um erro de redação, não faz sentido) — mas quão maior? O texto não diz, já que vai depender das regras desse mesmo órgão. Mistério ainda maior é como uma regulamentação vai ser capaz de prever a diversidade de casos e tipos de necessidade de atualização. Esse trecho dá margem para, por exemplo, cobrar por uma API que vai passar dados de previsão do tempo da semana e permitir que as outras pessoas baixem de graça esses mesmos dados, digamos, um mês depois. A atualidade é um dos princípios-chave de qualidade dos dados abertos previstos na LAI e é decisivo para que os dados tenham de fato valor. Ou seja: somente quem pagar terá dados úteis, de fato. 

Outro ponto que merece atenção neste trecho: o que é “tempo real”? Em geral, na área de tecnologia e dados, entende-se tempo real como o acesso ao banco de dados como ele está. Mas dificilmente uma API para acesso público permite acesso ao banco de dados diretamente — nem seria uma boa prática. O que se costuma fazer é  estabelecer uma rotina automática internamente para “jogar” esses dados em algum outro lugar e, aí sim, permitir essa conexão. Isso pode ser feito várias vezes por dia ou em intervalos maiores, como uma vez por semana, por mês, e assim por diante. Mas o mais importante aqui é: como a atualidade dos dados impacta nos custos de fornecimento? A resposta é: não impacta. Se um robô fizer UM acesso para consultar um dado atualíssimo e 20 MIL acessos de dados do ano passado, o segundo caso é o único que pode significar custos extras para o órgão em questão.

Agora imagine outra situação. A empresa fictícia “RYCA” paga para acessar a API de cadastro de CNPJs na Receita Federal e verificar os sócios de dez empresas, e ela consegue fazer isso em cinco segundos. A empresa “MICRO” não vai pagar, vai usar os dados abertos que são disponibilizados mensalmente pela Receita. Ela só quer checar se os sócios de dez empresas de um município de interesse se alteraram, mas precisa baixar todos os dez arquivos que somam muitos Gigabytes (estão  separados porque são muito grandes, afinal são os dados de todas as empresas do Brasil), para montar sua própria base de dados e então checar. O custo de tráfego de download da empresa “MICRO” (e das muitas outras na mesma situação) é muito maior para a Receita do que o custo de permitir dez consultas em uma API.

Em tempo: a Receita nem disponibiliza uma API aberta. O desenvolvedor Cuducos criou uma própria, que disponibiliza ao público depois de baixar e tratar os dados da Receita: https://github.com/cuducos/minha-receita. Faz isso de forma voluntária e, como retribuição, pede 200 dólares como crowdfunding para manter a infraestrutura do projeto. O que são 200 dólares mensais para um órgão público desse porte, e quanto a Receita gasta para permitir tantos downloads dessa grande e relevantíssima base de dados?

Para os órgãos públicos, a necessidade de disponibilizar qualquer tipo de dado em tempo real também pode ser ruim: isso, sim, pode custar mais. Mas não é sempre necessário. Pelo contrário, na maior parte dos casos, rotinas de atualização com intervalos maiores (dias ou semanas, por exemplo) cumprem bem a função pública de disponibilizar dados abertos.    

………………………………………………………………………… 

Seção III

Da Interoperabilidade de Dados com o Setor não Governamental 

Seção nova inserida para tratar da transmissão de dados para todo tipo de agente que não seja do governo (o “balaio de gato”): ONGs, universidades, empresas, indústria, veículos de imprensa, etc.

Art. 41-A Os órgãos e entidades da administração direta, autárquica e fundacional cobrarão, para fins de ressarcimento de seus custos, pela oferta de serviços de interoperabilidade destinados ao setor não governamental, quando envolver dados das seguintes categorias: 

I – dados pessoais, quando o compartilhamento de dados for do interesse do titular e estiver em conformidade com a Lei 13.709/2018; 

II – dados abertos oferecidos de forma complementar aos referidos no §3º do art 29, apenas nas hipóteses de fomento de atividade econômica ou de atendimento a demanda específica de uma determinada pessoa jurídica ou setor da economia, que onerem os custos de fornecimento ou requeiram investimentos por parte do órgão ou entidade. 

Aqui estão os critérios de cobrança para dados abertos (que pode ser a regra geral, já que o referido §3º não garante a gratuidade ao dizer “preferencialmente gratuito”). Pessoas jurídicas do setor “não governamental”, como já mencionamos antes, é tudo o que não é governo: veículos de imprensa, empresas de qualquer porte, indústria, organizações sem fins lucrativos, entidades de pesquisa. 

São duas as hipóteses: (i) que onerem custos de fornecimento ou (ii) requeiram investimentos. Ora, difícil é pensar em uma situação que não recaia sobre uma ou mesmo sobre as duas hipóteses. Isso porque o fornecimento de dados abertos é uma política pública — e, como tal, necessita de investimento. Essa é a ideia de “governo como plataforma” defendida pela própria Lei do Governo Digital: o poder público fornece os dados brutos e a sociedade gera valor sobre eles. Muitos podem se beneficiar com o conhecimento e os serviços construídos a partir dos dados, inclusive superando em muito eventuais custos de fornecimento.

Mas quanto de investimento? Depende. A partir do momento em que se constrói a API, o custo de manutenção pode ser marginal. O órgão pode estabelecer um limite de consultas. Por exemplo, o Portal da Transparência do Governo Federal tem a seguinte política para não sobrecarregar o site: no período de 6:00 às 23:59, o Portal aceita 90 requisições por minuto. Já no período das 00:00 às 5:59, são aceitas 300 requisições por minuto. Com isso, garante-se um custo de manutenção fixo e previsível por parte da organização. 

Um primeiro investimento deve ser feito: de desenvolvimento da API. Mas esse custo deve ser absorvido na própria construção dos sistemas, pois é fundamental para a interoperabilidade interna, inclusive. Não faz sentido repassá-lo aos usuários.

Por último, mas não menos importante: e se um indivíduo quiser fazer consultas massivas, pode? Não é uma pessoa jurídica… Se você tivesse uma empresa e quisesse consumir os dados de graça, não seria mais fácil fazer isso em nome de uma pessoa física? Como isso será controlado? O erro aqui é fazer a distinção pelo tipo de figura jurídica, e não pelo tipo de consumo de fato.     

III – demais dados com restrição de acesso, respeitadas as regras de compartilhamento e de sigilo próprios.

§1º Regulamento específico de cada Poder e do Ministério Público disporá sobre as regras para a aplicação do estabelecido no caput, observado o seguinte: 

Cada órgão deverá fazer sua própria regra a partir dessa proposta de lei excessivamente genérica. Ou seja: boa sorte em negociar os termos de condições ou preço justo com 5.570 municípios…

I – a oferta de serviços com ressarcimento de custos não poderá limitar a transparência, a oferta ou a qualidade dos dados abertos para acesso universal e gratuito; 

Mas limita. Esse dispositivo é contra este projeto de lei tanto quanto nós. 

II – os valores de ressarcimento de custos devem ser fixados segundo critérios objetivos, transparentes e verificáveis, se relacionar especificamente a reprodução, disponibilização e divulgação de dados

Toda API tem algum custo de manutenção, ainda que marginal, assim como todos os sites e ferramentas de transparência têm custos para divulgar dados. Isso não é exceção, é a regra. 

III – os valores referentes ao ressarcimento deverão ser aplicados exclusivamente na evolução e na manutenção dos sistemas de origem dos dados e na ampliação dos canais de transparência e de dados abertos do órgão ou entidade ou terceiros e na interoperabilidade com outros órgãos governamentais a que se refere este parágrafo; 

Investimento nos canais de terceiros? A cobrança não era para custear o próprio serviço? 🤔

IV – serão dadas transparência e publicidade aos contratos e aos valores totais arrecadados a título de ressarcimento; 

V – será assegurada a gratuidade para demandas de órgãos governamentais; 

Órgãos públicos não precisarão pagar para consumir dados de sistemas públicos? As empresas públicas de T.I, como o Serpro, talvez não gostem de saber que não poderão mais cobrar por este serviço interno, como costumam fazer. Isso pode dificultar o custeio de serviços básicos de conexão entre sistemas públicos.  

VI – será assegurada a gratuidade ou cobrança diferenciada para instituições acadêmicas, organizações sem fins lucrativos, micro e pequenas empresas e Startups, assim definidas conforme a Lei Complementar Nº 123, de 14 de Dezembro de 2006 e Lei Complementar Nº 182, de 1º de Junho de 2021. 

O trecho institui a cobrança “diferenciada” (que pode ser qualquer coisa como um desconto de 1%) para esses tipos de pessoa jurídica. Novamente, o erro é não fazer a distinção por tipo de uso. Uma grande startup que consome dados para seu aplicativo de milhões de usuários certamente não está em pé de igualdade com uma microempresa ou organização do terceiro setor. Mas aqui, o que realmente importaria para justificar uma cobrança é o volume massivo de acessos e a necessidade de algo tão específico que não servirá para outros.  

Já veículos de imprensa, embora tenham finalidade de interesse público, não se enquadram nessas exceções.  

VII – será assegurada a isonomia de condições de acesso a dados, não sendo permitida discriminação para atendimento de demandas similares;

Se o governo cobrou mil reais de uma pessoa jurídica para usar uma API, deve cobrar os mesmos mil reais para outra pessoa jurídica com demanda parecida. E não pode negar o fornecimento para uma, se já fornece para outra. 

 VIII – as empresas prestadoras de serviço contratadas pelo poder público deverão fornecer os serviços de interoperabilidade de forma adequada, satisfazendo as condições de regularidade, continuidade, eficiência, segurança, atualidade, generalidade, cortesia na sua prestação, modicidade dos preços e poderão realizar a cobrança diretamente pelos consumidores dos serviços de interoperabilidade de dados; 

As empresas de tecnologia que prestam serviços para o governo para manter as APIs poderão cobrar diretamente de quem acessar. Mas o recurso a ser cobrado não seria reinvestido para melhorar a infraestrutura pública? Como o governo vai dizer para uma empresa privada como ela deve reinvestir seus próprios recursos?

§2º Sempre que houver a necessidade de desenvolvimento de uma interface de programação de aplicações para atendimento a demanda específica de uma determinada pessoa jurídica ou setor da economia, esta interface deve ser disponibilizada de maneira aberta para permitir sua reutilização em casos análogos. 

Fica difícil “traduzir” esse trecho porque ele não faz muito sentido dentro do PL. Caso o governo desenvolva uma API a pedido de uma empresa, essa mesma API estará aberta a todas as outras empresas e pessoas. Mas a cobrança não será pelo serviço de acesso, será feita pontualmente, pelo desenvolvimento inicial da ferramenta? Por que uma empresa pagaria para que todos usufruam do acesso?   

Art. 41-B. O setor não governamental, enquanto consumidor dos dados, poderá utilizar dados a que se refere o art. 41-A, seja com disponibilização gratuita ou onerosa, como insumo para o fornecimento de bens ou serviços com fins de exploração comercial, sendo livre os critérios para a sua precificação.

Segundo este trecho, as pessoas jurídicas que usarem os dados, pagando ou não, podem explorá-los comercialmente em seus serviços e produtos. Até aí, a utilização de dados para qualquer finalidade, inclusive para comerciais, é uma liberdade prevista nos princípios de dados abertos já respaldada pela legislação brasileira. Mas aqui há dois problemas.

Primeiro: se uma empresa tem poder econômico para pagar por dados que ainda não estão abertos, ela passará a ser detentora de um bem público e, tendo pagado preços “módicos”, poderá revendê-la a quanto quiser. O Estado pode criar, assim, uma enorme distorção.

Segundo problema: estamos falando aqui também de dados pessoais e restritos — porque essas categorias foram inseridas neste mesmo PL, mais acima. Mas para dados pessoais e restritos (sigilosos, que as empresas podem ter acesso por algum motivo legal ou termo de cooperação)  não faz sentido prever exploração econômica e revenda de dados.   


Deputado
TIAGO MITRAUD
Relator

Legendas: Open Knowledge Brasil