FAQ

Como o Justa consegue todos esses dados?

As principais fontes de dados do Justa são os Portais da Transparência de órgãos públicos. Nós gostaríamos que todas as informações fossem realmente públicas e transparentes, mas essa não é a realidade. Por isso, dividimos nossos esforços de coleta de dados em duas estratégias distintas: i) coleta de dados disponibilizados integralmente em páginas ou sistemas públicos; ii) coleta de dados que, apesar de terem caráter público, não são disponibilizados em páginas ou sistemas acessíveis ao cidadão.

Para o primeiro caso, desenvolvemos uma ferramenta de raspagem de dados que automatiza a coleta de informações sobre os órgãos públicos pesquisados. Ela é capaz de colher material mesmo quando os dados não estão disponíveis em formatos legíveis por máquinas ou quando estão protegidos por mecanismos “antirrobô” como os códigos captcha. Os dados coletados passam por uma fase de limpeza e estruturação e são inseridos neste aplicativo, que possibilita sua visualização e manipulação.

Para os dados indisponíveis nos sites, nós fazemos pedidos por meio da Lei de Acesso à Informação e, nesse caso, estruturamos os dados a partir dos arquivos que foram enviados pelos órgãos como resposta.

Há projeto de expansão para mais estados brasileiros?

Sim! O Justa surgiu de um estudo feito só em São Paulo e hoje já está presente em três estados e no Distrito Federal. \o/\o/\o/\o/ Nós trabalhamos para conseguir levá-lo a todos os estados brasileiros em até 5 anos.

Posso usar a ferramenta que o Justa criou para outros projetos?

A gente acredita que não existe democracia de verdade sem transparência – e fica feliz de você se interessar em contribuir com o projeto ou replicá-lo. Os scripts utilizados e o nosso aplicativo de cruzamento e visualização de dados estão sob a licença GNU Lesser General Public License v3.0, podendo ser modificados e reutilizados. Para acessar o repositório com os códigos utilizados na coleta e estruturação dos dados, clique aqui – e aqui para saber mais sobre a licença GNU v3.0.