Hoje em dia, o jornalismo de dados é algo enorme. E não digo que é enorme no sentido de estar na moda – apesar de ter se tornado muito popular nos últimos anos -, e sim “grande” como em “incompreensivelmente gigantesco”.
Leia também:
» O que é jornalismo de dados e como é feito
» Como montei uma história jornalística a partir do levantamento de dados abertos
» Como está o jornalismo de dados atualmente
Ele representa a convergência de áreas diferentes que são independentes entre si – desde pesquisa investigativa e estatística, até design e programação. A ideia de combinar essas habilidades para contar histórias importantes é muito poderosa – mas também, muito intimidadora. Quem consegue fazer tudo isso?
A verdade é que quem está fazendo jornalismo de dados não está necessariamente fazendo tudo isso, mas há partes diferentes desse quebra-cabeça para todos os gostos. E, a partir daí, é possível se envolver com uma delas e produzir histórias com o jornalismo de dados.
Para mim, essas partes se resumem em 4:
1. Encontrar dados
“Encontrar dados” pode envolver tudo, desde ter conhecimentos avançados (ou contatos com quem saiba) para usar habilidades de análises e relatórios utilizando ferramentas ou, para alguns, dominar tecnologias como MySQL e Python para coletar os dados você mesmo.
2. Interrogar dados
Interrogar dados significa que você que você precisa entender os jargões e os contextos maiores em que esses dados estão inseridos, além de estatísticas – familiaridade com planilhas pode te ajudar, e poupar muito do seu tempo.
3. Visualizar dados
Visualizar e mesclar informações, historicamente, tem sido uma responsabilidade dos designers e programadores, mas um número cada vez maior de profissionais com background editorial estão tentando entrar na onda – em parte graças a uma crescente “conscientização” sobre o que é possível com esses dados, e também pela redução das barreiras para experimentá-los.
4. Mesclar informações
Ferramentas como ManyEyes, para visualização, e Yahoo! Pipes, para mesclagem, tornaram possível para estudantes de jornalismo rapidamente perceber e aproveitar as possibilidades do jornalismo de dados.
E por onde começar?
A resposta óbvia seria “com os dados”. Mas tem uma segunda resposta: “com uma pergunta”.
Jornalistas têm que balancear sua função de relatar eventos e acontecimentos recentes com a procura por novas histórias – e o jornalismo de dados não é diferente. Aron Pilhofer, do New York Times, recomenda que você “comece pequeno, com algo que você já saiba fazer. E sempre, sempre, sempre se lembre que o objetivo final de tudo isso é o jornalismo.”
O jornalista do The Guardian, Charles Arthur, sugere que você “encontre uma história que seria melhor contada por meio de números”. Já o Jonathan Richards, do New York Times, e Conrad Quilty-Harper, do The Telegraph, sugerem que você se inspire em ideias vindas de blogs na área e participando de encontros de hackers (ou eventos similares).
Onde encontrar os dados
O Brasil é o 9º país no ranking mundial de dados abertos, e movimentos como o Índice de Dados Abertos e Portal Brasileiro de Dados Abertos tornam cada vez mais fácil acessar dados liberados por órgãos reguladores, grupos de consumidores, ONGs, instituições científicas e empresas. Você também pode monitorar respostas da lei de Acesso a Informação, iniciativas como o Volt Data Lab e relatórios emitidos por organizações privadas.
Uma segunda abordagem seria começar com a pergunta. “Radares com câmeras custam ou poupam dinheiro?”, por exemplo, que era uma pergunta frequente no Help Me Investigate, um site de jornalismo investigativo de crowdsourcing.
Então, basta procurar por dados que possam responder essa pergunta (relatórios do governo e do Departamento de Trânsito). Enviar um pedido pela Lei de Acesso a Informação também é um meio viável (só se lembre de pedir as informações em arquivo CSV ou similar).
Qualquer que seja a abordagem escolhida, é provável que o trabalho braçal se resuma a encontrar quais dados aprofundados preenchem o quebra-cabeça que você está tentando desvendar. Dados governamentais, por exemplo, vêm com jargões específicos que você precisa entender. Mas basta uma ligação ou um e-mail para uma organização relevante para esclarecer suas dúvidas.
Se esse método estiver demorando muito, uma busca avançada com “códigos obscuros” pode te ajudar – limitar sua pesquisa, por exemplo, incluindo o site brasil.gov.br filetype:pdf retorna arquivos em PDF deste site (que pode ser trocado por qualquer tipo de documento que você estiver procurando).
Contextualização
Você também precisa contextualizar dados iniciais com outras informações. Digamos que você tenha obtido informações sobre um departamento do governo estar aumentando seus gastos com pessoal. Nesse caso, você precisa saber: o departamento teve uma expansão? Como são esses gastos comparados a outros departamentos do governo? E em relação a mesma função na indústria? Está proporcional à inflação e aos custos de vida? Essa comparação pode fazer a diferença entre uma barriga e uma bela matéria.
Geralmente, seus dados precisarão de uma limpeza: tente olhar para nomes diferentes para a mesma coisa, erros de pontuação e digitação, campos mal-formatados (por exemplo, datas formatadas como texto), dados inseridos erroneamente e informações faltantes. Ferramentas como Freebase e Gridworks podem te ajudar aqui.
Ferramentas
Nessas horas, ter um pouco de conhecimento em programação é muito útil. Quanto mais você souber, melhor para você. Aqueles que sabem escrever scripts, por exemplo, podem tirar dados diretamente de uma página web e escrevê-las em tabelas. Mas, se não souber, não tem problema. Você pode usar websites como o Scraperwiki que tem exemplos de scripts para customizar conforme sua necessidade – e uma comunidade para te ajudar a fazer isso. Ou até mesmo usar crawlers como o Import.io.
E, então, tem as ferramentas como o Yahoo! Pipes e plugins como o OutWit Hub. Se os dados estão em uma tabela HTML, você até pode escrever uma fórmula de uma linha no Google Spreadsheets para pegar essas informações. Se isso falhar, você pode ter que inserí-los manualmente. Mas o que quer que faça, publique suas planilhas online para que outros não tenham que refazer todo esse trabalho duro.
Uma vez que tenha os dados necessários para contar uma história, você precisa prepará-los para visualização. Apare as arestas excessivas para melhorar a representação gráfica da sua história. Há centenas de ferramentas online que você pode usar para isso. Esse post do Volt Data Lab tem algumas recomendações.
Divirta-se!
Se você é bom com pacotes gráficos, tente fazer a visualização de dados mais clara utilizando cores e legendas. E sempre inclua um contexto sobre os dados, além de links para as fontes deles – porque infográficos costumam vir separados do texto original conforme são distribuídos nas redes.
Para mapas, Sérgio Spagnuolo, professor do curso de Jornalismo de Dados do trampos ACADEMY recomenda o Sheetsee.js – que transforma planilhas em mapas interativos. Ou você pode usar o Carto para pontuar locais de interesse.
Ambos são exemplos de mesclagem de dados, o que é útil se você gosta da palavra “mesclagem” e quer usá-la em festas para contar sobre suas experiências para os amigos. Também há muitas outras ferramentas disponíveis, mas se você quer levar a infusão de dados a sério, você precisa explorar o mundo da programação e das APIs. E, em um certo momento você pode se ver diante de todas essas possibilidades e pensar “o jornalismo de dados é enorme”.
E aí, quer se tornar um(a) jornalista de dados?
Pronto para explorar o universo do jornalismo de dados?
Pronto para explorar o universo do jornalismo de dados?
Aprenda a analisar tendências, interpretar gráficos, dados e tabelas e traduzi-los para conteúdo relevante, desde pautas institucionais até grandes reportagens.
Cientista de Dados no Nexo Jornal desde 2017 e mestre em Ciência Política pela USP.
Publicado originalmente no [ The Guardian ]. Traduzido e adaptado por tutano.