Uma das maiores dificuldades dos jornalistas na hora de trabalhar com dados é a organização, já que geralmente os softwares disponíveis não são capazes de eliminar ruídos na informação, como agrupar palavras escritas de forma parecida. O Talend Open Studio pode resolver estes problemas, de acordo com Giannina Segnini, jornalista do La Nación in San José, da Costa Rica. Ela apresentou as funcionalidades do programa durante uma palestra na segunda manhã da Conferência Global de Jornalismo Investigativo 2013. O software de interface simples é gratuito e disponível on-line, criado para extrair, transferir e limpar grandes bancos de dados. O Talend aceita arquivos em qualquer formato e permite gerenciar processos simultaneamente.
Giannina Segnini disse utilizar a ferramenta no dia-a-dia como editora investigativa. Ela exemplificou que atualiza quinzenalmente um banco de dados com os nomes dos nascidos e falecidos em seu país. As funções do software são:
- Identificar problemas no banco de dados de origem,
- Limpar seu banco de dados, jogando fora erros e dados que não têm importância
- Criação de diferentes modelos de visualização
- Ajuda na extração de dados
Texto: Carolina Lomelino (3º ano, PUC-Rio)
Serviço:
Normalizing Datasets with Talend
Com Giannina Segnini (Lá Nación, Costa Rica)
Domingo, 13 de outubro de 2013 – 11:00