Comment mieux travailler avec les données dans le journalisme ?

Publié par emma le décembre 13, 2018 | Maj le décembre 13, 2018

1- Où sont les données ?

Lorsque la DGT publie sur son site web les amendes routières de l’année dernière en Espagne, par province, montant, etc., ou que les données de l’ECI ou un nouveau rapport de l’INE sortent, il faut plonger dans les données pour détecter des informations qui ne sont pas celles qui figurent dans le communiqué de presse.

Les sites Web de données publiques, en Espagne, il y en a de plus en plus. Il y a des informations gouvernementales qui attendent que quelqu’un les découvre, explique le journaliste Antonio Delgado, conférencier chez Journocoders, le travail journalistique consiste à relier les données. En ce sens, si des données sont publiées sur l’emplacement des centres de santé d’une ville, par exemple, elles peuvent ne pas être intéressantes, mais si elles recoupent les caractéristiques socio-démographiques de la population, un bon rapport peut en ressortir.

2 Quelles sont les données qu’il vaut mieux utiliser ?

Une fois que vous avez localisé les bases de données pour faire un rapport, quels types de données sont appropriés pour travailler avec ?
Données brutes
Si une institution publie un communiqué de presse contenant des données qui attirent l’attention, il est conseillé d’aller à la source et de chercher les données brutes, conseille Jesús Escudero, journaliste à El Confidencial. Pour que le journaliste puisse détecter une histoire différente de la version officielle.

Données désagrégées
Lorsque l’on travaille avec un ensemble de données, l’information doit être recherchée ou demandée auprès de l’institution responsable de la manière la plus désagrégée possible, avec une répartition par sexe, ville, groupe de population, budget par chapitre, etc.

PDF vers CSV
De nombreuses institutions publient leurs données en format PDF. Afin de pouvoir bien travailler avec les données, il est nécessaire de les passer dans un format tel que CSV. Pour ce faire, le PDF peut être édité au moyen d’un OCR. S’il est déjà modifiable, il existe des outils pour le passer à un CSV en quelques secondes.

Données ” humanisées
Antonio Delgado a souligné dans Journocoders que, dans les histoires, les “protagonistes ne sont pas les données, mais les personnes qui en sont affectées. Une méthode pour obtenir une meilleure histoire est de se mettre à la place des personnes derrière les données.

3- Quels outils utiliser pour travailler avec les données ?

L’outil ” or ” lorsque vous travaillez avec des données est le tableur. Cependant, nous n’avons pas toujours des données’propres’ pour commencer à travailler avec. Avant l’analyse, il est nécessaire de préparer et de ” nettoyer ” les données. Les principaux outils recommandés par les journalistes de Journocoders étaient : Tabula, ScraperWiki, Table Capture, Zamzar, Import.io, Google Refine et Excel

4- Que faire si les données ne sont pas publiques ?

Si nous ne trouvons pas les données qui nous intéressent auprès d’une institution et que, pour quelque raison que ce soit, nous ne les fournissons pas, il est temps d’exercer notre droit de faire une demande d’information. Tout citoyen a le droit d’accéder aux informations publiques, qui sont des contenus ou des documents détenus par des institutions publiques, autonomes, locales, etc. Si les données relèvent de la responsabilité d’un ministère ou d’un organisme dépendant de l’État, la demande est faite par l’intermédiaire du portail de transparence. Vous pouvez également demander des informations aux conseils municipaux, provinciaux, municipaux…. Bref, les organismes publics. Ce guide de projet indépendant, Votre droit de savoir, explique toutes les étapes de cette procédure.

5- Que faire des données une fois publiées ?

Une suggestion que les conférenciers de Journocoders ont faite aux journalistes a été de rendre publics les ensembles de données une fois qu’ils ont publié leur sujet, afin que d’autres puissent les réutiliser, ajouter ou modifier des données, collaborer avec d’autres documents ? Par exemple, ElConfidencial.LAB a un dépôt GitHub où ils publient les bases de données avec lesquelles ils ont travaillé.

L'actualité des Médias

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *