Le journalisme de données

Dallas/Ft. Worth night image from Space Station, 02-28-10

Quand on me demande ce qu’est le journalisme de données ou datajournalisme, je ne peux m’empêcher de penser à ces intrépides navigateurs des temps anciens qui traçaient le chemin de leur navire et de leurs hommes en observant l’indicible ballet des étoiles. La position de l’aventurier dans l’espace et le temps donne en soi, aux informations recelées par les astres, un sens particulier qui doit être déchiffré, interprété et appliqué à la réalité. La lecture de la multitude n’est pas le défi principal : c’est l’exploration du contexte – la situation du lecteur face à l’information – qui détermine du succès ou de l’échec de l’équipage vers les terres inconnues.

Le journaliste de données est un journaliste, navigateur comme les autres. La finalité reste la même : raconter une histoire, ouvrir des portes vers des réalités auxquelles le public n’a pas nécessairement accès. Pour raconter ces histoires et rendre compte de ces réalités, le « datajournaliste » ne voyage pas à l’autre bout du monde au coeur de terres en conflit, n’écume pas les archives de tribunaux à la recherche d’une anomalie pouvant confondre un homme ou une entreprise, n’a pas la nécessité de faire des rencontres pour défricher la condition humaine : il se projette sur Internet, fouille des bases de données, trie le bon grain de l’ivraie, scénarise une visualisation. Il écrit simplement son histoire avec d’autres outils.

Aujourd’hui, les rédactions sont structurées de telle manière que le journaliste de données – quand il existe – est un spécialiste : il n’est ni grand reporter, ni journaliste d’investigation, ni journaliste politique, ni journaliste reporter d’images (JRI), ni critique littéraire, ni éditorialiste. Comme les autres, toutefois, il rassemble des faits, les analyse, les transforme pour informer le public et il poursuit sa mission à travers la même déontologie que ses semblables.

De la démocratisation du partage

Au-delà de cette verticalité dans l’exercice quotidien d’une profession, l’avenir des métiers liés au datajournalisme se situe sur l’axe horizontal : la mutation opérée par le New York Times sur ce point est probablement symptomatique de la destinée de cette activité. Dans ce grand quotidien en ligne, la mise en scène de la donnée n’y est plus verticale, elle est devenue transversale à l’ensemble des rubriques du journal. Pas un domaine n’est réservé à un traitement par la data : c’est l’ensemble des sujets qui peuvent être aujourd’hui scrutés et mis en forme au travers d’une pratique qui, à défaut d’être nouvelle, est pour le moins renouvelée grâce aux outils disponibles aujourd’hui – étroitement liés à la révolution informatique et informationnelle que représente Internet – et aux nouveaux métiers associés au graphisme et à la programmation.

On nous demande d’ailleurs souvent s’il faut intégrer des éléments pédagogiques de graphisme et de programmation informatique dans les compétences d’un journaliste. Il y a une dimension coercitive dans le « il faut » qui n’est probablement pas en adéquation avec le vent libertaire qui accompagne – hasard ou pas – la montée en puissance du journalisme de données et des phénomènes afférents fortement marqués par « l’ouverture » (open data, open gov, open journalism, etc.). Cela dit, il est probable que les bases de nouvelles disciplines telles que le graphisme et la programmation soient des « plus » incontournables proposés par les écoles de journalisme à l’avenir. Cette vision s’accorde avec l’idée plus générale que la programmation est le « nouveau latin » de l’humanité ce qui est un point de vue inédit, amusant, voire excitant à notre niveau. L’image n’est pas nouvelle, mais il est évident que cette « ouverture » massive introduite dans les pratiques de la transmission du savoir, de la culture et de l’information ressemble à celle qui a envahi le monde au 15e siècle avec l’imprimerie et la démocratisation de l’écriture.

Face à l’obésité informationnelle

C’est ainsi que le journalisme de données est l’accompagnement naturel d’un mouvement de fond qui bouleverse la société à l’échelle mondiale depuis 20 ans : l’expansion d’Internet, la progression exponentielle des échanges et des stockages de données numériques qui y sont liés, et l’amélioration des conditions d’accès au réseau par le plus grand nombre.

Autrement dit, Internet a confirmé d’une part qu’il était devenu un média de masse à part entière depuis son explosion au début du 21e siècle, mais il est également devenu le seul média permettant un tel niveau d’interactivité entre le diffuseur et le public, voire entre les éléments du public lui-même. Internet est la source, le réceptacle et le diffuseur de l’information, il s’adresse à des utilisateurs devenus actifs et acteurs de leur propre média. Et la principale conséquence de cette évolution est la participation soudaine du plus grand nombre à la construction de l’information – la partie la plus visible est celle liée à l’information « divertissante » : à ce jour, par exemple, une heure de vidéo est mise en ligne sur YouTube toutes les secondes.

C’est de cette constitution massive de données nouvelles qu’a vu le jour le datajournaliste. Sa spécialité : dénicher la donnée, la traiter, l’interpréter, l’analyser et finalement lui donner un sens. Les modes de restitution sont multiples, mais ce nouveau journalisme privilégie souvent une transmission de l’information faisant appel aux codes efficaces et épurés du design, réputés plus percutants : à l’ère du « less is more » de l’architecte Ludwig Mies van der Rohe et à l’instar de l’auteur anglais David McCandless qui fait référence dans le microcosme du design informationnel, les infographies, les visualisations animées et/ou interactives, les cartographies sont les moyens de mise en forme minimaliste de l’information les plus utilisés. C’est alors pour lui l’occasion de stimuler la coopération de plusieurs savoir-faire autour d’un même projet et de permettre à celui-ci de s’enrichir du point de vue inédit du développeur ou du designer. Et de parvenir ainsi à synthétiser le phénomène « d’infobésité » – c’est-à-dire l’obésité informationnelle dont les statistiques mouvantes de YouTube ne sont que la partie émergée de l’iceberg – qui caractérise l’époque : une quantité d’informations en constant et exponentiel développement. Synthétiser cette masse surhumaine, ou du moins de le tenter.

Libération des données, un enjeu politique

Une partie moins visible de la participation soudaine du plus grand nombre à la construction de l’information se manifeste par la prise de conscience par le citoyen du pouvoir qu’il peut exercer sur la chose publique grâce à ce « quatrième pouvoir » numérique qu’est le média Internet – ou le cinquième pouvoir pour reprendre l’expression d’Ignacio Ramonet. Grâce à cette conscience collective et par le fait de la fabuleuse interconnectivité permise par Internet, des données éparpillées balisant le quotidien de l’humanité se constituent, des réflexes de nomenclatures complexes voient le jour, le grand catalogue des faits s’enrichit dans un mouvement silencieux et continu.

Chacun se prend au jeu de l’accès libre aux données, encouragé par l’impression commune qu’Internet est le porte-drapeau de la liberté et de la gratuité. Le sentiment diffus que les informations appartiennent à tous conduit aujourd’hui à une véritable popularisation du concept de libération des données publiques (open data) et privées, première étape (ou étage) de la transformation générale vers une démocratie – ou gouvernance – ouverte (open gov). Dont le journaliste de données est par essence et par usage un fervent militant – même si ce militantisme ne doit pas faire oublier au journaliste de rester vigilant quant à la crédibilité des documents libérés. C’est son travail – historique – de vérificateur.

La véracité de l’information – posée à travers la crédibilité des sources – est une pierre angulaire, dans un premier temps, à la prise de position générale pour l’ouverture et la libération des données publiques. Le mouvement Open Data devait exploser en 2012, après un départ encourageant en 2011 avec pour point d’orgue l’ouverture du portail français Etalab. Aujourd’hui, le consensus général dans le milieu de la donnée, c’est : ouvrons d’abord, indifféremment, les données publiques, on verra le reste après. Véritable gage de transparence démocratique, l’Open Data permet en quelque sorte de « certifier » la donnée grâce à l’établissement d’une norme, d’une licence et d’un format validés par l’État. Naturellement, le simple fait que les données soient libérées par l’État ne suffit pas à garantir en soi la véracité des sources ; il faut que le citoyen puisse s’emparer également du sujet afin de le contrôler, et d’exprimer ses propres besoins. Mais quand les deux parties sont présentes sur le sujet et sont motivées pour s’exprimer et faire évoluer la question – de nombreuses organisations existent en France, comme « Regards Citoyens » ou « LiberTIC » pour ne citer qu’elles – c’est déjà un grand pas franchi pour le journalisme de données.

Nouvelles ombres, nouvelle vigilance

Le datajournaliste ne pouvant pas se contenter d’exercer son métier devant des données fournies par l’État, il arrive parfois qu’il faille prendre de nombreuses précautions face à un jeu de données dont les origines ne sont pas parfaitement identifiées. D’où le fichier vient-il originellement ? Les informations qu’il contient peuvent-elles être recoupées avec d’autres ? Qui m’a transmis le fichier ? D’où le tire-t-il lui-même ? Il arrive que les élites et les sphères de pouvoir confondent transparence et droit à l’information. Pour certains, réticents, comme Hubert Védrine, « la transparence illimitée, c’est la Chine de Mao ». Pour d’autres, comme Edwy Plenel, « le propre d’un pouvoir totalitaire, ce n’est justement pas ‘la transparence illimitée’, mais l’opacité totale sur le pouvoir et une transparence inquisitoriale sur les individus ». La vérification de l’information n’est pas une question exclusive au métier de datajournaliste, mais au métier de journaliste tout court – le support change un peu, mais la pratique, fondamentale, reste la même. La transparence induite par l’ouverture systématique des données publiques est également, possiblement, le déplacement de l’opacité ou de l’ombre d’un ciel vers un autre. Le rôle du datajournaliste est ici, avant tout, de veiller au sens imprimé par les données sur la réalité.

La multitude des data-étoiles n’est pas le défi principal du navigateur-journaliste : c’est l’analyse de sa position par rapport aux étoiles, autrement dit du contexte, qui détermine du succès ou de l’échec de l’équipage vers les terres inconnues. On l’a compris, le plus important pour comprendre la mutation du journaliste vers un datajournalisme créé par l’opportunité d’une époque connectée n’est pas de scruter leurs différences. Mais plutôt de rester vigilant pour qu’ils ne s’écartent, ni l’un ni l’autre, de la seule lumière qui compte vraiment : la juste restitution de l’information au public.

Les outils du datajournalisme

Avec une communauté de développeurs qui s’accroît au fil du temps, les datajournalistes disposent aujourd’hui d’un nombre relativement important d’outils de restitution et de visualisation de la donnée, leur permettant de se passer des services d’infographistes et/ou de programmeurs professionnels lorsque l’information à restituer n’est pas trop complexe. D’aucuns sont payants, mais de nombreuses plates-formes libres et gratuites donnent une certaine autonomie aujourd’hui aux « journalistes hackers » :

  • Google, par exemple, propose des fonctionnalités de visualisation de plus en plus avancées au coeur de sa suite bureautique Google Drive, simulacre en ligne de Microsoft Excel pour la gestion partagée de bases de données. Il existe également un mode encore plus avancé appelé Google Chart Tools autorisant la configuration personnalisée de graphiques et de cartes complexes qui nécessitent très peu de connaissances en programmation.
  • Infogram permet la création en mode « wysiwyg » (vous voyez ce que vous obtenez, donc véritablement accessible au débutant) d’infographies et de graphiques reposant sur tous types de bases de données.
  • Many Eyes, plate-forme développée par IBM, autorise la création d’une grande variété de graphiques avec très peu de connaissances techniques.
  • Datawrapper, conçu par une association de journalistes allemands, est « un outil libre aidant n’importe qui à créer en quelques minutes des graphiques simples, élégants et facilement intégrables ».

Cette liste d’outils globalement simples à utiliser n’est pas exhaustive. À une autre échelle – et avec l’aide d’un peu plus de connaissance en programmation – une grande quantité de librairies JavaScript, comme D3.js ou raphael.js, aide les rédactions à matérialiser des bases de données sous la forme de cartographies ou de graphiques au rendu encore plus léché.

***

Documentaliste Sciences de l'Information, décembre 2012
 

Cet article a été publié dans la revue Documentaliste, Sciences de l’information (n°4, décembre 2012) édité par l’ADBS, et il est reproduit ici avec l’aimable autorisation de sa rédactrice en chef.

7 réflexions au sujet de « Le journalisme de données »

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s