Données fleuries #5

En vedette

Je n’aurais sans doute pas parlé de cette magnifique animation publiée sur YouTube en novembre dernier – et qui a déjà atteint plus de 3,5 millions de vues – si « Mashable » n’en avait pas fait récemment un article qui a beaucoup tourné.

Wealth Inequity in America veut mettre en valeur la distribution des richesses aux Etats-Unis sous un angle particulièrement efficace : celui de nos préjugés (tiens, ça me rappelle un article sur Google Suggest qu’on avait écrit à 4 mains avec Julien Goetz sur « Owni ») et de notre perception des inégalités. En les comparant, évidemment, avec les vrais chiffres. Et comme il existe une marge très importante entre ce que les Américains pensent des inégalités dans leur pays – entre ce qu’ils croient, ce qu’ils souhaitent, et ce qui se passe vraiment – le choix du « motion design » pour illustrer ces fluctuations de données est idéal. Et, en l’occurrence, très bien réalisé.

Pour suivre à la trace les sources qui ont permis de scénariser cette animation, on pourra également consulter It’s the Inequality, Stupid sur « MotherJones », Building a Better America [pdf] publié par deux chercheurs en psychologie, ou encore How Unequal We Are: The Top 5 Facts You Should Know About The Wealthiest One Percent Of Americans.

L’effet WOW

Puisque le ministère de la Santé allemand – via l’institut Robert Koch – a la bonne idée de produire de la data à gogo, et notamment à propos du cancer, les camarades de « Visual Telling » (dont j’ai causé la semaine dernière) ont développé une petite application simple et bien faite nommée Visualizing Cancer Data through Flows.

Flow of Cancer Statistics (détail).
Flow of Cancer Statistics (détail).

Comme l’indique le billet de blog consacré à cette visualisation, la collecte de ces données des registres du cancer est important pour l’évaluation des mesures de santé publique ciblant notamment la prévention de la maladie. Une petite pierre à l’édification de ressources « open gov » dans le domaine de la santé. Grâce aux occurrences contenues dans ces données officielles (âge, genre, partie du corps touchée, implication), il est possible, par exemple, de constater très rapidement, grâce à la visualisation, que le (terrible) cancer du pancréas a assez nettement augmenté en Allemagne depuis 20 ans (+18%), et principalement chez les hommes (+25%). Rendre aisée la lecture de données complexes : le boulot est fait.

***

Restons dans le big data grâce à cette autre vidéo particulièrement intéressante (via), qui est l’allocution de Ranat Taneja, directeur technique d’Electronic Arts, au cours de la récente Strata Conf organisée par O’Reilly. Je vous glisse également les diapositives de sa présentation aperçue rapidement durant la vidéo.

Le jeu vidéo me semble suffisamment grand public pour offrir une porte d’entrée pertinente à la compréhension de la révolution technologique et sans doute sociétale (je suis un peu branché « Open Data » et « Open Gov », vous aurez noté) qui s’amorce avec le « big data ». Il est vrai que 2 milliards de joueurs à travers le monde, qui génèrent 50 térabytes de données par jour, ça fait du volume. Et l’appréhension d’un tel volume de données « oblige » l’industrie du jeu vidéo à prendre des trajectoires stratégiques qui dépassent clairement le simple cadre du divertissement.

Pour offrir de nouvelles et « amazing » expériences utilisateur basées, notamment, sur l’analyse comportementale en temps réel et pour élaborer des fonctionnalités de jeu fondées sur l’anticipation artificielle (le prédictif dirait Philip K. Dick), Electronic Arts – qui voit quand même passer l’équivalent de 50 milliards de minutes, soit 100 000 années de gameplay par mois par ses serveurs – a donc été obligé de casser l’architecture « classique » en silo. On ne joue plus sur mobile, ou sur PC, ou sur les réseaux sociaux… Le « joueur global » est invité à muter, EA souhaitant transformer le concept d’identifiant en celui, un peu plus flippant à y réfléchir, d’identité unique. Note pour plus tard : « IRL » (in real life) risque de ne plus signifier grand chose dans un avenir très proche.

La minute bidouille

Stately est un gadget mignon dans la lignée de la fameuse police de caractère Chartwell. L’objet de cette fonte est de permettre la création de cartes des Etats-Unis (ces cartes comme on les aime chez les [data]journalistes, pour signifier des répartitions par régions, par exemple) sans avoir besoin… de talent particulier en cartographie.

Presidential States by Stately
Presidential States by Stately

Ici, tout passe par HTML et CSS. Il suffit d’appeler la fonte via une feuille de style, puis de générer chaque Etat grâce à caractère collé derrière une simple puce <li> à laquelle on ajoutera simplement un argument pour mettre la couleur de son choix. L’idée est relativement choupinette, et elle offre un avantage important par rapport à n’importe quelle carte produite sous forme d’image : vu qu’il s’agit d’une police, le redimensionnement de votre carte est propre et rapide puisque vous n’aurez qu’à changer la taille du caractère dans la feuille de style.

Veilleries

Quelques jolis objets sont passés dans le radar récemment et méritent sans doute de figurer ici – même s’ils commencent un peu à dater :

  • Les aliments les plus surconsommés par département est une carte réalisée par le « Journal du Net » avec des données Nielsen et présente en résumé les habitudes alimentaires des Français selon le département où ils consomment (a priori celui où ils habitent). Si vous aimez les stats et si vous êtes un peu pervers, vous chercherez évidemment quels sont les départements où la consommation d’alcool est la plus forte et vous en tirerez des conclusions divertissantes et sans doute erronées. Et vous n’en voudrez pas au « JdN » d’avoir filé l’indépendance à la Corse.
  • A Handsome Atlas (via, via), c’est la preuve (s’il en fallait encore une) que la représentation du monde par la donnée n’est évidemment pas une invention récente mais la résurgence d’une pratique qui date – au moins – du 19e siècle. Cet atlas, compilé grâce au gros boulot de Jonathan Soma, permet de consulter confortablement un grand nombre d’archives centenaires. Jusque là, ces trésors étaient accessibles uniquement sur le site de la bibliothèque du Congrès, trop rigide au goût de Jonathan, qui a tout simplement « hacké » le système en téléchargeant tous ces documents et en les mettant derrière une interface de consultation sexy faite à la maison.
  • Qui cumule ? (via) est un très joli outil politique donnant la possibilité de montrer du doigt, par département, les parlementaires qui pratiquent le cumul de mandats électifs – soit pour des questions d’influence, soit pour perçevoir plusieurs indemnités – et, chose originale, de les interpeller directement sur Twitter. Développée par le fringuant Centralien Maxime Alay-Eddin, cette plate-forme est l’exemple assez typique des initiatives populaires qui peuvent être prises par (à peu près) n’importe qui avec juste quelques données éparses et un peu de code pour rafraîchir la pratique de la démocratie.

***

Cet article a été publié sur le site News Resources en mars 2013.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s