Archives pour la catégorie Veille

Données fleuries #14

En vedette

Quand l’esprit des hackathons infuse jusqu’à l’université et en particulier à l’Institut de journalisme Bordeaux Aquitaine, cela donne le Data Journalisme Lab. La cuvée 2013 (36 étudiants de première année de master de l’IJBA dûment sensibilisés au ddj) est particulièrement riche en perspectives pour les rédactions, qui peuvent parier sur l’arrivée prochaine d’un joyeux contingent de jeunes pousses formées à la représentation de la donnée.

Data Journalisme Lab 2013
Data Journalisme Lab 2013

Parmi les différents projets menés entre le 15 et le 26 avril selon des règles du jeu très précises, j’apprécie en particulier 3 réalisations qui me semblent sortir un peu du lot, par l’intérêt du sujet, l’angle choisi, le mode de visualisation appliqué et l’homogénéité de l’ensemble. Je note (avec un sourire mais aussi avec joie) qu’un des projets a été mené par 3 garçons, et que les deux autres ont, pour leur part, été montés par deux trios féminins. Bravo à tous les participants.

  • Saisonniers : les précaires de la vigne est une enquête orientée « data » sur la paupérisation des travailleurs des vignes dans le bordelais.
  • Girondins : votre député se tourne-t-il les pouces à l’Assemblée ? est une étude – à la mode « Regards Citoyens » – relatant de l’assiduité des élus du département « 33 » à l’Assemblée nationale.
  • Logements sociaux dans la CUB : 9 villes hors-la-loi est un dossier complet en forme d’état des lieux de l’application de la loi SRU au sein de la Communauté Urbaine de Bordeaux.
  • La minute open data

    La boussole de la transparence est une excellente initiative du gouvernement italien permettant aux citoyens de participer activement à l’amélioration des services en ligne de l’administration publique (« PA » dans le texte) et par conséquent à mettre un pied ascendant dans l’open data et l’open gov.

    Cartographie de la transparence de l'administration italienne (détail).
    Cartographie de la transparence de l’administration italienne (détail).

    L’exhaustivité du projet est tout simplement bluffante, notamment sur la possibilité de juger de la qualité informative des sites de l’administration et de comparer entre eux les sites des hôpitaux, des écoles, des ministères, des municipalités, … (la liste est longue). Des tableaux de bords et des cartes interactives sont également disponibles et configurables, pour illustrer de nombreux facteurs comme la transparence, la protection des données, ou le taux d’absentéisme dans l’administration. Hâte de voir arriver une telle plate-forme en France.

    La minute Raphael

    Hollande : le bilan des promesses, un an après est le fruit d’une collaboration entre « Le Monde » et Lui Président afin de visualiser joliment les promesses du candidat Hollande – et l’application (ou pas) de ces promesses à ce jour.

    Les promesses tenues, en partie tenues, brisées et en cours (détail).
    Les promesses tenues, en partie tenues, brisées et en cours (détail).

    L’exercice de « fact checking » est bien amené, le difficile boulot de synthèse bien réalisé. Ma seule réserve tiendra à l’ergonomie de l’objet produit, qui méritait sans doute mieux qu’une verticalité pénible pour la lecture traditionnelle d’un article sur ce site. Reste que ce nouveau projet permet au « quotidien de référence » de conforter sa position, y compris en matière de datajournalisme.

    La minute app

    CounterSpill (via), sous-titré « 100 ans de désastres liés aux énergies non-renouvelables », est un projet visant à fournir un contrepoids aux stratégies de communication des grandes entreprises de l’énergie (pétrole, gaz, nucléaire charbon) qui minimisent la portée des catastrophes dont ils sont responsables.

    Chiffres autour de la catastrophe de l'Amoco Cadiz (détail).
    Chiffres autour de la catastrophe de l’Amoco Cadiz (détail).

    Au travers d’une carte au design très léché, chaque catastrophe possède sa fiche complète : une frise chronologique, un récit encyclopédique, et une série de faits chiffrés (c’est la partie « data » du bidule) en relation directe avec l’événement – comme le coût total du désastre, l’énergie équivalente perdue, et ce genre de choses. Indéniablement la section la plus aboutie du site.

    ***

    PriceHub (via), pour sa part, n’est pas non plus d’une grande fraîcheur mais il est intéressant par le modèle qu’il propose, puisqu’il offre la possibilité à chacun d’alimenter une vaste base de données participative pour déterminer le prix le plus juste de la voiture d’occasion.

    PriceHub (détail).
    PriceHub (détail).

    Dans la pratique, le projet est dédié au marché étatsunien et la base de données n’est pas si vaste que ça. La transparence naturelle induite par sa conception originale est toutefois potentiellement complétée par l’élargissement prévisible de son catalogue, faisant de l’ensemble – pour des bagnoles ou pour toute autre chose – un modèle à reproduire pour une meilleure information aux consommateurs que nous sommes.

    La minute sociale

    Mine de rien, un sacré paquet de chercheurs sont cachés derrière cet Hédonomètre qui veut mesurer notre bien-être en temps réel, un « instrument parfait de psychophysique enregistrant continuellement le niveau de plaisir vécu par chaque individu » – tel que le rêvait la science depuis la fin du 19e siècle.

    Hedonometer focalisé sur 2012 (détail).
    Hedonometer focalisé sur 2012 (détail).

    La bête fonctionne avec environ 10% du trafic de Twitter, soit environ 100 Go de JSON tous les jours. Ensuite, c’est une vaste soupe de termes anglais mixés à travers un analyseur sémantique connecté aux travaux de recherche du Computational Story Lab. Il en ressort une sorte de graphique financier de la joie collective. Enfin, de la joie des utilisateurs de Twitter et plus largement des internautes, on ne parle pas ici de la joie de ceux qui ne sont pas connectés aux Internets. Le projet veut s’attaquer rapidement aux autres langues que l’anglais, et planifie de se brancher sur Google Trends, bit.ly et la BBC dans les prochains mois.

    La minute carto

    L’état de la chaussée à Los Angeles (via) est une carte exhaustive développée par le « Los Angeles Times » pour illustrer un article sur la question.

    L'état de la chaussée dans le Silver Lake et alentour (détail).
    L’état de la chaussée dans le Silver Lake et alentour (détail).

    Mesurer la qualité des routes et des biens communs est une ambition aussi vieille que le projet FixMyStreet. Ici, point de données crowdsourcées, mais la compilation de rapports établis par la voirie à intervalles réguliers (la carte reflète l’état de l’art en avril). La visualisation offre un panorama précis et cliquable sur l’ensemble des rues, et permet aussi d’avoir une vue plus générale par quartier et par district.

    ***

    Exploration du métro : géographie contre topologie (via) est un projet qui soulève la question intéressante de la mise en scène du tracé du métro (quel qu’il soit). L’auteur (on lira également son billet de blog) y postule que le plan du métro n’a pas nécessité à représenter la réalité.

    Geographic vs Topological (détail).
    Geographic vs Topological (détail).

    Les amateurs du genre apprécieront sans doute cette réflexion (qui en rejoint d’autres) autour de la représentation de la donnée, à la recherche de la synthèse « lisibilité » + « pertinence » + « puissance ». Le datagraal en somme.

    Cet article a été publié sur le site News Resources en mai 2013.

    Données fleuries #13

    En vedette

    Disons-le sincèrement : parmi les 72 nominés, ce ne seront peut-être pas les meilleurs projets qui remporteront le « Prix du Public » des Data Journalism Awards organisés par le Global Editors Network, mais sans doute ceux qui ont le meilleur réseau. En revanche, on fera confiance au jury pour déterminer lesquels (huit en tout, plus de 300 postulants au départ) se partageront les 15 000 euros de prix. Parmi ces spécialistes du datajournalisme, des personnalités comme Paul Steiger (« ProPublica »), Wolfgang Blau (« The Guardian », ex « Die Zeit »), Frédéric Filloux (« Les Echos »), Aron Pilhofer (« New York Times ») ou Simon Rogers (Twitter, ex « Guardian »). Sans attendre leur jugement avisé – et en toute modestie – j’avoue avoir quelque préférence pour une poignée de ces valeureux projets.

  • Datajournalisme d’investigation (média modeste)
  • Bien aimé les écoles d’Irlande du Nord et les tireurs de ficelle de Washington DC et du Massachusetts mais une préférence nette pour #Checkyourhospital inventé par le « Wired » italien : un excellent travail de traitement des données publiques (ministère de la Santé) permettant d’aller en profondeur dans les statistiques de chaque établissement hospitalier de l’autre côté des Alpes.

    Check Your Hospital (détail).
    Check Your Hospital (détail).
  • Data narration (média modeste)
  • Du très lourd en face du fameux Marché de l’art de Jean Abbiateci (en vedette récemment dans cette veille). Une légère préférence pour l’excellent Lower Saxony State Election, une initiative individuelle de haute volée (et de très bon goût) propulsée par Gregor Aisch, permettant de visualiser les potentielles coalitions politiques dans une région d’Allemagne ; travail suivi de près par le E-Data Book – et je ne parle pas des autres projets, très bons aussi.

    Lower Saxony State Election (détail).
    Lower Saxony State Election (détail).
  • Applications data
  • Dans la catégorie « app », on souhaite également bonne chance aux talentueux Français de WeDoData avec Le Pariteur (pour « France Télévisions ») mais la lutte sera très rude avec America Under The Gun de « Mother Jones », et surtout Election Trends, un monstre d’efficacité pondue par l’Associated Press pour visualiser en détail(s) les résultats segmentés de la dernière présidentielle américaine.

    Election Trends (détail).
    Election Trends (détail).
  • Site (ou sous-site) de datajournalisme
  • Un petit faible pour le portail kenyan Data Dredger et le site InfoAmazonia pour leur portée et leur action sur le long terme. Toutefois, c’est le site-app Connected China développé par Reuters qui force l’admiration pour sa richesse, son sens de la pédagogie, son ergonomie.

    Connected China (détail).
    Connected China (détail).
  • Datajournalisme d’investigation (gros média)
  • Difficile de ne pas être impressionné par Cracking the Code, une enquête étatsunienne de quasiment deux ans pour rendre visibles les arrangements coupables de certains médecins avec Medicare, ou encore par Skin and Bone, vaste dossier millimétré sur le recyclage des corps humains après la mort. Cela dit ma préférence va au projet Argentina’s Senate Expenses qui décrit le travail colossal des (data)journalistes de « La Nacion » pour traiter quasiment 10 ans de documents parfaitement destructurés (papier, PDF dans le meilleur des cas) et éplucher méticuleusement les dépenses des actuels et anciens présidents du Sénat – conduisant jusqu’à une enquête judiciaire ouverte à l’encontre du Vice-Président argentin en exercice. Respect.

  • Data narration (gros média)
  • Une fois évoquée la petite mention sentimentale pour les Milliardaires de « Bloomberg » dont j’ai causé précédemment ; après avoir admiré cet Europa-Atlas très impressionnant parce qu’il cartographie (et met en valeur de manière très convaincante) les données-clés d’Eurostat ; après avoir écarquillé les mirettes sur Exit Polls 2012 qui analyse graphiquement les mouvements des électeurs américains entre 2008 et 2012 par segments de population ; mes applaudissements vont nonobstant à Gay rights in the US imaginé par « The Guardian », qui – en une visualisation d’une sobriété et d’une clarté exemplaire – parvient à fournir le statut précis de chaque Etat outre-Atlantique concernant l’ensemble des questions de société autour des droits des gays. Tout simplement brillant.

    Gay rights in the US (détail).
    Gay rights in the US (détail).

    Bonne chance à tous les candidats !

    La minute vue du ciel

    Global Religious Futures (via) est un projet de recherche du Pew Forum qui veut offrir une vue d’ensemble de l’état des religions dans le monde.

    Global Religious Futures Project (détail).
    Global Religious Futures Project (détail).

    Au travers d’une méthodologie très détaillée (recoupement d’enquêtes multiples, sondages, statistiques officielles…), l’explorateur de données permet d’accéder à des visualisations par ailleurs difficilement accessibles. Et pour cause : ces informations délicates, qui peuvent prêter le flanc à des analyses tendancieuses, sont complexes à récolter et plus encore à analyser. Reste que la plate-forme est plutôt réussie.

    ***

    Le dernier bébé de David McCandless ne passe pas inaperçu : Ultimate guide to exploring space (via) est une infographie délivrée pour « BBC Future » (on se souvient de la précédente, moins réussie).

    Where We Have Been In Space (détail).
    Where We Have Been In Space (détail).

    Véritable guide du voyage galactique que n’aurait pas renié Douglas Adams, cette peinture géante essaie de répondre à la question « Qui est allé où dans le système solaire ? » en synthétisant une énorme base de données dans les limites d’une unique illustration verticale.

    La minute mobile

    African Bus Routes Redrawn Using Cell-Phone Data est une expérimentation montée par IBM et Orange en Côte d’Ivoire afin d’analyser les données anonymisées de 5 millions d’utilisateurs de téléphones mobiles et d’optimiser le réseau de transports en commun.

    Vu le taux de pénétration de cette technologie, et à condition de se prémunir contre les éventuels débordements sur la vie privée des utilisateurs, il semble acquis que la big data mobile a de beaux jours devant elle. J’avais d’ailleurs enquêté à l’automne dernier sur un cas similaire au Kenya de recherche contre le paludisme. Ce n’est pas la première expérience d’IBM dans ce domaine : Istambul fait déjà l’objet du même type d’analyse de données.

    Veilleries

    Un truc plutôt gentil passé dans le radar récemment et qui mérite sans doute de figurer ici – même s’il commence un (tout petit) peu à dater :

    • Le très célèbre moteur de recherche sémantique Wolfram|Alpha s’amuse avec vos données personnelles de Facebook (via) et pond le tableau de bord rêvé de chaque datasexuel en puissance. Beaucoup plus sympa que se faire klouter à chaque coin de rue, se faire wolframer est aussi bien plus chic.

    Cet article a été publié sur le site News Resources en mai 2013.

    Données fleuries #12

    En vedette

    Je vous ai déjà parlé de Stéphane Gigandet et sa passion pour l’open data et l’alimentation. Combien de sucres ? est son nouveau projet, sorte de serious game pas forcément très serious sur la forme mais très serious sur le fond puisqu’il s’agit de nous sensibiliser sur notre consommation involontaire de sucre au quotidien.

    Combien de sucres (détail).
    Combien de sucres (détail).

    Derrière ce jeu bon enfant, fort instructif – et pas uniquement pour nos amis diabétiques – Stéphane enregistre les données anonymes des participants et se constitue ainsi une base de données qui permettra sans doute à la recherche, dans l’avenir, d’évaluer « les différences entre perception et réalité » du public par rapport aux aliments qu’il consomme. Les données qui permettent de faire fonctionner ce jeu viennent pour leur part de la base collaborative du site Open Food Facts, qui, ô joie, commence à faire gentiment parler de lui.

    La minute bidouille

    Julien Kostrèche m’a interpellé cette semaine sur les projets de datajournalisme du HybLab 2013. Synthèse des projets montés en janvier et février dernier dans ce laboratoire des médias de la région nantaise, qui déchiffre les nouvelles formes de journalisme grâce à la collaboration et la rencontre de l’information, du design et du développement informatique.

    Hyblab - projet "Ile de Nantes" (détail).
    Hyblab – projet « Ile de Nantes » (détail).

    On y (re)trouve des idées de représentation de la donnée plutôt originales, même si globalement les projets ressemblent davantage à des productions artistiques que journalistiques, où la clarté peut parfois perdre un peu pied face aux efforts de rendu. Ceci dit, c’est une initiative particulièrement singulière et positive, qui permet de tailler un peu à la machette des territoires abritant des nouveaux modes de narration où réside, sans aucun doute, une partie de l’avenir de la presse.

    La minute carto

    The Sentinel Project est une initiative canadienne ayant pour mission de surveiller les populations qui, dans le monde, encourent le risque d’un génocide. Parmi ces populations, les pratiquants du baha’isme possèdent ainsi depuis 2008 un espace de prévention très orienté « data » : Iran Sentinel Project Visualization permet de suivre à la trace les arrestations, emprisonnements, inquiétudes sanitaires, procès ou sorties de prison (liste non exhaustive) des individus qui composent ces communautés.

    Iran Sentinel Project Visualization (détail).
    Iran Sentinel Project Visualization (détail).

    Pour les aspects techniques, on se reportera au billet de blog de Jérôme Gagnon-Voyer, qui explique son choix de travailler avec D3 et Leaflet pour le rendu de cette cartographie particulièrement réussie.

    ***

    Chaque semaine ou presque, un projet élaboré avec raphael.js voit le jour. World Map of Migration 2010 (via) est une carte interactive sobre et efficace qui visualise les flux de populations émigrant et immigrant autour de la planète.

    World Map of Migration 2010 (détail).
    World Map of Migration 2010 (détail).

    Rassemblées par Peter Cook, les données proviennent de la Banque mondiale. Comme le rappelle l’auteur, ces données ont déjà été utilisées pour un projet antérieur, PeopleMovin, mais cette nouvelle cartographie des flux migratoires ajoute sans aucun doute de la lisibilité à ce thème.

    ***

    Fin du plan hivernal : malgré la création de places d’hébergement, toujours des remises à la rue est un excellent article publié par la « Gazette des communes », qui fait un état des lieux de la situation française en matière de pauvreté et de mal-logement.

    Cartographie de la fin du plan hivernal (détail).
    Cartographie de la fin du plan hivernal (détail).

    Rédigé à quatre mains par Agnès Thouvenot et Virginie Fauvel il est enrichi de deux cartes (1, 2) très utiles façonnées avec amour avec Google Fusion Tables. Un bien joli exemple de journalisme « augmenté » avec quelques bouts de ficelle (quasiment) à la portée de tous.

    La minute dataviz

    Nous savons depuis ce mois que deux planètes « habitables » ont été découvertes à « seulement » 1 200 années-lumière de la Terre. A cette occasion, le « New York Times » a dévoilé Kepler’s Tally of Planets, une magnifique visualisation toute en sobriété et en mouvements à partir des données de la NASA.

    Kepler’s Tally of Planets (détail).
    Kepler’s Tally of Planets (détail).

    L’exercice veut simplifier l’approche des connaissances très théoriques que le grand public peut avoir de ces nombreuses (plus de cent) planètes gravitant autour de soleils lointains. Sur un fond noir de rigueur, les planètes et leur soleil sont représentés avec des couleurs, des tailles et des vitesses de déplacement tâchant de simuler au mieux la réalité – même si de petites entorses scénaristiques sont admises pour simplifier le propos. Quand un article ou une vue d’artiste sont disponibles, ces informations complémentaires permettent par ailleurs d’enrichir son savoir sur le sujet. Du bon « Times » comme on l’aime.

    ***

    Global Rich List est une petite application interactive produite par Believe In qui permet de se situer dans un classement (virtuel et mondial) de la richesse. Et, comme souvent avec ce type d’outil, de nous faire prendre conscience du confort relatif de notre existence grâce à la puissance évocatrice d’une visualisation de données épurée.

    Global Rich List (détail).
    Global Rich List (détail).

    En simulant l’opération avec le revenu médian en 2010 – soit un peu plus de 1 600 euros nets mensuels, on prend immédiatement la mesure de la situation : faire partie des 3% les plus riches de la planète, gagner 10 euros par heure – soit 20 fois plus qu’un laboureur zimbabwéen – ou encore gagner en une année ce qu’un laboureur ghanéen gagnera en 134 ans. Un ensemble de petites comparaisons « data » ayant pour objet de déclencher un don pour la fondation Care International.

    Veilleries

    Un truc plutôt gentil passé dans le radar récemment et qui mérite sans doute de figurer ici – même s’il commence un (tout petit) peu à dater :

    • World Bank Global Development Sprint est un très joli travail de cartographie collaborative réalisée à partir des données de la Banque mondiale et qui veut présenter les flux de coopérations entre pays membres sur des thématiques comme l’agriculture, les transports ou l’énergie (nombreux autres domaines couverts). La carte, réalisée en d3.js, est très esthétique et mérite le coup d’oeil.

    Cet article a été publié sur le site News Resources en avril 2013.

    Données fleuries #11

    En vedette

    Sans conteste, Inequality and New York’s Subway est le projet intelligent par excellence : réaliser un « mashup » entre le revenu médian des ménages et les stations du métro new-yorkais.

    Inequality and New York’s Subway (détail).
    Inequality and New York’s Subway (détail).

    C’est encore une fois l’ouverture des données des transports publics qui a inspiré ce joli travail publié par Larry Buchanan pour l’élégantissime « New Yorker ». Au départ, un constat du magazine : « New York a un problème avec l’inégalité de revenus. Et cela s’empire – les mieux payés gagnant toujours davantage et les moins payés gagnant toujours moins. Le long des lignes de métro, les salaires varient de la pauvreté à une richesse considérable ».

    En croisant les données du recensement américain avec la géolocalisation de chaque station de métro, le projet dresse donc une cartographie enrichie de l’état de la mégapole. Et a même donné des idées à des admirateurs, comme Noah Veltman, qui a repris les données de la visualisation pour réaliser la sienne de manière un peu différente – mais tout aussi intéressante.

    La minute Raphael

    Raphael.js est une librairie JavaScript qui permet de personnaliser des graphiques vectoriels. Elle est de plus en plus utilisée, cette semaine encore joliment.

    L’espace par habitant en France par exemple, de l’artisan Pierre Breteau, qui a eu l’idée de représenter l’espace dont « les habitants ont virtuellement accès en fonction de leur lieu de résidence » – grâce, ici aux données de l’Insee.

    L’espace par habitant en France (détail).
    L’espace par habitant en France (détail).

    L’exercice est réalisé sur 10 villes savamment choisies à chaque bout du spectre pour rendre la visualisation particulièrement pertinente, et offre ainsi une perspective qu’il serait complexe de représenter autrement : les Levalloisiens « bénéficient » de 38 m2 par habitant tandis que les Pétromiquelonais (qui sont 10 fois moins nombreux il est vrai) jouissent de 40 km2.

    ***

    Andrew Bergmann, avec sa visualisation Personal Space, raconte la même histoire en pieds carrés sur « CNN Money ».

    Personal Space (détail).
    Personal Space (détail).

    Là, ce sont 20 cités à travers le monde qui ont été sélectionnées. Bonne nouvelle, les données sur Paris se recoupent (520 pieds carrés faisant bien 48 m2. Un score bien meilleur que celui de Manille – où l’on vit très serré – mais très inférieur à d’autres capitales européennes – comme Londres ou Berlin – sans parler de Lima, au Pérou, et ses 350 m2 par tête de pipe.

    La minute gazouille

    TweetMap (via) est un projet que Peter Smart et Rob Hawkes ont développé pour le plaisir de découvrir les limites de la visualisation en temps réel. Et en guise de défi ils ont choisi Twitter.

    TweetMap (détail).
    TweetMap (détail).

    Cartogramme en temps réel (tel qu’annoncé, en tout cas) du monde qui tweete, les pays se forment et se déforment selon le volume de micro-messages qui en sont issus. Pour être parfaitement honnête, vu la taille de la Belgique et de la Suisse par rapport à la France, il me semble que le coefficient correcteur est un peu fort (et je ne mentionne pas ici la taille du Groenland). Et le truc est également un peu statique, ce qui tue passablement l’effet attendu avec le « temps réel ». Bref, c’est du big data en beta.

    ***

    Autre projet prometteur autour de Twitter, lui aussi (semble-t-il) en beta, Where Does My Tweet Go? (WDMTG) veut « mesurer la propagation des tweets à travers le monde ». Et si possible avec de jolies couleurs.

    Where Does My Tweet Go? "Rocco Siffredi président d'Italie ?" (détail).
    Where Does My Tweet Go? « Rocco Siffredi président d’Italie ? » (détail).

    Issue des cerveaux fertiles de l’équipe française de MFG Labs (galaxie « Dataveyes » ou « Cinemur », pour situer), cette plate-forme est potentiellement puissante pour la mesure de l’influence des marques sur Twitter – c’est à mon avis la première cible commerciale de WDMTG – mais aussi, sans doute, des médias, des politiques ou des artistes. Encore faut-il que ça fonctionne ; j’attends encore une réponse de Benoît Vidal au sujet du Twitter Connect et donc du « my » dans « where does my tweet go ». Un projet à suivre quoi qu’il en soit.

    La minute carto

    J’ai découvert Radical Cartography de Bill Rankin il y a juste un an. Son dernier bébé, le sentimental French Kisses, est une nouvelle visualisation de ce fan d’ArcGIS et cartographe pointilliste.

    French Kiss (détail).
    French Kiss (détail).

    Au départ, Bill a juste puisé dans la base de données de Combien de bises ? (« se fait-on dans le département pour se dire bonjour »), un site qui a bien buzzé eu son heure de gloire en 2007, et qui avait comptabilisé près de 75 000 votes pour recueillir cette information essentielle. Très utile en tout cas pour ne pas commettre un impair d’étiquette en rendant visite à la cousine Joséphine.

    La minute utile

    596 Acres est un magnifique projet mêlant « open gov », « crowdsourcing » et « solidarité ». Le principe est de dresser une carte des terrains municipaux (et/ou des terrains privés dont les propriétaires ont proclamé vouloir en faire bénéficier le public), notamment sur les territoires défavorisés, afin de permettre à la population de s’organiser pour se réapproprier ces parcelles oubliées derrière des grillages ou des palissades.

    596 Acres (détail).
    596 Acres (détail).

    Outre la carte, il s’agit d’une communauté de bénévoles qui fournissent du soutien éducatif et juridique autour et grâce à la plate-forme. Le projet concerne à ce jour la ville de New York, mais le code du projet est disponible sur le Github de Eric Brelsford et le site offre ses services pour étendre cette initiative à d’autres villes.

    ***

    Haïti 2010 > 2013 est un excellent site produit par « ARTE » pour accompagner le documentaire Assistance mortelle, diffusé le 16 avril. Il souhaite illustrer le fossé qui s’est creusé entre les promesses de dons de la communauté internationale au lendemain du terrible séisme à Haïti en 2010 et la réalité de cette générosité.

    Assistance mortelle, Haïti 2010 - 2013 (détail).
    Assistance mortelle, Haïti 2010 – 2013 (détail).

    Les données utilisées pour cette webapp bien ficelée sont celles de Lessons from Haïti, un organisme créé par les Nations Unies pour « apporter toute la lumière sur la situation en Haïti ». Les chiffres éloquents dénoncent l’insuffisance de l’action internationale à coup de dataviz colorées. C’est plutôt sobre et très efficace.

    Veilleries

    Trois trucs plutôt gentils passés dans le radar récemment et qui méritent sans doute de figurer ici – même s’ils commencent un (tout petit) peu à dater :

    • Comme son titre l’indique, Tableau Public 8 Launches annonce la nouvelle version de la plate-forme Tableau, qui commence à faire un sacré bout de chemin dans le monde de la data – comme ces tremblements de terre au Japon depuis 1900 (« New Scientist ») ou ce comparatif des forfaits iPad à travers le monde (« Wired »).
    • Quadrigram, pour sa part, est une (assez) (nouvelle) plate-forme de création et de partage de visualisation de données qui semble très prometteuse. En attendant de voir la bête en action avec des exemples précis.
    • Il y a longtemps que je n’étais pas allé traîner sur Les Echos Data. A ne pas rater, une très jolie webapp qui fournit 60 indicateurs économiques dynamiques dans plus de 200 pays dans le monde, accompagnée d’une petite fiche data d’un « pays du jour » propulsé par la société Articque.

    Cet article a été publié sur le site News Resources en avril 2013.

    Données fleuries #10

    En vedette

    Le marché de l’art pour les nuls est un brillant dossier de datajournalisme concocté par la fine équipe d’AskMedia (Marie Coussin, Marie Conquy et Bénédicte Lutaud) et l’inénarrable Jean Abbiateci. Données solides à l’appui, le dossier présente une vue d’ensemble du marché de l’art aujourd’hui en mélangeant visualisations, tableaux et analyse.

    Le marché de l'art pour les nuls (détail).
    Le marché de l’art pour les nuls (détail).

    Découpé en quatre courts chapitres (« L’art, un hobby pour milliardaires », « Picasso, la superstar de l’art ! », « Pas de place pour les femmes ! » et « Le Grand Bond en avant de la Chine »), ce travail d’équipe est pédagogique, offre l’essentiel des données de base et s’illustre (notamment) par une application interactive bien conçue présentant « le Top 50 des artistes les plus bankables » ainsi que par une datavisualisation à bulles passant 320 oeuvres d’art à la loupe. Cette dataviz est une mise-à-jour d’un travail effectué par Jean Abbiateci l’an dernier. Ce dossier « Le marché de l’art pour les nuls » (qui existe aussi en anglais) a été présenté aux Datajournalism Awards. On lui souhaite évidemment le meilleur.

    Ah. Et à mon humble avis, si les femmes sont si mal représentées dans le Panthéon des peintres (ce qui ne manque pas d’offusquer le trio de rédactrices), c’est sans doute parce que ces dames sont très (très) souvent magnifiées sur la toile. Mais c’est juste un avis.

    La minute bidouille

    Créez vos propres KML avec Google Maps est un petit tutoriel immanquable du compère Raphaël da Silva. En France, quand on veut créer une carte un peu découpée, avec des territoires identifiables, on est un peu obligé de s’astreindre à une nomenclature encore fermée (par l’IGN et par l’Insee pour ne pas les nommer). Le but ici est donc d’apprendre à effectuer ces découpages soi-même.

    Créez vos propres KML avec Google Maps (détail).
    Créez vos propres KML avec Google Maps (détail).

    Un didacticiel bien goupillé, pas révolutionnaire, mais qui filera un bon coup de main aux cartographes en herbe. Pour l’instant, Raphaël a fait le choix d’expliquer sa manipulation sur Google Maps parce que les résultats sont extrêmement satisfaisants, mais je ne doute pas qu’il finira par craquer et nous délivrer un jour un joli tutoriel pour bosser sur OpenStreetMap.

    La minute open data

    Bon, le site du Ministère de la Culture est plutôt moche original encore en version beta mais il serait injuste de passer sous silence le bel effort pour proposer une infographie décente visant à promouvoir « une stratégie numérique de diffusion et de réutilisation des données publiques numériques du secteur culturel » (ouf). Si l’infographie ne suffit pas, il vous reste le rapport de 65 pages à éplucher et, bien sûr, l’indispensable petit motion design tout lisse ci-dessous.

    Réutilisation de ressources Culture, infographie (détail).
    Réutilisation de ressources Culture, infographie (détail).

    La politique de valorisation de ces ressources est encore un peu confuse à ce jour si l’on en croit ce magnifique lorem ipsum de la ministre mais nul doute que la Culture sera bientôt à la portée de tous les datalovers – qui connaissent déjà les données du ministère sur data.gouv.fr.

    ***

    Du côté de la Suisse, un concours récompense les meilleures applications sur les transports publics. Les Helvètes sont forts à ce jeu, je me souviens de SwissTrain que Marie Coussin (oui oui, la même) avait repéré il y a très longtemps.

    Transit Quality + Equity (détail).
    Transit Quality + Equity (détail).

    La liste des vainqueurs permet de goûter à l’inventivité de nos cousins alpestres et offre naturellement des pistes alléchantes de tout ce qu’il est possible de faire dès lors que la transparence totale est faite dans les données de transports publics (suivez mon regard). A titre perso, je ne comprends rien à l’application qui a remporté le concours – d’un manque d’ergonomie stupéfiant tant sur Chrome que sur Firefox – mais quelques autres projets valent vraiment le détour.

    La minute viz

    L’efficacité de l’animation Sixty Seconds of Salary, pondue par Bård Edlund pour « CNN Money » (dont il a été directeur artistique), est remarquable. En 1 minute 50, elle raconte tout simplement combien gagnent en une minute des personnalités comme la star de NBA Kobe Bryant, Barack Obama ou le patron d’ExxonMobile.

    Sixty Seconds of Salary (détail).
    Sixty Seconds of Salary (détail).

    L’intérêt réside évidemment dans la comparaison avec des individus plus représentatifs de la population, comme un enseignant, un médecin, ou avec le salaire minimum et le salaire médian. Et sans surprise, 1 minute 50 suffit amplement à réfléchir sur ce sujet.

    ***

    Quand nous avons essayé avec Sylvain Lapoix de mettre en scène les données liées à la fonte de la banquise, nous étions évidemment à des éons du spectaculaire Speculative Sea Level Explorer (via) de Benedikt Groß, qui s’est amusé (avec d’autres moyens) à réinventer quelques cartes de géographie physique.

    Le but, plus sérieux qu’il n’y paraît, est de simuler plusieurs niveaux de montée des eaux qui pourrait survenir suite au déréglement climatique. Plusieurs villes sont modélisées, et un logiciel est même téléchargeable (versions OSX, Windows et Linux disponibles sur Github). Dans l’esprit, on est donc assez proche de l’excellent travail réalisé cet automne par le « New York Times », même si le projet de Benedikt est aujourd’hui plus « artistique » que journalistique.

    ***

    The World as 100 People (via) est une infographie assez classique mais bien pensée et assez joliment réalisé par le graphiste londonien Jack Hagley. Le principe est simple : comment se répartirait l’humanité si elle n’était composée que de 100 individus.

    The World as 100 People

    C’est bien l’angle qui est intéressant ici. Ce type d’infographie permet de se rendre compte avec efficacité de données abstraites comme l’accès à l’eau potable, au logement voire à un ordinateur. Les données de base sont hébergées sur le site 100people.org. Pour rigoler j’ai d’ailleurs généré une infographie en 5 minutes (montre en main) avec Infogram pour éprouver un peu le service qui évolue constamment : plutôt une bonne expérience – même s’il y a beaucoup à dire au niveau esthétique.

    Veilleries

    Deux trucs plutôt gentils passés dans le radar récemment et qui méritent sans doute de figurer ici – même s’ils commencent un (tout petit) peu à dater :

    • The Power of Visualization’s « Aha! » Moments est un entretien avec Amanda Cox, qui est la reine de la dataviz au « New York Times » depuis 8 ans. Elle y parle notamment des dangers et des forces évidentes de la visualisation de données, ainsi que des quelques notions basiques du métier – à commencer par le datajournalisme comme travail d’équipe. Toujours inspirant.
    • Global migrants: Which are the most wanted professions? (via) est une visualisation plutôt parlante (quoiqu’un peu rude à manipuler) qui explique quels métiers sont actuellement recherchés dans quels pays (immigration choisie et qualifiée). L’intérêt est de pouvoir analyser tant du point de vue du métier que du pays. Aurait sans doute mérité un format plus approprié à la lecture sur écran.

    Cet article a été publié sur le site News Resources en avril 2013.

    Données fleuries #9

    En vedette

    L’ouverture des données de la RATP est une source d’inspiration pour de nombreux datalovers ! J’ai déjà évoqué, ici et , les projets « Metro Meeting Point » et « Metropolitain », voici maintenant le prix de l’immobilier par métro concoctée avec ingéniosité par le site MeilleursAgents.com.

    Carte des prix du m² par station de métro (détail).
    Carte des prix du m² par station de métro (détail).

    Non seulement ce projet est pertinent, mais il est aussi très bien réalisé : la carte est claire, sobre et efficace, tandis que les graphiques utilisés pour afficher la valeur de chaque ligne de métro et de chaque station selon le marché immobilier sont d’une grande limpidité. L’intégration vers Facebook et Twitter est bien pensée. A mon sens, c’est du « zéro défaut » et prouve que la data n’est pas spécifiquement orientée « journalisme » ou réservée aux mastondontes du marketing : ce type de projet peut, de toute évidence, s’inscrire dans une politique de communication intelligente sur des plates-formes commerciales plus modestes sans dévoyer l’information. Et, finalement, il rend service au public.

    La minute datajournalisme

    J’avoue que j’avais hâte de savoir ce que le projet Feowl allait donner quand il a été lancé l’an dernier par la jeune (quoique expérimentée) équipe de J++. Un aboutissement évident aujourd’hui : The Cameroon electricity crisis offre un panorama impressionnant de la puissance d’une récolte de données participative (c’est pour éviter de dire crowdsourcing) lorsque l’open data fait défaut.

    The Cameroon electricity crisis (détail).
    The Cameroon electricity crisis (détail).

    Ce sont donc plus de 8 000 coupures d’électricité qui ont été dénombrées et géolocalisées en 9 mois par le projet (via Feowl… et via d’autres moyens, comme me l’a confié une source proche du dossier), cet exercice d’autonomisation – traduction horrible de Google pour empowerment – voulant mettre au jour l’état effroyable du réseau électrique au Cameroun. J’espère (comme un certain Kayser-Bril Nicolas, sans doute) que ce projet servira de base à une enquête plus poussée ; c’est à ça (aussi) que doit pouvoir servir le datajournalisme.

    ***

    Hollande fait pleuvoir, Chirac fait monter la température et Sarkozy provoque la canicule ! Ce n’est pas moi qui le dit, mais le camarade Jean Abbiateci cette semaine où le climat politique français est particulièrement torride.

    Les présidents de la Vème République ont-il un impact sur la météo ?
    Les présidents de la Vème République ont-il un impact sur la météo ?

    S’inspirant d’une petite note facétieuse et météorologique du « Guardian », Jean a décidé d’aspirer les données mensuelles du site Infoclimat pour Paris afin de comparer le temps qu’il a fait au cours de l’exercice du pouvoir par chaque Président de la République. Les conclusions sont évidemment (un poil) farfelues mais c’est l’exercice de datajournalisme qui est apprécié ici. D’ailleurs, François Hollande lui-même en a fait une allusion cachée et nonobstant lumineuse au cours de son voyage au Maroc cette semaine, c’est dire.

    La minute viz

    Le titre de cette visualisation résume bien le propos et le sentiment général. Hadopi : tout ça pour ça, pondue par WeDoData pour le magazine Tsugi (en kiosque), est une infographie décrivant pour le mieux l’insondable (enfin, si, justement, il est sondable) gouffre financier dont la Haute autorité est responsable.

    Hadopi : tout ça pour ça (détail).
    Hadopi : tout ça pour ça (détail).

    Le nombre d’avertissements envoyés aux internautes, mis intelligement en relation avec les condamnations effectives – le tout rapporté au budget de fonctionnement du bouzin – est tout simplement une gabégie. Parfaitement démystifiée. Tiens, ça me donne envie de relire un très bon article de Laurent Chemla sur « Owni », publié il y a déjà 2 ans.

    ***

    How Far is it to Mars? (via) s’adresse aux amateurs (nombreux) de parallaxe et (encore plus nombreux) de conquête spatiale. Ou : comment représenter une distance dans le cosmos à l’aide de HTML et de petites étoiles.

    Distance to Mars (détail).
    Distance to Mars (détail).

    En partant du principe simple que 100 pixels sur l’écran représenteraient le diamètre de la Terre (12 756 kilomètres), ce joli site nous fait partir dans le système solaire en direction de la planète Mars. En passant par la Lune pour mieux se représenter les distances. Comme attendu (et sans doute un peu plus important que prévu), le trajet est effectivement très long et le truc fait indéniablement son effet !

    La minute Demonocracy

    En matière de visualisation de données, les gars de Demonocracy (« l’ignorance est une bénédiction, la réalité ne l’est pas ») sont de sacrés cadors. Deux récents exemples de leurs indéniables compétences à nous décrocher la mâchoire avec de la data.

    The European Super Highway of Debt montre à quel point les pays qui tirent la langue en Europe – Portugal, Irlande, Italie, Grèce et Espagne qu’on désigne avec un certain mépris les PIIGS – sont endettés.

    The European Super Highway of Debt (détail).
    The European Super Highway of Debt (détail).

    Le processus de visualisation est toujours le même : on part d’un billet de 100 euros, et on zoome en arrière en augmentant la quantité d’argent liquide pour finalement représenter des masses colossales de devises transportées par poids-lourds. Cette infographie permet de prendre la mesure du problème actuel et informe précisément de la dette (remboursable ou pas, l’avenir le dira) que chaque pays doit à chaque banque.

    ***

    Cyprus Financial Crisis: Deposit Confiscation se focalise plus particulièrement sur la crise chypriote, en reprenant le même code narratif que les autres infographies de cette série.

    Cyprus Financial Crisis: Deposit Confiscation (détail).
    Cyprus Financial Crisis: Deposit Confiscation (détail).

    Tout est passé au peigne fin et visualisé : le problème du renflouement des banques, l’économie chypriote – et son incroyable rapport « dépôts » contre « PIB » – ou encore la manière dont il est prévu que le pays soit finalement démantelé. Tout y passe, et comme souvent (même si cette infographie est un peu plus « bavarde » que les autres), les images parlent souvent mieux que les mots.

    Veilleries

    Deux trucs plutôt gentils passés dans le radar récemment et qui méritent sans doute de figurer ici – même s’ils commencent un (tout petit) peu à dater :

    • Après l’appel lancé par « Human Rights Campaign » au cours des discussions au Sénat étatsunien sur le mariage gay, Facebook a plongé dans le big data (en l’occurrence ses propres données) pour voir l’impact de l’opération « changement de photo de profil » (le carré rouge avec le signe égal blanc). Showing Support for Marriage Equality on Facebook est le résultat de cette étude des données, notamment sur le plan démographique et géographique.
    • Le « Huffington Post » a compilé les rapports concernant les homicides et les morts accidentelles impliquant des armes à feu aux Etats-Unis depuis le massacre de Newton le 14 décembre dernier. Le résultat : Mapping the Dead: Gun Deaths Since Sandy Hook, une visualisation impressionnante regroupant sur une carte les 2 244 victimes dénombrées en moins de 100 jours (il faut cliquer sur le bouton « Next »), et pour aller plus loin le (gros) article de contexte.

    Cet article a été publié sur le site News Resources en avril 2013.

    Données fleuries #8

    En vedette

    Out of Sight, Out of Mind est une magnifique application qu’on pourrait traduire par « Pas Vu, Pas Pris », et qui comptabilise et visualise avec la précision du laser le nombre de victimes – tant militaires que civiles – de frappes par drones au Pakistan depuis 2004.

    Out of Sight, Out of Mind (détail).
    Out of Sight, Out of Mind (détail).

    Ce nouveau projet de l’agence Pitch Interactive (on se souvient au moins de leur monstre déglingué Arms Globe ou encore de leur app de comparaison lexicale Bible vs Coran) est tout en HTML5 et en JavaScript. Il est efficace et effilé comme deux autres bonnes lames en la matière : difficile en effet de ne pas repenser aux applications Morts aux frontières et US Gun Deaths, à l’esthétique proche, noire et mortelle, belle dans sa perversion et riche dans l’accomplissement de sa mission d’information.

    ***

    Décidément, après « Metro Meeting Point » que je vous présentais la semaine dernière, voici un nouveau projet directement inspiré des cartes isochrones chères aux amis de Locomote. Issu du laboratoire de Dataveyes, Metropolitain, s’il ne révolutionne pas le sujet par sa simplicité et son ergonomie, est toutefois très joli.

    Metropolitain (détail).
    Metropolitain (détail).

    Mélange réussi des données de temps de transport fournies par « Isokron » et des données de l’affluence du métro parisien libérées par la RATP, cette visualisation « épouse les aléas du temps de trajet » grâce à son utilisation de WebGL – technologie encore un poil expérimentale, ce qui explique que le truc pourrait ne pas marcher chez vous. Je vous conseille par ailleurs la très longue et très lyrique présentation du projet.

    La minute carto

    Député à vie ? Le cumul temporel des mandats en question(s) est un excellent dossier de journalisme (de données) signé Clément Parrot et Maxime Vaudano, jeunes pousses de l’ESJ Lille et par ailleurs papas du projet de fact checking Lui Président et blogueurs invités sur « Le Monde ».

    Le cumul temporel des mandats en questions (détail).
    Le cumul temporel des mandats en questions (détail).

    Le problème du cumul « vertical » des mandats (c’est-à-dire du nombre de mandats électoraux effectués par un seul individu) a été un point important du candidat Hollande et fait encore débat dans la majorité présidentielle. Dans ce projet, c’est le cumul dans le temps qui est étudié et représenté, notamment autour d’une carte très parlante des « cumulards » qui indique depuis combien de temps officie le parlementaire pour chaque circonscription. Un dossier pédagogique, employant simplement les outils à disposition pour éclairer sur une situation. Si on n’est pas trop pointilleux sur le design global, c’est du très bon travail.

    ***

    Combien gagnent les élus ? Les datas pour montrer les différences est un autre projet orienté financement politique et indirectement « open gov » grâce au travail de recherche et de visualisation des données récoltées.

    Combien gagnent les élus ? (détail)
    Combien gagnent les élus ? (détail)

    Le journaliste Arnaud Wery a donc planché pour « L’Avenir » et sur la région de Liège, en Belgique. L’intérêt de ce travail (sur Google Fusion Tables et Datawrapper) est de se rendre compte 1) que le traitement de la donnée à l’échelle locale ou hyperlocale est sans doute une opportunité conséquente pour les médias ; 2) que le journalisme de données peut avoir un vrai poids quand il est usé à bon escient (celui du plus grand nombre) ; 3) que le datajournaliste doit parfois partir de zéro et model(is)er lui-même ses données pour qu’une valeur d’usage – comme dirait Henri Verdier – et donc une valeur tout court puisse voir le jour.

    ***

    L’ami Philippe Couve enseigne le journalisme à Science Po et a pointé récemment le billet Qui sert la soupe à Paris ? (très bon titre) sur le blog « Urbi et Orbi » (« qui s’intéresse aux religions ») animé par Thomas Paga.

    Qui sert la soupe à Paris ? (détail)
    Qui sert la soupe à Paris ? (détail)

    Dans l’esprit d’entraide aux plus démunis qui caractérise (normalement) les plus pieux d’entre nous, voici donc une carte toute simple réalisée avec Google Maps. Simplicité étant souvent synonyme d’efficacité, ce qui est confirmé ici, la carte permet de prendre connaissance des points précis où sont servies les soupes populaires et dérivés : « Restos du Coeur », « Croix Rouge », associations israélites ou musulmanes, tout y est – et c’est très bien fait.

    La minute en coulisses

    How We Visualized Life After Fukushima est un billet réjouissant chez les copains de « datavisualization.ch » (vous connaissez évidemment leur boîte à outils nirvanesque), mettant en scène la réalisation par l’agence de design zurichoise Interactive Things d’un bouzin numérique autour de Fukushima pour le journal suisse « Neue Zürcher Zeitung ».

    How We Visualized Life After Fukushima (DR).
    How We Visualized Life After Fukushima (DR).

    Le défi (comme souvent dans pareille aventure de prolonger un dossier papier sur l’immatérialité immaculée de l’immarcescible web) résidait évidemment une quantité gigantesque de texte, photos et vidéos de manière séduisante pour l’internaute. On raconte donc les réflexions de l’équipe, les contraintes, les modes d’organisation ; narration soutenue par une iconographie gentillette où les combats de Post-It rivalisent avec les brouillons colorés de cartes géographiques. Une fenêtre ouverte sur le travail quotidien de datajournalistes. Et au final un excellent résultat.

    La minute Open Data

    12 Fresh Ideas for Transforming the Places We Live With Open Data (via) cause du #newschallenge de la Knight Foundation, dont tous les participants – auxquels se sont joints les amis de Parlement & Citoyens et de Voxe – doivent cette année relever le défi de « rendre les endroits où nous vivons encore plus géniaux grâce aux données et à la technologie ».

    Possible City (détail).
    Possible City (détail).

    Vous pouvez toujours jeter un oeil aux 12 projets retenus par « The Atlantic Cities », prendre connaissance de tous les autres projets (une sacrée dose de jus de cerveau qui redonne espoir dans l’être humain) ou vous féliciter de l’excellente tenue des projets français : intelligents, fondamentalement axés sur la politique, les données et la gouvernance ouverte.

    Veilleries

    Un petit truc sympa passé dans le radar récemment et qui mérite sans doute de figurer ici – même s’il commence un peu à dater :

    • Infographics (via) est une jolie… infographie présentant 1001 manières de pratiquer cette chouette discipline populaire et néanmoins essentielle dans la pratique du datajournalisme. Inspirant !

    Cet article a été publié sur le site News Resources en mars 2013.

    Données fleuries #7

    En vedette

    Metro Meeting Point (via) est vraiment très réussi. Le principe, simple en apparence, plaira à tous les matheux qui se cachent en nous : il s’agit du calcul instantané du lieu de rencontre idéal pour deux, trois, quatre ou cinq personnes se trouvant à autant de stations de métro parisien différentes. Sobre et pratique, ce projet a été développé par Jean-Robert avec le concours du logiciel R (dont il est spécialiste) et a été rendu possible par la libération récente des données de la RATP.

    Metro Meeting Point
    Metro Meeting Point

    Ceux qui connaissent Isokron (l’ancêtre de Locomote) ne seront pas dépaysés par le concept et pourraient être même un peu déçus par la partie graphique de cette petite application, un peu moins léchée. Une aridité qu’on pardonnera facilement à l’auteur, visiblement plus préoccupé par l’efficacité de son jouet sympathique.

    ***

    Autre projet français, Des données pour l’autisme (via) a été développé pour « L’Express » par le jeune journaliste Damien Brunon avec la précieuse collaboration de Journalism++ (J++). Le but est de réunir « non seulement les informations aujourd’hui disponibles sur [l’autisme], mais aussi celles que vous, internautes concernés, nous fournirez, chiffres, témoignages, adresses utiles… et qui alimenteront notre base. »

    Carte des données sur l'autisme (détail).
    Carte des données sur l’autisme (détail).

    Il n’est pas étonnant ici de retrouver J++ sur cette belle application mêlant information, cartographie (Mapbox/CartoDB) et crowdsourcing, puisque ses fondateurs Nicolas Kayser-Bril et Pierre Romera furent déjà, en leur temps, les initiateurs de l’excellent Prix de l’eau – basé sur le même principe – développé par « Owni ».

    La minute carto

    Syrie : deux ans de conflit en cinq cartes est un excellent dossier de datajournalisme, qui « retrace en cinq cartes l’évolution du conflit » dans ce pays en état de guerre depuis le « Printemps arabe ». Ses qualités, indéniables : clarté et pédagogie – le tout dans une interface esthétiquement très réussie.

    Deux ans de conflit en Syrie (détail).
    Deux ans de conflit en Syrie (détail).

    Ce très joli boulot est de nouveau sorti des tuyaux de « France Télévisions », grâce au travail de la journaliste Anne Bernard, de la graphiste Pascale Boudeville et du développeur Julien Légerdont nous avons déjà parlé le mois dernier à l’occasion de la sortie de l’application « Prix de l’immobilier ».

    La minute infographie

    Je pense voir passer une bonne centaine d’infographies très très moches chaque semaine et si World’s Richest Countries by Oil and Gas Reserves, pondue par l’agence russe « RIA Novosti » n’est pas une reine de beauté, elle a – au moins – le mérite d’être d’une grande limpidité.

    Réserves mondiales de pétrole et de gaz par habitant (détail).
    Réserves mondiales de pétrole et de gaz par habitant (détail).

    Réalisée collectivement – journalistes et artistes – et proprement sourcée, cette infographie sobre affiche une carte à bulles des réserves de pétrole et de gaz (en dollars US) par pays et par habitant, et offre également des indicateurs en bâtons intéressants comme le PIB, permettant de réaliser à quel point la population profitait indirectement – ou pas – des richesses naturelles du pays.

    La minute datasexuelle

    Nicholas Felton a donc délivré son 8e auto-rapport annuel (via) et il continue de fasciner par son application à scruter et mettre en scène sa propre vie dans un exercice d’exhibitionnisme numérique absolu. Roi de la « personal data quantification », Felton, qui signera les 2 500 exemplaires mis en vente (et déjà vendus), documente son existence à foison et en produit – c’est son métier – du design informationnel.

    Nicholas Felton Annual Report (détail).
    Nicholas Felton Annual Report (détail).

    Au départ, c’est davantage un projet « R&D » qu’une lubie, une monomanie ou un vice. (Faut juste voir si tout ça n’est pas compatible.) Felton a simplement remarqué à la fin d’une année qu’il avait inscrit tous ses déjeuners dans son agenda, ce qui l’a incité à creuser un peu plus. Il a ensuite, avec le temps, amélioré sa manière de noter ses faits et gestes : il utilise aujourd’hui une application iPhone spécialement créée qui lui demande toutes les 90 minutes ce qu’il fait, où il est, avec qui.

    La minute Open Data

    Les 6 et 7 avril prochains est organisée une Opération Libre à Brocas, charmant village de 800 habitants, située dans les Landes. Sa particularité : la commune a décidé de lancer son propre portail Open Data (encore très expérimental).

    Opération Libre à Brocas (Landes).
    Opération Libre à Brocas (Landes).

    Ce village très connecté a donc souhaité inviter « développeurs, cartographes, photographes, designers, traducteurs, vidéastes, professionnels ou en herbe et tous les curieux » à s’initier et/ou partager autour de Linux, OpenStreetMap et les licences libres. Cette « Opération Libre » (wiki) est une pierre dans le (beau) jardin rempli d’actions en faveur du développement des initiatives d’ouverture des communes dont l’association LiberTICet son projet pilote – est un des fers de lance en France.

    ***

    Toujours dans la région aquitaine, la Ressourcerie datalocale (via) s’offre une sacrée cure de jouvence avec le nouveau « portail mutualisé de données locales ouvertes » du Conseil général de la Gironde – officiellement « engagé dans une démarche de développement durable et de responsabilité sociétale ». Dans un grand moment de lyrisme politique, le CG33 (qui « a pensé son portail de données publiques comme un outil de mutualisation interne et externe ») souhaite que cette « ressourcerie » soit un lieu de rencontre entre les acteurs publics et les citoyens, chacun contribuant selon son savoir-faire.

    Ressourcerie Datalocale (détail).
    Ressourcerie Datalocale (détail).

    Derrière son design un poil champêtre, ce portail bâti sur du Drupal/CKAN customisé est plus qu’un catalogue de jeux de données. Au coeur du dispositif, une vraie plate-forme d’échanges d’idées et d’applications articulées autour des données ouvertes.

    Veilleries

    Un petit truc sympa passé dans le radar récemment et qui mérite sans doute de figurer ici – même s’il commence un peu à dater :

    • The 8 most frequent diseases of the past 91 days (via) est un projet de visualisation de données de la designeuse hongroise Krisztina Szücs assez bien conçu graphiquement, car il permet de mettre en lumière le nombre d’alertes (et leur degré de sévérité) des huit pathologies les plus graves à travers le monde – tout ça le long d’une frise chronologique originale. Au-delà du design, j’avoue (en revanche) être assez circonspect quant à l’absence notoire de sources.

    Cet article a été publié sur le site News Resources en mars 2013.

    Données fleuries #6

    En vedette

    Dis-moi où tu me plais est un projet d’amour. J’avais déjà apprécié l’atlas des connexions manquées pas plus tard que la semaine dernière, mais ce projet-là est juste mille fois mieux, il est interactif, puissant et il est français môssieur. Le principe ? Pomper la (grosse, 10 000 annonces en 4 ans) base de données du site de rencontres furtives Croisé dans le métro et joliment cartographier tout ça.

    Ils se sont croisés dans le métro (détail).
    Ils se sont croisés dans le métro (détail).

    Le résultat obtenu par Pierre Jullian de la Fuente, le développeur de cette charmante application (D3.js + mapbox.js pour les mécaniciens), est sobre, léger, intuitif comme on les aime.

    D’un côté, une carte permet de lire, station par station, les messages laissés par ces utilisateurs anonymes qui ont cru trouver l’amour, souvent, au cours d’un seul regard ou sourire échangé. On peut effectuer un filtrage sensé et classique (hétéro et homo dans les tous les sens rendus possibles par les mathématiques), ou encore filtrer par mot(s)-clé(s). D’un autre côté, un gros boulot d’analyse de contenu permet l’affichage d’une carte heuristique (appelée « graphe » pour l’occasion) ou chaque type de « rencontre » exhibe son gros champ lexical à la vue de tous.

    Rapidement, toutefois, la flânerie et les lectures aléatoires, poétiques, désespérée, souvent drôle, l’emportent sur les fonctionnalités. Et c’est sans doute son principal attrait.

    ***

    Est-ce que le Congrès des Etats-Unis craint ? (via) est la question posée par cette application (jQuery + CSS + data GovTrack) développée par Nilkanth Patel, qui – par ailleurs – fait des trucs de JavaScript et de design pour la célèbre revue « New-Yorker ». Ce projet « Does Congress Really Suck » a été développé dans le cadre d’une datafest organisée le mois dernier (entre autres) par Google et la Sunlight Foundation.

    La piste de l'argent (détail).
    La piste de l’argent (détail).

    En clair, cette application a pour objectif principal d’évaluer l’efficacité de la Chambre des réprésentants et du Sénat et comparer cette efficacité aux législatures précédentes, et de mettre au clair les relations croissantes entre les « donateurs » (les lobbyistes pour ne pas les nommer) et le vote de lois liées plus ou moins directement avec les intérêts défendus par ces donateurs. Un projet qui rappelle donc – dans l’esprit, et non dans la forme – l’application LobbyPlag dont je parlais le mois dernier. Tiens, par exemple, l’actuel président de la Chambre des représentants, le Républicain John Boehner, est tout proche du lobby pétrolier. Marrant !

    La minute carto

    Average Commute Times (via) est une impressionnante application cartographique réalisée par John Keefe et qui s’appuie sur un rapport du bureau du recensement américain sur les « megacommuters », c’est-à-dire ces citoyens qui habitent à plus de 90 minutes (ou 80 kilomètres) de leur lieu de travail – soit, par exemple, 2% des New-yorkais. Une infographie officielle du recensement (pdf) super moche et assez informative est d’ailleurs disponible, hurle ta joie.

    Average Commute Times (détail).
    Average Commute Times (détail).

    Cette cartographie chatoyante est l’énième démonstration de l’intérêt indiscutable d’ouvrir les données publiques. Au-delà de la jolie carte informative et de la performance technique, l’enjeu ici est évidemment de pouvoir s’emparer de ces données (comme l’a fait également le « Boston Magazine » en s’inspirant du boulot de Keefe) afin d’améliorer la vie quotidienne des citoyens, en simplifiant à l’extrême des données complexes, ou juste en offrant un rendu sexy à des données a priori rébarbatives à la consultation. Pari gagné.

    ***

    atNight (via) est un autre projet barré comme je les aime, qui veut « soulever les questions de la configuration de l’identité nocturne », notamment en comparant la ville plongée dans l’obscurité (c’est beau une ville la nuit, dit le poète) avec la perception que nous en avons le jour. Ici, les différents aspects de Barcelone et de son organisation et la compréhension de ces organisations permettent « une approche de la structure des paysages nocturnes ». Un projet fait de multiples comparaisons, oppositions pompées dans l’observation de la donnée recueillie par autant de moyens que nécessaires à la réalisation de l’étude.

    Unicité et identité à Barcelone (détail).
    Unicité et identité à Barcelone (détail).

    Soutenu par le gouverment de Catalogne et dirigé par une chercheuse-architecte flanquée d’un designer-architecte et d’un développeur, « atNight » (@atnightmaps) souhaite notamment proposer de « nouvelles stratégies urbaines collaboratives » en utilisant la visualisation de données pour « expliquer la relation de sens, de cause et de dépendance établie entre les citoyens et leur environnement ». Les données géolocalisées de Flickr, Twitter, Instagram, ont notamment été utilisées pour réaliser ce projet mixant art, sociologie et data.

    Il est possible de mettre les mains dans le cambouis de la carto. Entre autres (nombreuses) alternatives, il existe ce magnifique tutoriel concocté par Nathan Yau : How to Make a US County Thematic Map Using Free Tools, ou encore ce splendide billet technique de Joël Matriche : Intégrer une Google Map dans TableauPublic.

    La minute D3

    The Beautiful Table (via) est un projet parfait. Non seulement Jonathan Ferry pose des questions liées à la mise en valeur de la donnée, mais il y répond. Et Jon parle de foot aussi. Data + Foot : sautons sur l’occasion.

    La saison du Paris SG (détail).
    La saison du Paris SG (détail).

    Tout amateur de football sait que les informations centrales de son championnat préféré n’existent bien souvent que de manière déconnectée les unes par rapport aux autres. Jon s’est donc fixé un cahier des charges simple : fournir le classement, les résultats et le calendrier sous la forme d’un travail unique et cohérent ; ne pas perdre de fonctionnalités par rapport aux modes de visualisation existants ; révéler des informations supplémentaires qui soient immédiatement compréhensibles ; ne pas faire du design gratuitement, mais uniquement s’il est essentiel pour comprendre l’information.

    Jon explique toute son travail de design pas-à-pas : un document immanquable pour comprendre la démarche derrière cette brillante mise en valeur la donnée.

    La minute R&D

    Identifying and Visualizing Viral Content (via) est une vidéo captivante publiée par Microsoft Research qui présente un gros projet de R&D appelé « ViralSearch ». Le projet part de l’idée selon laquelle la phrase « être viral » a désormais imprégné la culture populaire, mais que le concept de viralité, en soi, demeure très illusoire au vu de l’incapacité à définir – voire simplement démontrer – l’existence de contenu viral sur Internet.

    Ils ont donc analysé et étudié un milliard d’informations – notamment sur Twitter, potentiellement Facebook dans le futur – en les structurant de manière à pouvoir véritablement comprendre (et afficher) la façon dont un contenu devenait (ou pas) viral entre différentes générations de bruits. Le résultat de cette distribution d’échanges sur les réseaux sociaux est plutôt impressionnant. Et si une passion pour ce sujet surgit, soudainement, on pourra également regarder la vidéo (de 7 minutes) mise en ligne par « GeekWire ».

    La minute Open Data

    Le Tableau de Bord de la RATP élaboré par « Data Publica » surgit un peu comme un rêve éveillé pour ceux, nombreux, qui militent depuis des années pour la libération des données à la Régie autonome des transports parisiens. « Petit geste un peu militant » comme François Bancilhon le rappelle dans les colonnes de « La Tribune » (Pourquoi la RATP rechigne à dévoiler ses secrets), ce tableau de bord va un peu plus loin que les visualisations élaborées en début d’année (par Alexandre Léchenet ou Marie Coussin, pour ne citer qu’eux) à partir du matériel gracieusement mis à disposition par la RATP elle-même.

    Données RATP (détail).
    Données RATP (détail).

    Outre les données froides classiques sur la topologie du réseau ou liées au trafic, ou une carte (faite avec D3.js elle aussi) du trafic annuel entrant par station à Paris réalisée par Samuel Charron, ce tableau de bord fournit des informations inédites sur les violences, les accidents et les décès, sur les mesures de confort, ou encore de consommation énergétique qui n’étaient pas forcément communiquées de bon gré par le passé. Un premier pas en attendant une libération… plus enthousiaste.

    ***

    Et à défaut d’enthousiasme, peut-être un jour, toutes ces données devront être libérées manu militari. Le trait est un peu forcé, mais pourtant, comme le titre Romain Mazon : l’ouverture des données publiques devient une obligation pour les collectivités locales, comme le prévoit l’article 111 du projet de loi de décentralisation transmis au Conseil d’Etat que s’est procuré « la Gazette des communes ». Il y aura encore des débats, des consultations, des rapports, mais à coup sûr la question de l’Open Data en France est désormais une question de temps et non de volonté politique, comme le dévoilait à demi-mots la feuille de route du Gouvernement présentée fin février. Reste à voir, de la carotte ou du bâton, celui qui aura les faveurs des pouvoirs publics.

    Veilleries

    Un petit truc sympa passé dans le radar récemment et qui mérite sans doute de figurer ici – même s’il commence un peu à dater :

    Cet article a été publié sur le site News Resources en mars 2013.

    Données fleuries #5

    En vedette

    Je n’aurais sans doute pas parlé de cette magnifique animation publiée sur YouTube en novembre dernier – et qui a déjà atteint plus de 3,5 millions de vues – si « Mashable » n’en avait pas fait récemment un article qui a beaucoup tourné.

    Wealth Inequity in America veut mettre en valeur la distribution des richesses aux Etats-Unis sous un angle particulièrement efficace : celui de nos préjugés (tiens, ça me rappelle un article sur Google Suggest qu’on avait écrit à 4 mains avec Julien Goetz sur « Owni ») et de notre perception des inégalités. En les comparant, évidemment, avec les vrais chiffres. Et comme il existe une marge très importante entre ce que les Américains pensent des inégalités dans leur pays – entre ce qu’ils croient, ce qu’ils souhaitent, et ce qui se passe vraiment – le choix du « motion design » pour illustrer ces fluctuations de données est idéal. Et, en l’occurrence, très bien réalisé.

    Pour suivre à la trace les sources qui ont permis de scénariser cette animation, on pourra également consulter It’s the Inequality, Stupid sur « MotherJones », Building a Better America [pdf] publié par deux chercheurs en psychologie, ou encore How Unequal We Are: The Top 5 Facts You Should Know About The Wealthiest One Percent Of Americans.

    L’effet WOW

    Puisque le ministère de la Santé allemand – via l’institut Robert Koch – a la bonne idée de produire de la data à gogo, et notamment à propos du cancer, les camarades de « Visual Telling » (dont j’ai causé la semaine dernière) ont développé une petite application simple et bien faite nommée Visualizing Cancer Data through Flows.

    Flow of Cancer Statistics (détail).
    Flow of Cancer Statistics (détail).

    Comme l’indique le billet de blog consacré à cette visualisation, la collecte de ces données des registres du cancer est important pour l’évaluation des mesures de santé publique ciblant notamment la prévention de la maladie. Une petite pierre à l’édification de ressources « open gov » dans le domaine de la santé. Grâce aux occurrences contenues dans ces données officielles (âge, genre, partie du corps touchée, implication), il est possible, par exemple, de constater très rapidement, grâce à la visualisation, que le (terrible) cancer du pancréas a assez nettement augmenté en Allemagne depuis 20 ans (+18%), et principalement chez les hommes (+25%). Rendre aisée la lecture de données complexes : le boulot est fait.

    ***

    Restons dans le big data grâce à cette autre vidéo particulièrement intéressante (via), qui est l’allocution de Ranat Taneja, directeur technique d’Electronic Arts, au cours de la récente Strata Conf organisée par O’Reilly. Je vous glisse également les diapositives de sa présentation aperçue rapidement durant la vidéo.

    Le jeu vidéo me semble suffisamment grand public pour offrir une porte d’entrée pertinente à la compréhension de la révolution technologique et sans doute sociétale (je suis un peu branché « Open Data » et « Open Gov », vous aurez noté) qui s’amorce avec le « big data ». Il est vrai que 2 milliards de joueurs à travers le monde, qui génèrent 50 térabytes de données par jour, ça fait du volume. Et l’appréhension d’un tel volume de données « oblige » l’industrie du jeu vidéo à prendre des trajectoires stratégiques qui dépassent clairement le simple cadre du divertissement.

    Pour offrir de nouvelles et « amazing » expériences utilisateur basées, notamment, sur l’analyse comportementale en temps réel et pour élaborer des fonctionnalités de jeu fondées sur l’anticipation artificielle (le prédictif dirait Philip K. Dick), Electronic Arts – qui voit quand même passer l’équivalent de 50 milliards de minutes, soit 100 000 années de gameplay par mois par ses serveurs – a donc été obligé de casser l’architecture « classique » en silo. On ne joue plus sur mobile, ou sur PC, ou sur les réseaux sociaux… Le « joueur global » est invité à muter, EA souhaitant transformer le concept d’identifiant en celui, un peu plus flippant à y réfléchir, d’identité unique. Note pour plus tard : « IRL » (in real life) risque de ne plus signifier grand chose dans un avenir très proche.

    La minute bidouille

    Stately est un gadget mignon dans la lignée de la fameuse police de caractère Chartwell. L’objet de cette fonte est de permettre la création de cartes des Etats-Unis (ces cartes comme on les aime chez les [data]journalistes, pour signifier des répartitions par régions, par exemple) sans avoir besoin… de talent particulier en cartographie.

    Presidential States by Stately
    Presidential States by Stately

    Ici, tout passe par HTML et CSS. Il suffit d’appeler la fonte via une feuille de style, puis de générer chaque Etat grâce à caractère collé derrière une simple puce <li> à laquelle on ajoutera simplement un argument pour mettre la couleur de son choix. L’idée est relativement choupinette, et elle offre un avantage important par rapport à n’importe quelle carte produite sous forme d’image : vu qu’il s’agit d’une police, le redimensionnement de votre carte est propre et rapide puisque vous n’aurez qu’à changer la taille du caractère dans la feuille de style.

    Veilleries

    Quelques jolis objets sont passés dans le radar récemment et méritent sans doute de figurer ici – même s’ils commencent un peu à dater :

    • Les aliments les plus surconsommés par département est une carte réalisée par le « Journal du Net » avec des données Nielsen et présente en résumé les habitudes alimentaires des Français selon le département où ils consomment (a priori celui où ils habitent). Si vous aimez les stats et si vous êtes un peu pervers, vous chercherez évidemment quels sont les départements où la consommation d’alcool est la plus forte et vous en tirerez des conclusions divertissantes et sans doute erronées. Et vous n’en voudrez pas au « JdN » d’avoir filé l’indépendance à la Corse.
    • A Handsome Atlas (via, via), c’est la preuve (s’il en fallait encore une) que la représentation du monde par la donnée n’est évidemment pas une invention récente mais la résurgence d’une pratique qui date – au moins – du 19e siècle. Cet atlas, compilé grâce au gros boulot de Jonathan Soma, permet de consulter confortablement un grand nombre d’archives centenaires. Jusque là, ces trésors étaient accessibles uniquement sur le site de la bibliothèque du Congrès, trop rigide au goût de Jonathan, qui a tout simplement « hacké » le système en téléchargeant tous ces documents et en les mettant derrière une interface de consultation sexy faite à la maison.
    • Qui cumule ? (via) est un très joli outil politique donnant la possibilité de montrer du doigt, par département, les parlementaires qui pratiquent le cumul de mandats électifs – soit pour des questions d’influence, soit pour perçevoir plusieurs indemnités – et, chose originale, de les interpeller directement sur Twitter. Développée par le fringuant Centralien Maxime Alay-Eddin, cette plate-forme est l’exemple assez typique des initiatives populaires qui peuvent être prises par (à peu près) n’importe qui avec juste quelques données éparses et un peu de code pour rafraîchir la pratique de la démocratie.

    ***

    Cet article a été publié sur le site News Resources en mars 2013.