Le petit Data Noël

Le 26 décembre 2011

Entre cotillons et trompettes en papier, les journalistes de données d'OWNI présentent un florilège des 13 premiers épisodes des Data en forme. Le meilleur du meilleur de ce que "Paule d'Atha" a préféré lors de ce dernier trimestre 2011.

Chaque semaine depuis la mi-septembre, Paule d’Atha – et l’équipe de journalistes de données qui se parent humblement de ce pseudonyme – te réserve, cher lecteur, le meilleur de sa veille “data”. Au crépuscule de 2011, entre cotillons et trompettes en papier, nous avons le plaisir de te présenter un florilège des treize premiers épisodes des Data en forme. Le meilleur du meilleur de ce que nous avons préféré lors de ce dernier trimestre, durant lequel nous avons vu tant de merveilleux objets innovants, inventifs, colorés, émouvants ou drôles.

L’avenir est dans les cartes

The World of Seven Billion [en] est un très joli dossier propulsé par National Geographic pour célébrer le passage (virtuel) des sept milliards d’êtres humains sur Terre. Mappemonde épurée, d’une belle lisibilité grâce à l’usage du fond noir et de couleurs vives figurant les différents niveaux de revenus couplés à la densité de population sur les cinq continents. Une cartographie qui s’appuie sur les données publiques de la Banque mondiale et qui ferait bonne tâche (mais pas tache) dans toutes les salles de classe. En guise de repère contextuel, cette carte est accompagnée de ses principaux vecteurs démographiques, catégorisés selon la moyenne compilée de chaque niveau de revenu dans le monde, et les indicateurs courants de santé publique, d’éducation, de fertilité ou d’accès à la technologie sont ainsi représentés sous une forme sans fioritures, entre logotypes et géométrie.

7billion

Open Montréal

Vous avez toujours rêvé d’entrer dans la peau d’un élu québécois. L’arrondissement du Plateau-Mont Royal de Montréal transforme ce rêve en réalité, l’accent en moins. Sur le site Internet de l’arrondissement, il est proposé aux citoyens de donner votre avis sur les priorités budgétaires, au moyen d’une application. Sauf qu’il ne suffit pas de dire “moi je ferai-ci”, “je baisserai les impôts”, “je ferai plus d’espaces verts”. Il faut le prouver en choisissant parmi les mesures proposées, relatives aux compétences de l’arrondissement : bibliothèques, piscines et pataugeoires, déneigement, collecte des déchets, propreté…

Par exemple, si vous trouvez qu’il faudrait maintenir une brigade de déneigement sur les trottoirs lors des grands coups de froid, il faudra dépenser 500 000 dollars par an. Votre budget est maintenant en déficit : il vous faut réduire les coûts sur une autre activité. Abolir la collecte sélective des déchets les jours fériés ? Vous économisez 140 060 dollars. Vous avez un peu de marge désormais : qu’allez vous en faire ? Une fois votre budget équilibré, vous pouvez soumettre les propositions aux élus de l’arrondissement, qui s’engagent à jeter un coup d’œil à vos propositions.

Cette application de “gouvernance ouverte” (Open Gov) se situe au-delà du serious game : au croisement entre mise en œuvre de l’Open Data, pédagogie (gérer un budget de collectivité, ce n’est finalement pas si simple), et participation citoyenne utile – on peut (enfin ?) jouer à Sim City pour de vrai.

Mont-Royal

Météo, sentiments et économie

Une fois n’est pas coutume, ce sont les représentations d’un mouvement de foule, de son humeur ou de son opinion, ou de son empreinte géographique qui ont attiré notre attention cette semaine. Et c’est devant une nouvelle production de haut vol (en HTML5, forcément) du New York Times que nous nous pâmons le plus nettement : “What’s Your Economic Outlook?” [en] est une application de crowdsourcing développée par Tom Jackson, Daniel McDermon et Aron Pilhofer, ayant pour objet d’interroger les lecteurs sur leur sentiment face à l’avenir, pour leur propre travail, pour l’économie et les générations futures. Et naturellement, de se situer par rapport aux autres internautes de passage. Le rendu graphique, qui affiche l’ensemble de l’étude ou bien son contenu filtré par vos soins, est original et lisible, sans fioritures, et offre une photographie instantanée de l’échantillon – sans doute non représentatif de la population étasunienne – ayant répondu à l’enquête. Et pour les plus sociologues d’entre-vous qui souhaitent aller au-delà de la simple représentation graphique, les commentaires des internautes valent indéniablement le détour – tant pour leurs motifs d’espoir que pour les sentiments négatifs qui les parcourent assez globalement.

Economy Sentiment

S’il existe un autre sujet consensuel à l’humanité qui aura survécu haut la main à la migration des esprits vers le numérique et l’immatériel (hormis le sexe, donc), c’est bien la météo. Il existe un nombre indécent de sites web consacrés à cette science de l’improbable, qu’on aime critiquer pour leurs prévisions parfois détrompées par les faits, souvent par les espérances. Choisir “son” site météo c’est un peu comme devoir trouver son marteau chez Casto : c’est utile mais à la fin ils se ressemblent un peu tous. C’est à ce moment qu’entrent en piste Jacob Norda et James Diebel et leur concept : WeatherSpark [en]. En s’appuyant sur les données de weather.gov, de l’Institut national de météorologie de Norvège et des API des sites World Weather Online et Weather Central, les deux jeunes ingénieurs californiens ont monté une interface interactive de grande classe qui permet de naviguer dans la donnée, y compris dans le temps, de manière extrêmement intuitive et quasi ludique.

Weatherspark

Inégalités franciliennes

Comportons-nous un peu comme d’affreux parisiens. Un projet data sur lequel nous voulons attirer votre attention est une cartographie des inégalités de revenus en Île-de-France, proposée par Jean Abbiateci, sur le désormais indispensable blog d’Elsa Fayner, Et voilà le travail. La carte présente trois indicateurs : le niveau des inégalités des revenus des ménages franciliens, l’évolution de ces mêmes inégalités dans le temps et à titre de comparaison, le revenu fiscal médian. Chaque indicateur est détaillé par commune, avec une visualisation spécifique.

La démarche, expliquée dans l’article accompagnant la cartographie, se distingue par son accessibilité. Jean Abbiateci a ainsi utilisé des données publiques, de l’INSEE – la distribution des revenus fiscaux déclarés par les ménages de 2001 à 2009 – auxquelles il a appliqué deux indicateurs traditionnels pour mesurer les inégalités : le ratio entre ce que gagnent les 10% les plus riches et les 10% les plus pauvres ; et le coefficient de Gini. Le tout propulsé dans un outil de visualisation gratuit : Google Maps, bien travaillé et manipulé pour rendre le tout compréhensible, détaillé et interactif.

Inégalités

Démocratie à la lusitanienne

Les 19 et 20 octobre derniers se tenait à Varsovie un événement essentiel dans le monde de l’Open Data : l’Open Government Data Camp. Parmi les 400 participants, il y avait notamment les deux créateurs de Manufactura Independente, un studio de design basé à Porto. Ils venaient y présenter le dernier projet auquel ils ont participé : Demo.cratica [pt], un superbe outil permettant d’explorer le parlement portugais à travers les data.

Intéressé par le contenu des sessions parlementaires ? Democratica a ce qu’il vous faut : un calendrier des sessions depuis 2009 permettant de naviguer parmi les transcriptions des débats. Au survol d’une date sur le calendrier s’affiche le mot le plus souvent cité dans les prises de paroles du jour, pratique pour parcourir les thématiques abordées. Lorsque vous vous penchez sur la retranscription d’une session parlementaire, en plus des textes des interventions, Democratica propose une visualisation “statistique” des échanges. Vous pourrez ainsi facilement voir quel groupe parlementaire a le plus pris la parole, via quels députés au sein de ce groupe ou quels sont les grands thèmes abordés.

Pour ne rien gâcher, la mise en forme de ces données est plus que léchée et les sources de Democratica sont regroupées sous la forme d’un logiciel libre et donc disponibles sous licence AGPL. Quoi de plus naturel lorsque l’on sait que ce projet est né, il y a 9 mois, au cours d’une session Hackday à Porto ? Depuis le temps qu’on vous le dit : hacker c’est bien, c’est bon.

Democratica

Datamusique (émotion n°1)

Le somptueux Baroque.me visualise la première Prélude des Suites pour violoncelle de Bach de manière mathématique. Le projet représente en effet les notes comme des cordes et transpose leur longueur et leur structure selon des points. Ou comment montrer de façon interactive et novatrice que la musique classique répond à des schémas organisationnels précis.

Expliquer le monde avec des boîtes

Preuve (s’il en fallait encore une) que le recensement de la population est l’un des domaines de prédilection des manieurs de données les plus créatifs, les vidéos suivantes ont attiré particulièrement notre attention et n’auront sans doute pas manqué de flatter la vôtre.

Dans cette première vidéo, “Visualizing How A Population Grows To 7 Billion” [en], Adam Cole et Maggie Starbard de la NPR se sont (sans doute bien) amusés à simuler l’évolution de la population mondiale à l’aide de verres percés et de liquides colorés aux débits calés sur les données de variations démographiques des continents à travers les âges. Le résultat n’est pas seulement compréhensible au premier coup d’œil – première qualité de la représentation de la donnée – il est également élégant. Tout simplement.

Du coup, cette première vidéo nous a donné envie d’en ressortir une deuxième [en] du placard aux bijoux. Qu’on ait déjà vu ou pas le génial Hans Rosling et son explication de la croissance de la population mondiale (qui s’est tenu en 2010 au TED… de Cannes), le plaisir est toujours là. La datavision, comme nous l’enseigne le maître David McCandless, c’est une belle data, une belle vision, et le talent pour enrober le tout. Et assurément, il faut du talent pour passionner un auditoire avec des boîtes en plastique IKEA.

Sémantique du pieux

Après avoir joué avec les formes, jouons avec les mots. L’analyse sémantique est un domaine que nous suivons de près chez OWNI et deux projets particulièrement séduisants ont retenu notre attention dans ce domaine cette semaine.

Le premier s’intéresse à deux des plus grands best-sellers de tous les temps : la Bible et le Coran. La société Pitch Interactive (dont le slogan est “Doing good with data”, “faire le bien avec les data”…) a voulu déconstruire les préjugés souvent associés à ces deux livres sacrés : par exemple que l’idée que le Coran soit un livre “violent” ou “de terreur”. Pour ce faire, ils ont analysé le contenu de la Bible et du Coran. Le résultat de leur recherche est présenté dans une application en HTML5 [en], permettant de chercher une thématique et de comparer sa fréquence d’apparition dans les deux livres.

La référence et le contenu des versets qui citent tel ou tel sujet est indiqué, permettant ainsi de naviguer en profondeur dans les détails des livres et de re-situer chaque mot dans son contexte. Pour chaque thématique, sont également présentées des données chiffrées : nombre d’occurrences, nombre de versets qui citent le mot, pourcentage de versets y faisant référence (proportionnalité qui a son importance, la Bible étant beaucoup plus longue que le Coran). Essayez sur TRUST (confiance), FORGIVE (pardon), ou PEACE (paix), le résultat est assez saisissant.

Bible et Coran

Une histoire de flux

Nous avons tous été émerveillés, un jour ou l’autre, par les photos de la Terre vue de l’espace. Notamment celles qui permettent de deviner les contours de nos continents au moyen unique des lumières nocturnes de nos mégalopoles. Fruit de la domination et de l’influence de l’homme sur son environnement, cette vision scintillante de la planète participe de l’anthropocène qui a inspiré l’anthropologue canadien Felix Pharand-Deschenes du site Globaia.org pour réaliser de magnifiques visualisations de la Terre à partir de données publiques : villes, routes, voies ferrées, lignes aériennes, lignes électriques, câbles internet…

La mobilité des Étasuniens est légendaire. L’an passé, près de 40 millions d’entre-eux ont déménagé, dont 10% d’un État à l’autre. Journaliste chez Forbes, Jon Bruner s’est emparé des données de l’IRS (service des impôts) pour réaliser une carte interactive des flux migratoires [en] comté par comté, entre 2005 et 2009. En dehors d’être sobre, jolie et informative, cette cartographie est un remarquable dispositif ludique pour approfondir ses connaissances géographiques des États-Unis.

Migrations

Crowdsourcing afghan et égyptien

The Asian Foundation mène depuis sept ans une étude d’opinion sur la perception, par la population afghane, des changements politiques et des évolutions dans leur vie quotidienne. En 2011, elle a interviewé 6 348 citoyens afghans, dans les 34 provinces du pays.

L’application interactive “Visualizing Afghanistan” [en] permet de naviguer dans les résultats de cette étude, par trois entrées : chronologique (de 2006 à 2011), thématique (l’utilisateur peut sélectionner les questions en haut à droite) et cartographique, en accédant au détail des réponses par région.

Une granularité particulièrement révélatrice et utile pour mettre les données en perspective. Ainsi, à la question “Votre famille vit-elle mieux aujourd’hui que quand les Talibans étaient au pouvoir ?”, la réponse est mitigée dans la région du Sud (33% estime que non, 34% que oui), tandis que la région du centre (Hazarjat) est plus unanime : 67% déclarent mieux vivre qu’au temps des Talibans.

Visualizing Afghanistan

Géolocalisation, crowdsourcing et data à pieds joints alors que deux journalistes ont annoncé avoir été victimes d’agressions sexuelles en Égypte, tandis qu’elles couvraient les événements de la place Tahrir.

Ces événements révèlent l’ampleur du problème du harcèlement des femmes, devenu un véritable fléau dans les pays des pharaons : selon ECWR (The Egyptian Center for Women’s Rights), 83% des femmes égyptiennes et 98% des femmes étrangères y font l’objet d’un harcèlement.

C’est pourquoi “The Harass Map” [en] (“la carte du harcèlement”) propose aux femmes de signaler, de manière anonyme, les agressions sexuelles dont elles seraient victimes. Elles ont pour cela quatre moyens : par SMS, par twitter, par mail et par un formulaire sur le site. Le site agrège ensuite sur une carte les différents signalements.

La plate-forme est développée par Ushaidi, spécialiste de la production de logiciels et plates-formes open source permettant le crowdsourcing et la géolocalisation. Ils avaient notamment mis en place une plate-forme après le séisme en Haïti pour aider à signaler les zones ayant besoin d’aide. Le système de SMS passe par Frontline SMS, projet open source également qui permet aux citoyens, ONG, d’envoyer gratuitement des SMS n’importe où, dès lors qu’un signal mobile peut être capté.

HarassMap

Le projet souhaite réinvestir [pdf] les revenus générés par les SMS dans des actions pour lutter contre le harcèlement des femmes.

Datamusique (émotion n°2)

C’est à ce moment précis que vous pouvez monter le son et mettre en pause quelques minutes éblouissantes de votre vie.

Stephen Malinowski a pratiqué le piano durant deux décennies avant d’entamer une carrière de programmeur. À la croisée de ces chemins est née la machine à animer la musique, concept phénoménal de visualisation réalisé grâce à un simple petit logiciel de sa fabrication. Nous vous proposons ci-dessous un peu d’émerveillement grâce à la célébrissime Nocturne opus 9 n°2 en mi bémol majeur de Frédéric Chopin, qu’il composa lorsqu’il avait tout juste vingt ans. Et nous vous encourageons vivement à partir à la découverte de l’univers géométrique de Malinowski : vous rêverez alors de ronds, de carrés, de losanges et de couleurs arc-en-ciel.

Juste un doigt de politique

Mediarena, conçue et développée par Nils Grünwald, Stéphane Raux, Alexis Jacomy et Ronan Quidu est une bonne “datagifle”. Tout est là au premier coup d’œil : l’angle est clairement identifiable – comment les principaux médias en ligne traitent la présidentielle – et la prise en main plus qu’intuitive. En quelques clics, on joue avec les données et on fait défiler sur ce ring les noms des grands titres. Le cadeau bonux, c’est que derrière cette simplicité gage de lisibilité, Mediarena nous donne accès à bon nombre de données qui donnent du relief et de la profondeur à l’angle choisi.

Mediarena

Prenons l’avion pour aller faire un tour outre-manche. Nos amis du Guardian, qu’on ne présente plus en matière de journalisme de données, ont encore fait joujou avec quelques chiffres pour notre plus grand plaisir. Le concept de longue traîne ne leur étant pas non plus inconnu, ils sortent une très belle visualisation interactive [en] sur un événement qui a près de quatre mois : les émeutes londoniennes.

London Riots

Alastair Dant et ses collègues ont décidé d’analyser l’évolution des rumeurs sur Twitter pendant ces événements. “Les émeutiers ont libérés les animaux du zoo de Londres”, “les émeutiers se font leurs propres sandwichs dans les Mc Do”… À vous de choisir parmi sept rumeurs – cinq fausses, une infondée et une avérée – pour visualiser leur évolution. Le replay est intelligemment construit, avec notamment l’identification visuelle des tweets favorables, opposés, interrogatifs ou simplement commentant les faits et la mise en avant de moments clés où la diffusion de la rumeur se modifie. Et, comme au Guardian ils aiment partager, ils nous livrent un making of de cette datavisualisation qui permet notamment de comprendre l’importance d’un travail d’équipe intégrant : journalistes, développeurs, designers et universitaires.

Best of best of

La planète data ne résiste pas non plus à la tradition du best of, une fois que l’année tire à sa fin. Celui de Visualizing.org est une façon poétique de se rembobiner le (data) film de 2011 :

Nous vous souhaitons d’excellentes fêtes de fin d’année, et vous donnons rendez-vous en 2012 avec plein de jolies web-apps (applications web), de somptueuses dataviz (datavisualisations), de pimpantes infoviz (infographies) et surtout une immense dose d’Open Data (données ouvertes) et d’Open Gov (gouvernances ouvertes).


Les images sont des captures d’écran des sites mentionnés.
L’image de clé est de max_thinks_sees [by-nc-sa].
Vous pouvez suivre Paule d’Atha sur Twitter, ainsi que vos serviteurs : Marie, Julien et Nicolas.

Laisser un commentaire

Derniers articles publiés