Wikileaks et biologie, utilisation similaire des données?

Le 5 décembre 2010

Le journalisme de données et la saga Wikileaks sont la transposition dans la société d’un phénomène récent en biologie : le déluge de données. Quels enseignements tirer de ce parallèle ?

Titre original : Opinion : Wikileaks, biologie des données, émergence

Le journalisme de données et la saga Wikileaks sont la transposition dans la société d’un phénomène récent en biologie : le déluge de données. Quels enseignements tirer de ce parallèle ?

Low-input, high-throughput, no-output biology

Ainsi Sydney Brenner qualifiait-il dans une conférence récente le phénomène de “biologie des données” : en somme, la génération de données brutes ne serait qu’une démarche un peu paresseuse (“low-input’”), coûteuse et n’apprenant au fond pas grand chose de neuf sur la biologie (“no output”). Brenner combat en réalité cette idée que la “science” peut émerger spontanément des données, par une analyse non biaisée et systématique, qu’au fond les données vont générer les théories scientifiques naturellement (et c’est aussi un peu le principe d’algorithmes d’analyse comme Eureka).

Emergence de la connaissance

La démarche de Wikileaks me semble relever de la même tendance : des données brutes et nombreuses, disponibles à tous, va surgir une vérité, obscure dans les détails mais éclatante vue de loin. More is different pour reprendre le titre du papier célèbre du Prix Nobel de physique Phil Anderson. Wikileaks, c’est l’émergence appliquée au journalisme, l’idée qu’un déluge quantitatif va changer la vision qualitative des faits.

Est-ce vrai ? La comparaison avec la biologie de données est éclairante à mon sens. Au-delà des critiques juridiques, sur ce que j’ai entendu, on entend que la majeure partie des mémos de Wikileaks sont sans aucun intérêt, que cette publication met l’accent sur des épiphénomènes ou que les télégrammes qui semblent un peu “croustillants” ne nous apprennent en fait rien de vraiment nouveau ou rien dont on ne se serait douté. Allez dans une conférence de biologie, et discutez avec des critiques de la biologie des données, vous entendrez exactement le même genre de critiques, à savoir que l’analyse est trop simple, biaisée, et qu’on ne trouve rien de vraiment étonnant ou neuf. Bref, dans les deux cas, ce saut qualitatif à la Anderson ne se produirait pas, les données sont jolies mais totalement inutiles au fond.


Le retour de l’expert

Il y a néanmoins une différence de taille : si je vous donne la séquence d’ADN d’un gène, vous n’êtes pas capable de dire ce que ce gène fait dans la cellule, c’est une information intéressante mais dont on ne saisit pas la portée exacte (aujourd’hui en tous cas), tandis que si je vous dis que “Sarkozy est autoritaire et colérique”, d’une part, c’est une information considérée comme signifiante par l’analyste, donc son contenu informatif est maximisé dès la collecte de celle-ci1 , d’autre part, vous êtes capable de replacer cette donnée immédiatement dans un contexte plus global, repensant au “Casse-toi pauvre con”, à la brouille avec la commission européenne sur les Roms, et plus généralement à sa pratique politique globale.

En d’autres termes, dans le journalisme de données, nous pouvons bien comprendre les sens individuels des atomes de données, mais nous avons déjà une idée de l’image globale, du niveau supérieur émergent, et du coup, nous sommes tout à fait à même de comprendre comment des petits détails deviennent signifiants sur la vision et l’organisation du monde. Dans ce cadre, on a besoin de nouveaux experts, des personnes ayant une bonne maîtrise de ces petits détails, capables de mettre ensemble ce qui est signifiant a priori pour bien nous aider à visualiser cette réalité (cf. cette tribune du Monde signalée par Enro sur twitter).

Où sont ces experts dans la biologie des données ? Ils sont capables de comprendre les petits faits individuels apparemment anodins, de les mettre ensemble dans un cadre plus global, de les faire comprendre à tous par une représentation adéquate. Lisez ou relisez L’origine des Espèces, et vous verrez que c’est exactement la démarche suivie par Darwin. Pense-t-on vraiment que des robots soient capables de faire cela ? Ou n’est-ce pas plutôt le boulot des théoriciens, espèce qui demeure rare en biologie ?

>> Article initialement publié sur Matières Vivantes

>> Illustrations FlickR CC : Garrettc, Elliot Lepers pour OWNI

  1. Un exemple de contenu informatif non maximisé serait une description pièces par pièces de la garde-robe du dit Sarkozy,et je ne suis pas loin de penser que certaines données biologiques abondantes ont à peu près le même intérêt. []

Laisser un commentaire

Derniers articles publiés