Authentique ou Retouchée ?

Le 10 mars 2010

Nicolas Kayser-Bril a développé pour la soucoupe un outil permettant de détecter les photos retouchées. Il présente ici son fonctionnement et nous livre un premier retour d'expérience.

image-4

Moins connue et beaucoup moins sexy que sa cousine médicale, l’informatique légale cherche à faire parler des fichiers qui portent souvent en eux beaucoup plus d’informations qu’il n’y paraît.

En ce qui concerne les photos et les vidéos, ces techniques permettent de remettre à leur place les compagnies, les gouvernements ou les individus qui tentent de nous laver le cerveau à coup de preuves ‘en images’.

Les vidéos de Ben Laden? Probablement des fakes. Les preuves des essais de missiles à longue portée iraniens? Bidonnés. Les photos de mode? Quasiment toutes photoshoppées.

La députée Valérie Boyer veut faire adopter une loi obligeant les photos modifiées par ordinateur à porter la mention ‘photo retouchée’.

Sans attendre que l’Assemblée se mobilise, j’ai codé, avec l’équipe d’Owni.fr, un widget qui offre 2 des outils utilisés en digital image forensics (analyse d’image légale), l’analyse du taux d’erreur et l’analyse EXIF.


Embeddez le widget sur votre site en copiant le code ci-dessous

Si vous lisez le mode d’emploi ci-dessous, vous pourrez, grâce à ce widget, déterminer si une image a été modifiée ou pas.

1. C’est quoi l’Error Level Analysis?

L’analyse du taux d’erreur (ELA) est une méthode de base de l’investigation numérique. Elle permet d’identifier les manipulations qu’a subit une image.

La qualité des images JPEG diminue au fur et à mesure des sauvegardes. L’ELA fonctionne en sauvegardant une image à une qualité donnée puis en comparant le résultat à l’image originale. Si l’image n’a pas été manipulée, toutes les parties de l’image devraient avoir été sauvegardées le même nombre de fois. Si certaines parties de l’image proviennent d’une source différente, elles auront été sauvegardées un nombre de fois différent et apparaîtront dans une couleur différente lors de l’ELA.

Sans manipulation, le taux d’erreur doit être uniforme sur toute la photo. L’ELA ne montre alors que du bruit. Plus le potentiel d’erreur est élevé, plus les zones apparaissent blanches sur l’ELA.

Exemple: Collage

On voit sur la photo que la grue a été collé à l’image. Si la composition était authentique, le taux d’erreur sur les contours de la grue devrait être similaire à celui du contour des arbres.

Les retouches se détectent aussi en regardant les différences dans les motifs du bruits. Une peau lissée par ordinateur perturbe le pattern du bruit, par exemple.

Exemple: Lissage de la peau

L’ELA ne fonctionne pas à tous les coups. Les contours, les détails contrastés (pin’s, panneau…) et les couleurs rouges ressortent toujours plus fort, par exemple. Les résultats de l’ELA ne constituent qu’un indice de manipulation, rarement une preuve. Il faut les coupler avec d’autres analyses, comme celle de l’EXIF.

L’analyse ELA du widget utilise un programme de P. Ringwood.

Pour en savoir plus, rien de tel que le blog de Neal Krawetz, l’un des meilleurs computer forensics.

2. C’est quoi EXIF?

EXIF signifie Exchangeable image file format. Lorsqu’un appareil photo numérique enregistre une image, il laisse des informations telles que le modèle de l’appareil, la distance focale, le degré d’ISO etc. De la même manière, les logiciels de retouche laissent souvent des traces sur les fichiers. Ces données peuvent être récupérées grâce à un outil construit par Jeffrey Friedl.

Premier retour d’expérience

En 24 heures, les internautes ont analysés plus de 1200 photos représentant près d’1 Go de données, faisant du même coup sauter mon serveur.

Malgré ce succès d’audience, peu d’utilisateurs ont pris le temps de partager leurs découvertes. A lire les commentaires, j’ai l’impression que les internautes sont surtout désemparés par l’outil et ne peuvent pas interpréter les résultats.

Manque de pédagogie de ma part? Sans doute. Lire les résultats de l’ELA nécessite beaucoup d’expérience et il eut été nécessaire de faire un tutoriel. J’aurais pu prévoir un jeu demandant de repérer les zones retouchées sur des photos connues. Ça aurait permis aux plus motivés de prendre l’outil en main.

Au delà de ça, certains utilisateurs semblaient déçus de ne pas avoir de réponse tranchée: “cette photo est un fake”.

L’information est souvent traitée comme une somme de vérités absolues délivrées par le journaliste. 51% de 300 personnes interrogées par téléphone disent qu’elles aiment Sarkozy? Le journaliste transforme ça en “Les Français soutiennent le président”. Une étude montre que la dépression augmente la mortalité? “La dépression est aussi meurtrière que la cigarette“, disent les médias.

On s’habitue à être pris pour des cons. Face à ça, il nous faut redoubler de pédagogie pour permettre aux lecteurs de penser en termes de probabilités (“Cette photo a de grandes chances d’avoir été retouchée”, “On peut dire avec une certitude de 90% que le réchauffement climatique est causé par les activités humaines” etc).

A nous de proposer des produits intelligents qui reflètent le plus fidèlement possible la réalité au lieu de la caricaturer grossièrement.

Original à lire sur le blog Web-Obscur

Laisser un commentaire

Derniers articles publiés