The Visual Display of Quantitative Information« Une image vaut mille mots. » Encore faut-il que cette image reflète fidèlement l'information représentée, surtout quand les données sont des données scientifiques. C'est tout l'enjeu du livre passionnant d'Edward R. Tufte, The Visual Display of Quantitative Information. C'est un « vieux » livre, dont la première édition date de 1982 (27 ans déjà !) et la seconde de 2001.

Ce livre est semble-t-il un grand classique de la représentation des données statistiques et ce n'est pas par hasard : il explique dans son texte et montre brillamment dans ses illustrations quels sont les règles pour faire des graphiques illustrant fidèlement des nombres ainsi que les pièges à éviter. Comment faire une illustration qui permette à son lecteur de comprendre des données numériques, géographiques ou autres, sans être trompé par ce graphique ?

Tufte construit son argumentation en deux parties. Dans la première il puise dans des sources historiques pour donner des exemples d'illustrations réussies ou complètement ratées[1].

Parmi ses exemples historiques, un exemple très parlant est cette carte de 1869 faite par le français Charles Joseph Minard illustrant le sort des armées napoléoniennes durant la campagne de Russie :

Taille des troupes napoléoniennes durant la campagne de Russie

Sur une même illustration sont représentées :

  • par l'épaisseur du trait, sa couleur et les annotations chiffrées, la taille des troupes napoléoniennes, de 422.000 hommes initialement à 10.000 hommes au retour de la campagne ;
  • par le positionnement spatial, les lieux de combat ou les événements marquants (voyez le franchissement de la Bérézina !) ;
  • par une correspondance verticale avec un graphique des températures, l'influence de la température.

Cette illustration est à la fois jolie à regarder, très parlante et historiquement fidèle.

Dans une seconde partie, il construit une théorie des graphiques de données (theory of data graphics) en donnant des règles à suivre et des explications pas à pas pour augmenter l'efficacité visuelle et la fidélité d'une illustration.

Un exemple de règle donnée par Tufte dans sa théorie des graphiques de données :

Erase non-data-ink, within reason

Ce que l'on pourrait traduire par :

Effacer l'encre sans information, avec discernement

L'idée dans cette règle est que chaque portion de noir ou de couleur dans un graphique doit apporter une information. Si elle n'en apporte aucune, il faut la supprimer. Et Tufte montre comment le faire. Par exemple en supprimant les grilles ou marques inutiles sur les axes. Mais là, il vous faudrait lire le livre pour vraiment comprendre par les exemples de Tufte. ;-) Et l'auteur va plus loin en montrant des formes originales de graphiques scientifiques.

Ce qui me passionne dans ce livre, c'est que Tufte applique à son livre les conseils qu'il donne. Son ouvrage est un véritable objet graphique, aussi agréable à lire qu'intéressant à comprendre. Tufte a dû s'auto-éditer pour obtenir le résultat qu'il désirait.

Cet ouvrage est un peu cher, 40€ pour 200 pages avec peu de texte et pleins d'images, ;-) mais à mon avis cela vaut l'investissement. Vous ne verrez plus ces immondes graphiques en camembert de la même façon ! :-)

Notes

[1] Par exemple, si une image est utilisée pour représenter une quantité, sa surface doit être proportionnelle à la quantité et non sa hauteur.