Une brève introduction à l’analytique visuelle

Lors du salon Big Data & IA Paris 2021, Selma Nebia, Ingénieure solutions au sein de Tableau, a présenté les principes clés de l’analytique visuelle. C’est un procédé qui permet notamment aux Métiers, non experts du Big Data, de tirer des conclusions à partir de données brutes. Il s’agit donc d’un concept intéressant dans la démarche de la démocratisation du Big Data.

Les tableaux de données brutes : un outil difficile à exploiter

Pour la plupart des humains, parcourir un grand tableau est une tâche laborieuse. En effet, cela demande un effort de mémoire,  le lecteur ayant tendance à oublier les valeurs qu’il a lues à mesure qu’il en lit de nouvelles.

Il est donc nécessaire de synthétiser les données pour les rendre plus digestes, et donc plus interprétables.

Les statistiques : une forme de synthèse à manipuler avec prudence

Les statistiques sont une manière de synthétiser les données. Elles ajoutent cependant un niveau d’abstraction, et peuvent être trompeuses. Il faut donc les manipuler avec prudence.

En 1973, le statisticien Francis Anscombe met en évidence le phénomène en construisant le Quartet d’Anscombe : un ensemble de données partageant les mêmes propriétés statistiques, mais ayant des représentations graphiques très différentes.

Quartet d'Anscombe

En effet, les nuages de point mettent en évidence des patterns et des valeurs aberrantes. Ces informations sont gommées si l’on se fie aux statistiques ou à une régression linéaire avant d’avoir affiché les données brutes. D’où l’importance de visualiser les données avant de les analyser !

Plus récemment, en 2016, Alberto Cairo a fait sensation sur Twitter en produisant un graphique en forme de dinosaure. Là encore, il est laborieux d’imaginer un dinosaure en lisant les données dans un tableau, impossible de le savoir en regardant les statistiques, mais complètement évident en regardant le nuage de point !
Dans le même esprit que le Quartet D’Anscombe, douze graphiques partageant les mêmes propriétés statistiques que ce dinosaure ont été produits. Ils sont disponibles, ainsi que de nombreux autres exemples illustrant le propos, sur le site d’Autodesk.

En bref, faites des graphes !

La visualisation des données : une synthèse basée sur les attributs pré-attentifs

Il existe de multiples manières de représenter les données, certaines sont plus adaptées que d’autres selon l’objectif de la visualisation. Par exemple, dans le cas d’une donnée quantitative, il est plus facile de comparer des longueurs que des surfaces.

Ces caractéristiques font partie des attributs pré-attentifs. C’est-à-dire, les informations comprises par la partie du cerveau qui gère le traitement visuel. Cela implique que ces informations sont disponibles avant même le début de la réflexion. Elles sont ainsi interprétées immédiatement avant d’aller plus loin dans les besoins d’analyse.

Voici quelques exemples d’attributs pré-attentifs à prendre en compte.

Une visualisation pertinente utilise à bon escient les attributs pré-attentifs. Voici les  recommandations fournies par Tableau au cours de la conférence.

Pertinence des attributs pré-attentifs selon le type de données à représenter d'après Tableau

Quelques exemples illustrés ci-dessous. 

L’analytique visuelle : une méthode d’analyse basée sur la visualisation

La visualisation de données peut jouer un rôle majeur dans leur compréhension. Tableau va plus loin en nous présentant la notion d’analytique visuelle. Il ne s’agit plus seulement de voir les données à disposition, mais également de comprendre pourquoi les données sont ce qu’elles sont.

La notion semble abstraite à première vue. Heureusement, un cas d’usage concret nous a été présenté au cours d’une démonstration de la version SaaS de Tableau. 

Tableau est une plate-forme de visualisation et d’exploration des données. Elle a pour objectif d’aider les utilisateurs à voir et comprendre leurs données.

Le cas d’usage concerne une entreprise fictive de vente de meuble cherchant à maximiser ses profits.
Un dashboard présentant le profit selon un code couleur a été préparé.

Grâce à ce code couleur (attributs pré-attentifs : teinte et intensité) nous remarquons que les profits sont négatifs pour certains produits et certains pays en un coup d’œil.

Au clic sur un pays, les autres graphiques s’adaptent instantanément. En effet, les données représentées ne concernent plus que le pays en question. Les visualisations obtenues suggèrent alors une corrélation négative entre le profit et le nombre de ventes.

Les experts fonctionnels Métier, identifient alors un facteur qui pourrait faire diminuer les profits : les promotions. 
Afin d’interroger les données sur cette hypothèse, une autre visualisation est générée. Il s’agit d’un nuage de points représentant pour chaque commande, le profit généré et la promotion moyenne.

En ajoutant cette nouvelle vue au dashboard et en cliquant sur un pays dont le profit est négatif, l’utilisateur voit alors de nombreuses commandes dont la promotion moyenne est aux alentours de 50% et génère ainsi un profit négatif.

Ainsi, par le biais de l’analytique visuelle, nous avons obtenu des éléments de compréhension sur la question suivante :
“Pourquoi observe-t-on une corrélation négative entre vente et profits dans certains pays ?”

Pour plus d’informations sur l’outil qui a permis de mener cette analyse, rendez-vous sur Tableau.com

TL;DR:

Notre système cognitif a évolué de manière à délivrer une première interprétation de ce que nous voyons, avant même de commencer toute analyse.

La connaissance de ce phénomène permet de paramétrer des visualisations en choisissant les attributs pré-attentifs les plus efficaces.
En outillant ce procédé, l’analyse et l’exploitation des données devient alors intuitive pour le métier.

Lisible et efficace, le Big Data trouve son sens et permet au métier d’orienter l’entreprise dans la bonne direction.