Un volume de données toujours plus grand
L’homme classe et quantifie des informations sous forme de tableaux depuis des siècles.
Les améliorations apportées à la technologie ont simplifié l’accès et la collecte de données, tandis que le web permet d’y accéder en continu.
Aujourd’hui, les bases de données sont de plus en plus volumineuses, on parle de “Big Data”.
Il s’agit d’une explosion quantitative de la donnée numérique. Les perspectives du traitement de ces données sont encore insoupçonnées. On évoque de nouvelles possibilités d’exploration de l’information : l’analyse tendancielle, climatique, environnementale, sociopolitique, de la sécurité et de la lutte contre la criminalité, de phénomènes religieux, culturel et politique.
Cette agrégation de données a entraîné la création d’un véritable écosystème économique impliquant les plus importants acteurs du secteur des technologies de l’information.
Cette richesse de données peut-être une mine d’informations pour aider à l’amélioration de la prise de décision, à la mise en évidence de constats, à la transmission d’idées plus claires, et à avoir un regard objectif sur notre environnement.
La Datavisualisation, c’est quoi ? Défintion
La datavisualisation est l’utilisation de représentations graphiques de données, interactives ou statiques, qui ont pour but d’amplifier les processus cognitifs. Ces processus sont :
- La perception
- La mémoire
- Le raisonnement
- L’apprentissage
Les représentations visuelles structurent le raisonnement des individus par le biais de la connaissance commune (comparaisons, quantités, formes, volumes) afin d’interpréter des données. Le traitement d’informations, complexes et/ou denses, est alors facilité, voir immédiat.
Les objectifs de la datavisualisation
La datavisualisation doit retenir l’intérêt de ses interlocuteurs, à travers une histoire.
Elle doit enrichir leur culture commune sur un thème caractérisé et identifiable. Elle a pour finalité de convaincre ses interlocuteurs, de les inviter à agir, de les éclairer, d’enrichir leurs connaissances ou de les inviter à se remettre en question sur une vision de la réalité grâce à des données rationnelles et objectives.
Les données sont une représentation de la vie réelle, tout est quantifiable. Indépendamment de son format, de son esthétisme, de sa présentation, la datavisualisation a pour objectif de montrer ce que les données ont à dire.
Finalement, l’objectif de la datavisualisation est de :
- Faire parler des données brutes
- Synthétiser les enjeux essentiels d’un set de données
- Traduire visuellement des données
Les modèles de représentations
Dans un premier temps, l’auteur d’une représentation de données doit vérifier la véracité des données collectées, quelque soit sa source d’approvisionnement. Vous pouvez embellir autant que vous voulez votre représentation, les données en sont l’essence.
L’auteur doit avoir un œil critique vis à vis de ses données, et définir un but graphique ainsi qu’un public cible.
La représentation, par l’intermédiaire de représentations cognitives, doit apporter une vision claire d’un constat. Vous pouvez ainsi créer une représentation claire et qui mérite que le lecteur y consacre de son temps.
Avec toutes les options de visualisation, il peut être difficile de déterminer quel graphique convient mieux à vos données. Voici une présentation des types de représentations et leurs usages.
Visualisation temporelle
Le temps est intégré à notre vie quotidienne, les choses changent et évoluent dans le temps.
La visualisation temporelle est donc une représentation très intuitive pour un public cible. Elle permet d’avoir un rapide aperçu général des données sur un temps donné.
Elle peut être utilisée comme un outil d’exploration au sein de sections temporelles.
Les variations temporelles sont la base de votre histoire. Pourquoi y a t-il tel ou tel pic ? Pourquoi y a t-il telle ou telle chute ? L’intérêt est de mettre en évidence les parties intéressantes de la représentation pour votre auditoire
Visualisation des proportions
Les données relatives aux proportions sont regroupées par catégories et sous-catégories.
Grâce au traitement des données par proportions, on cherche à avoir un maximum, un minimum et une distribution globale.
La visualisation des proportions représente les parties d’un tout. Chaque valeur individuelle a une signification particulière. Les proportions mettent en relation les données les unes entre les autres en conservant l’impression d’un tout.
Visualisation des relations
La recherche de relation entre les données peut-être un réel défi et nécessite une plus grande réflexion critique. Dans certains cas, elle peut révéler davantage d’informations. Vos données s’associent et interagissent entre elles et définissent l’histoire que vous allez raconter.
L’auteur doit chercher la corrélation entre différentes données et ainsi baser son histoire sur leur coexistence dans un environnement commun. Il faut chercher ce à quoi les données se réfèrent dans un contexte identifié. Puis, tirer des constats sur les relations qu’entretiennent ces données. Il faut donc méditer sur le contexte des données et les explications possibles sur tel ou tel constat déterminé.
Visualisation des différences
La comparaison d’une seule variable est plutôt aisée : “Une maison possède une surface plus grande qu’une autre”. Qu’en est-il, si il y a une centaine de maisons à classer ? Qu’en est-il si pour chacune des maisons, on doit considérer plusieurs variables, comme le nombre de chambre, la superficie du jardin ou le montant des impôts locaux ?
La comparaison devient plus complexe. D’où l’usage de la visualisation des différences permettant de comparer les variables essentielles d’un sujet donné et tirées d’un set de data beaucoup plus important.
Pour conclure
Le cerveau humain est capable de traiter une image 60 000 fois plus vite qu’un texte. Plus les données sont nombreuses et compliquées, plus il est donc intéressant de les traduire en visuels. En amont de la conversion des données en visuels, il faut sélectionner les données intéressantes, les plus justes et les plus importantes.
Aujourd’hui, la surcharge des données entraîne une confusion globale sur leur traitement.
Ces données sont éparpillées dans des feuilles de calcul, des bases de données, des espaces de stockage au sein de multiples services, sur Internet. Leur interprétation devient très difficile.
La comparaison, à travers des tableaux de données brutes, exige un effort d’abstraction et de mémoire qui n’est plus atteignable à partir d’un certain volume de données.
Le but de la datavisualisation est d’aller à l’essentiel et son enjeu est d’appuyer la prise de décision. Il est donc crucial d’être juste, précis et avant tout respectueux de la réalité.
Article rédigé par Rémi Longuechaud
Retrouvez le sur Twitter & Linkedin
Sources : Data visualisation—De l’extraction des données à leur représentation graphique. (Auteur(s) : Nathan Yau, Editeur(s) : Eyrolles)
Besoin d’accompagnement dans la collecte, le traitement, l’utilisation de la data ?
Faites vous accompagner par les experts data d’Axance.