mercredi 11 novembre 2020

Cinq erreurs commises par les gens lors du partage de visualisations de données COVID-19 sur Twitter

Selon une étude menée par Indiana University publiée sur Informatics, les chercheurs ont analysé le partage de visualisations de données sur Twitter, par des experts de la santé et des citoyens moyens - au cours de la lutte initiale pour saisir la portée de la pandémie COVID-19 et ses effets sur la société. De nombreux utilisateurs de médias sociaux continuent de rencontrer des graphiques et des graphiques similaires chaque jour, d'autant plus qu'une nouvelle vague de cas de coronavirus a commencé à augmenter à travers le monde.

Les travaux ont révélé que plus de la moitié des visualisations analysées des utilisateurs moyens contenaient l'une des cinq erreurs courantes qui réduisaient leur clarté, leur précision ou leur fiabilité.

Pour l'étude, les chercheurs ont exploré Twitter afin d'identifier 5 409 visualisations de données partagées sur le réseau social entre le 14 avril et le 9 mai 2020. Parmi celles-ci, 540 ont été sélectionnées au hasard pour analyse, avec une analyse statistique complète réservée à 435 visualisations en fonction de critères supplémentaires. Parmi ceux-ci, 112 ont été fabriqués par des citoyens moyens.

De manière générale, les chercheurs ont identifié cinq écueils communs aux visualisations de données analysées. En plus d'identifier ces problèmes, les auteurs de l'étude proposent des étapes pour surmonter ou réduire leur impact négatif:

Méfiance: plus de 25% des publications analysées n'ont pas réussi à identifier clairement la source de leurs données, semant la méfiance quant à l'exactitude. Ces informations étaient souvent obscurcies en raison d'une conception médiocre (comme de mauvais choix de couleurs, une mise en page chargée ou des fautes de frappe) et non par une obfuscation intentionnelle. Pour surmonter ces problèmes, les auteurs de l'étude suggèrent d'étiqueter clairement les sources de données et de placer ces informations sur le graphique lui-même plutôt que sur le texte d'accompagnement, car les images sont souvent dissociées de leur publication d'origine lors du partage social.

Raisonnement proportionnel: onze pour cent des publications présentaient des problèmes liés au raisonnement proportionnel, qui se réfère à la capacité des utilisateurs à comparer des variables en fonction de ratios ou de fractions. Comprendre les taux d'infection à travers différentes zones géographiques est un défi de raisonnement proportionnel, par exemple, car des nombres similaires d'infections peuvent indiquer des niveaux de gravité différents dans des contextes à faible population par rapport à forte population. Pour surmonter ce défi, les auteurs de l'étude suggèrent d'utiliser des étiquettes telles que le nombre d'infections pour 1000 personnes pour comparer des régions avec des populations disparates, car cette métrique est plus facile à comprendre que des chiffres ou des pourcentages absolus.

Raisonnement temporel: les chercheurs ont identifié 7% des publications présentant des problèmes liés au raisonnement temporel, qui se réfère à la capacité des utilisateurs à comprendre le changement au fil du temps. Celles-ci comprenaient des visualisations comparant le nombre de décès dus à la grippe au cours d'une année complète au nombre de décès dus à la COVID-19 en quelques mois, ou des visualisations qui ne tenaient pas compte du délai entre la date de l'infection et les décès. Les recommandations pour résoudre ces problèmes comprenaient des mesures de rupture qui dépendent d'échelles de temps différentes dans des graphiques séparés, au lieu de transmettre les données dans un seul graphique.

Biais cognitif: un petit pourcentage de messages (0,5%) contenait du texte qui semblait encourager les utilisateurs à mal interpréter les données en fonction des «préjugés liés à la race, au pays et à l'immigration» du créateur. Les chercheurs affirment que les informations doivent être présentées avec des descriptions claires et objectives soigneusement séparées de tout commentaire politique qui l'accompagne.

Malentendu sur le virus: deux pour cent des visualisations étaient basées sur des malentendus sur le nouveau coronavirus, tels que l'utilisation de données liées au SRAS ou à la grippe.

Les chercheurs ont également révélé que certains types de visualisations de données étaient les plus performants sur les réseaux sociaux. Les visualisations de données montrant des changements au fil du temps, telles que des graphiques en courbes ou en barres, étaient le plus souvent partagées. Ils ont également constaté que les utilisateurs s'engageaient plus fréquemment avec des graphiques indiquant le nombre de décès plutôt que le nombre d'infections ou l'impact sur l'économie, ce qui suggère que les gens étaient plus intéressés par la létalité du virus que par ses autres effets négatifs sur la santé ou la société.

Aucun commentaire:

Enregistrer un commentaire