-
Distinguer causalité et corrélation pour ne pas se faire manipuler
Corrélation et causalité sont des notions très importantes en sciences sociales. Il est donc important de les distinguer.
La causalité est liée à la notion de cause et effet. Elle permet donc d'expliquer des faits. Ainsi, une relation de causalité entre A et B (A cause B) implique que tout changement dans A provoque un changement dans B.
Ce n'est pas le cas de la corrélation qui ne fait qu'établir un lien entre deux faits, sans préciser de quelle nature est ce dernier. Elle constate simplement que deux variables A et B évoluent de façon similaire. Et donc que pour une certaine valeur de A, on peut s’attendre à trouver certaines valeur de B.
Contrairement à ce que l'on pense souvent, le fait que deux variables soient "fortement corrélées" ne démontre pas qu'il y ait une relation de causalité entre l'une et l'autre. L'argument fallacieux peut être résumé ainsi : l'événement A est corrélé à l'événement B ; donc A cause B. Or on ne peut conclure sur la causalité après avoir constaté la corrélation alors qu'il y a au moins quatre autres possibilités :
- B peut être la cause de A.
Ainsi, il est par exemple maintenant bien établi qu'historiquement les variations de température sont étroitement liées aux variations de concentration de gaz carbonique dans l'atmosphère. Mais on ne peut faire l'économie de comprendre par la théorie si c'est le réchauffement qui crée l'excès de gaz carbonique, ou l'inverse ; - un troisième facteur inconnu peut être la cause de A et de B.
Ainsi, une étude statistique a montré un lien positif entre l’utilisation de crème solaire et le risque de cancer de la peau. Des journalistes pressés en avaient conclu un peu vite à la nocivité de la crème solaire alors que "utilisation de crème solaire" et "cancer de la peau" n’étaient que la conséquence d’une même cause : l’exposition au soleil (la variable explicative cachée) ; - une simple coïncidence qui n'a aucun signification statistique (par exemple : il n'y a pas d'autre relation entre A et B à part qu'ils se sont produits au même moment ou dans le même lieu).
Il est alors impossible d'avancer des explications rationnelles pour les relier (ou alors de manière capillotractée, pour par exemple arriver à expliquer pourquoi les pays du Nord de l'Europe connaissent une sur-représentation des groupes de Métal...) ; - B peut être la cause de A et en même temps A être la cause de B ; le système se renforce lui-même, ce qui contredit que seul A cause B (la conclusion du sophisme est dans ce cas incomplète).
Une étude anglaise a prouvé que les gens habitant près de pylônes à haute tension étaient significativement plus souvent malades que le reste de la population. Est-ce la faute du courant électrique ? Ce n'est pas évident parce qu'une autre étude a révélé que les habitants sous les pylônes étaient en moyenne plus pauvres ; et on sait les liens santé-pauvreté…
Le souci, c'est que confondre corrélation et causalité permet souvent soit de ne pas montrer certains problèmes politiques et économiques, soit de manipuler les gens dans un but marchand ou économico-politique. Voici trois exemples symptomatiques.
Prénoms et mentions TB au bac : comment ne pas trop parler des inégalités scolaires
Voici un exemple de la confusion entre corrélation et causalité créée par certains médias qui aiment les raccourcis racoleurs : "Quels sont les prénoms qui réussissent au bac ?" demandait le journal "gratuit" 20 minutes en avril 2013. Et il commençait pas répondre : "Prénommer votre enfant Madeleine, Côme ou Irène ne suffira pas à lui garantir une mention «Très bien» au bac dans 18 ans. Mais s'il travaille assidûment, il pourrait retrouver de nombreux homonymes à ses côtés dans le tableau d'honneur, selon un sociologue des prénoms. Plus de 25 % des Madeleine, Irène, Côme et Ariane qui ont passé le baccalauréat 2012 ont reçu une mention «très bien». Plus d'une Marie-Anne, d'une Anne-Claire et d'un Gaspard sur cinq également. En outre, à ces prénoms sont associés relativement peu d'échecs au bac, seules 3 % des Madeleine devant par exemple passer l'oral de rattrapage."
En fait, ce sociologue, Baptiste Coulmont, explique que son "objectif est de voir si, à partir de prénoms, on peut reconstituer un espace social assez proche de celui dessiné par les catégories socio-professionnelles." Coulmont rappelle que "la réussite scolaire est, en partie, liée à (l')origine sociale : Parmi les élèves entrés en sixième en 1995, 71,7% des enfants d’enseignants ont finalement décroché en 2010 un bac général, 68,2% des enfants de cadres supérieurs, 20,1% des enfants d’ouvriers qualifiés, 13% des enfants d’ouvriers non qualifiés, et 9,2% des enfants d’inactifs". Ce que montrent ses études, c'est que "le prénom est le reflet indirect de l'origine sociale", et que si "l’on trouve surtout des prénoms de fille (pour l'obtention de la mention TB, il y a sans doute deux raisons). L’explication de départ est que les filles réussissant mieux que les garçons à l’école, elles reçoivent aussi, plus souvent que les garçons, des mentions TB. Une autre explication s’intéresse aux prénoms eux-mêmes : les prénoms des garçons choisis par les parents de “classes supérieures” sont peut-être moins socialement clivants que les prénoms de filles." En clair, Ulysse, Guillemette, Quitterie, Madeleine, Anne-Claire, Ella, Sibylle, Marguerite, Hannah, Irene, Octave, Domitille sont des prénoms donnés à des enfants dont les parents appartiennent à des PCS (Professions et Catégories Socioprofessionnelles) supérieures et ceux-ci réussissent mieux leurs études que les Asma, Sephora, Hakim, Kimberley, Assia, Cynthia, Brenda, Christian, Bilal, Brian, Melvin, Johann, Eddy, et Rudy, enfants de parents faisant partie de PCS défavorisées.
Bref, contrairement à ce veulent faire croire certains, cette étude de Coulmont "n'est pas magique" : il n'existe qu'une simple corrélation entre prénom et mention au bac. En revanche, c'est bien une causalité qui lie niveau socio-économique et mauvais résultats scolaires - ce qu'expliquaient déjà en 1964 Pierre Bourdieu et Jean-Claude Passeron dans leur étude sociologique Les Héritiers et ce que montrent toujours les études actuelles, par exemple celle de Camille Peugny dans Le destin au berceau ou celle de Pisa : "Avec la Nouvelle-Zélande, la France est le pays riche au sein duquel les origines sociales des élèves ont l’impact le plus fort sur leurs résultats".
Petit déjeuner et réussite scolaire : comment vendre ses produits
Voici un exemple de confusion volontaire : selon une étude de 2012, les enfants qui mangent au petit déjeuner manquent moins l'école que les autres et ont de meilleurs résultats en mathématiques.Pour améliorer les résultats scolaires, il suffirait donc de faire petit-déjeuner tous les enfants... Problème : aucun élément ne prouve cette causalité. En étudiant les résultats de cette étude, tout ce que les chercheurs peuvent dire, c’est que manger le matin améliore les performances des élèves sous-nourris... Logique ! Le vrai facteur est qu’il y a corrélation entre les enfants qui mangent un petit-déjeuner et un absentéisme moindre. Le lien de causalité entre absentéisme et résultat scolaires est bien établi. Il est beaucoup plus facile de conjecturer un lien de causalité cohérent entre petit-déjeuner et absentéisme moindre (les enfants sont réveillés, leurs parents sont là, et donc les chances de présence à l’école à l’heure sont plus élevées, par exemple), qu’entre petit-déjeuner et résultat scolaire directement (ils auraient plus d’énergie pour tenir jusqu’au déjeuner, et donc l’utiliseraient pour étudier mieux… ?).
Cette confusion que font la plupart des gens entre causalité et corrélation est à la base d’un nombre ahurissant de campagnes publicitaires plus ou moins déguisées, comme celle-ci, puisqu'il s'agit d'une étude... sponsorisée par Kellogs et Weightwatchers...
Taux de chômage et protection de l'emploi : comment convaincre les gens qu'il faut moins de protection
En 2013, Natixis (banque de financement, de gestion et de services financiers du groupe BPCE, issue de la fusion des groupes Caisse d'épargne et Banque populaire), publiait dans un document un graphique et une conclusion montrant clairement que passer de la corrélation à la causalité ne pose pas de problème même quand il s'agit de faire des recommandations politiques importantes.
En effet, malgré une première phrase qui indique que sa conclusion est peu fiable et très idéologique, Natixis recommande de "réduire la protection de l'emploi" : "Nous ne prétendons pas avoir mené une étude complète ou scientifique. Nous montrons seulement que, sur l’échantillon de 18 pays de l’OCDE, une protection forte de l’emploi est associée à un taux d’emploi plus faible, à une progression de l’emploi plus faible et à un chômage plus élevé. Le dernier effet étant plus puissant que les deux premiers qui sont plus faibles ; ceci semble montrer qu’il est plutôt favorable de réduire la protection de l’emploi."
Ce discours néolibéral non "scientifique", se fondant sur une simple corrélation et aucune analyse digne de ce nom, est particulièrement savoureux quand on sait que lors de la crise de 2008, l'État français a dû soutenir pour plus de 7 milliards de d'euros le plan d'assainissement de Natixis et de ses actionnaires (les banques populaires et les caisses d'épargne pour l'essentiel) puisque, affectée par ses choix de gestion, notamment durant la crise des subprimes, l'action Natixis avait en moins de deux ans perdu près de 95 % de sa valeur...
Se préserver des confusions grâce au doute
"La confusion entre causalité et corrélation est fréquente à chaque fois qu’on étudie un phénomène qui ne se prête pas à l’expérience – autrement dit la plupart des sujets touchant à la sociologie, explique Rémi Sussan dans un article consacré aux biais liés à l'analyse du Big Data. Les multiples études cherchant à montrer les dangers ou au contraire les bénéfices de nouveaux médias, de jeux vidéos, etc., sont particulièrement susceptibles de tomber dans ce travers. Et cela ne concerne pas que les amateurs. On pense aux propos de la baronne Susan Greenfield, l’une des plus célèbres psychologues britanniques, lorsqu’elle affirma : “Je remarque d’un côté la montée de l’autisme et de l’autre l’usage d’internet. C’est tout”. Une affirmation si pseudoscientifique et péremptoire qui donna naissance à un tag twitter, #greenfieldism, qui a vu s’accumuler les affirmations les plus absurdes : “je remarque d’un côté le diabète et de l’autre les chats. C’est tout”. “Je remarque le réchauffement global et de l’autre le porno. C’est tout.” “Les allergies aux cacahuètes et les Kardashian ont connu simultanément une montée en puissance. Je suis sûr que ce ne peut être une coïncidence.“"
Pour éviter de confondre corrélation et causalité, le mieux est de s'adonner à l'examen critique des liens proposés et de vérifier leur nature. Pour ce faire, il peut être utile de lire et d'écouter des personnes pratiquant régulièrement la zététique qui mettent en avant le scepticisme scientifique et le doute cartésien. Celle-ci s'est d'abord présentée comme "l'étude rationnelle des phénomènes présentés comme paranormaux, des pseudosciences et des thérapies étranges". La zététique est destinée aux théories scientifiquement réfutables. Henri Broch décrit ce qu’il appelle la première la loi de la zététique : "ne pas prendre pour argent comptant tout ce que l’on veut bien nous dire, se donner du recul et, surtout, ne pas se priver de poser des questions, même si elles dérangent." Ceci n'implique évidemment pas de devenir un complotiste - ces derniers ont en effet tendance à oublier un point essentiel pour ceux qui exercent la zététique : "une information complète et contradictoire (est la) condition sine qua non d'une réappropriation des choix personnels et des engagements de tout individu souhaitant agir en connaissance de cause".
Un exemple de corrélation prise pour une causalité et démonté par l'observatoire zététique de l'université de Grenoble : l'annonce de la fin du monde pour le 21 décembre 2012, avec un beau poster informé et humoristique, fondé sur des liens de cause à effet : "la fin du monde ne peut pas arriver en 2012 puisqu'il existe des prédictions apocalyptiques postérieures"...
Tags : causalité, correlation, études, sociologie, politique, économie, publicité, Bourdieu, inégalités, néolibéral, Natixis, zététique
- B peut être la cause de A.
-
Commentaires