Analyse du bayésianisme quotidien
Catégories: Réflexions personnelles
Tags: Bayésianisme
Je constate depuis un certain temps un décalage entre la manière dont j'aborde la question du raisonnement bayésien, et la manière dont il est abordé dans la communauté sceptique et rationaliste. Je vais avec ce billet profiter de la sortie de la dernière vidéo de Julia Galef, qui expose de manière claire sa conception de la question, pour mettre à plat ce décalage.
Bayésianisme « formel » ou « quotidien » ?
Comme vous avez pu le constater au fil de mes précédents billets, j'ai une approche des analyses bayésiennes très centrée sur les mathématiques. Face à une problématique que je cherche à analyser sous l'angle bayésien, mon approche est d'exprimer la question à l'aide du langage mathématique bayésien, et de l'étudier sur cette base, à l'aide des lois des probabilités. Dans ce billet, je vais nommer cette approche « bayésianisme formel ».
Cette manière de faire n'est bien évidemment pas quelque chose que l'on peut utiliser au jour le jour dans les situations de la vie courante. Elle requiert de prendre le temps, possiblement avec un papier et un crayon, de poser le raisonnement à plat. C'est une approche que l'on peut pratiquer chez soi lors d'un temps de réflexion, mais pas au milieu d'une discussion ou d'un débat. Julia Galef le constate également dans sa vidéo, en disant qu'elle ne prétend bien sûr pas faire des calculs bayésiens mathématiques de tête en permanence.
Elle met en avant une conception plus simple de la pensée bayésienne, inspirée de la loi de Bayes (plutôt que l'appliquant formellement), et axée sur deux principes fondamentaux :
- Dans tous les contextes, avoir en tête une qualification de ses degrés de croyance (« je trouve ça plausible », « j'en doute », « le contraire me surprendrait », etc...) voire si possible une quantification (« j'y crois à 50% », « à 99.9% », « à 1% », etc...).
- Lorsqu'on considère une nouvelle information, toujours considérer à quel point cette information soutient nos opinions et les opinions contraires.
Cette conception est effectivement un reflet immédiat de la notion de probabilité, et du théorème de Bayes. Je vais la nommer « bayésianisme quotidien » pour la différentier du bayésianisme formel, reflétant le fait qu'elle a vocation à être appliquée dans la vie de tous les jours. Il me semble que cette conception est également celle largement présentée et défendue dans les communautés sceptiques francophones.
Julia Galef met également l'accent sur le fait que ces deux principes fondamentaux ne correspondent généralement pas (ou mal) à nos mécanismes de pensée naturels. Décrivant notamment que :
- Si la plupart des gens savent reconnaître leur incertitude dans les sujets techniques qu'ils ne connaissent pas, ils sont généralement beaucoup moins enclins à reconnaître la possibilité qu'ils se trompent sur les sujets avec des enjeux sociaux et politiques.
- La plupart des gens, face à une nouvelle information, essaient juste de trouver un moyen de rendre cette information cohérente avec leur vision du monde, et donc ne remettent jamais cette vision du monde en question.
Le bayésianisme quotidien, comme pratique volontaire, se présente donc comme un moyen de lutter contre ces biais de la pensée humaine.
L'interconnexion des croyances bayésiennes
Ce qui m'intéresse dans ce billet, c'est de voir comment cette construction du bayésianisme quotidien se compare à une analyse plus formelle, et malheureusement, il va être difficile de faire une comparaison point par point, car tout est entremêlé et intriqué. Attachez donc vos ceintures ! Je vous rassure, il y aura peu de mathématiques.
La difficulté majeure et centrale qui ressort quand on fait une analyse bayésienne formelle, c'est l'interdépendance des croyances. En effet, dès lors qu'on s'attaque à analyser l'impact d'une nouvelle information sur un ensemble de croyances, et non pas sur une seule croyance, le théorème de Bayes a une fâcheuse tendance à tout entremêler et tout lier ensemble.
Par exemple, considérons un ensemble de croyances épistémiques $C_1, C_2, \dots C_N$, et mettons pour avoir un point de départ le plus simple possible que j'ai un a-priori indépendant sur elles :
\begin{equation} p(C_1, C_2, \dots C_N) = p(C_1) p(C_2) \dots p(C_N) \end{equation}
La prise en compte d'une observation $\mathcal{O}$ par le théorème de Bayes nous donne alors :
\begin{equation} p(C_1, C_2, \dots C_N | \mathcal{O}) = \frac{p(\mathcal{O} | C_1, C_2, \dots C_N)}{p(\mathcal{O})} p(C_1, C_2, \dots C_N) \end{equation}
Et en général, l'a-posteriori, $p(C_1, C_2, \dots C_N | \mathcal{O})$ est une probabilité compliquée dans lesquelles les croyances sont liées entre elles. Elle pourrait par exemple refléter que, sachant $\mathcal{O}$ alors la croyance hésite entre d'une part $C_1 \text{ ET } C_3 \text{ ET } \neg C_4$ et d'autre part $\neg C_1 \text{ ET } C_2 \text{ ET } \neg C_3$. Dans cet exemple j'ai pris des croyances binaires par soucis de simplicité : si on prend en compte des croyances nuancées, prenant en compte des degrés différents (de taille d'effet, de souhaitabilité, etc...), cela devient encore plus compliqué.
Partant de là, il devient difficile de simplement parler de l'impact de $\mathcal{O}$ sur la croyance $C_2$, car cette croyance est alors interconnectée avec les autres. Cet aspect d'interconnexion des croyances est un point fondamental contre lequel se heurte la recherche en modèles bayésiens. Dans le cas général, il s'agit même d'un problème NP-difficile, pour lequel on est donc loin d'avoir une méthode permettant de faire ces calculs.
Bayésianisme quotidien et interconnexion
Quel rapport avec la choucroute, me direz-vous ? Et bien de mon point de vue, cette interconnexion de croyances est ce qui fait à la fois la puissance et la difficulté des raisonnements bayésiens. Et là où je n'adhère pas au bayésianisme quotidien tel que présenté dans la première section, c'est qu'il a tendance à traiter les croyances comme si elles n'étaient pas interconnectées. Pour reprendre l'image des curseurs d'Hygiène Mentale, alors l'exigence de cohérence bayésienne veut dire que bouger un curseur va, dans la plupart des cas, impliquer d'en bouger de nombreux autres en même temps. Et à mon sens garder ça en tête change beaucoup de choses.
Pour appuyer mon propos, je vais dans la section suivante reprendre les deux affirmations précédentes sur les « biais de la pensée humaine » contre lesquels le bayésianisme quotidien affirme lutter, pour montrer en quoi ces comportements « biaisés » sont justifiables dans un cadre bayésien qui prend en compte cette interconnexion.
Une vision du monde cohérente
Dans cette vision interconnectée, le super-pouvoir du théorème de Bayes est notamment l'élimination de croyances contradictoires. En effet si une observation $\mathcal{O}$ est en contradiction avec le fait d'entretenir à la fois les croyances $C_1$ et $C_2$, alors le théorème de Bayes produira nécessairement $p(C_1 \text{ ET } C_2 | \mathcal{O}) = 0$ : l'observation $\mathcal{O}$ rend les croyances $C_1$ et $C_2$ contradictoires entre elles. Cette aversion pour les croyances contradictoires est une conséquence attendue des probabilités bayésiennes, qui est une théorie construite avant tout sur des exigences de cohérence.
Cette aversion peut être mise en parallèle avec le phénomène de dissonance cognitive, qui a lieu quand on se rend compte que certaines de nos croyances ou actions sont contradictoires entre elles, ou avec l'image qu'on se fait de nous-mêmes. De manière générale, pour pouvoir simplement fonctionner dans la vie, nous avons besoin d'avoir une vision et une compréhension du monde relativement cohérente. On ne peut pas entretenir dans sa tête une superposition de deux (ou plus !) visions du monde qui soient profondément contradictoires entre elles en se disant qu'on a pas assez de preuves pour trancher. Ce type d'exercice mental est réservé à des entités théoriques toutes puissantes comme la pure bayésienne de Lê, ou bien doit être exécuté dans un contexte restreint, comme lorsque des scientifiques considèrent plusieurs modèles ou théories différentes pour étudier un même phénomène.
Nos différentes croyances sont plus ou moins interconnectées avec cette vision du monde, en fonction de nos vécus et de nos valeurs. S'il est facile de remettre en question une croyance qui est marginale dans ce réseau, la question est beaucoup plus complexe quand il s'agit d'une croyance qui en est au cœur.
Face à une observation $\mathcal{O}$ qui rentre en contradiction avec une croyance qui est au cœur de notre vision du monde, il y a plusieurs moyens de résoudre cette tension :
- Rejeter la validité de $\mathcal{O}$. Ça peut être une fake news, une tentative de tromperie, ou une mécompréhension.
- Constater que la contradiction vient d'une petite erreur dans notre vision du monde, qui peut être facilement corrigée.
- Abandonner complètement sa vision du monde.
La troisième option est un acte très fort, et qui demande un travail profond, car elle implique de reconstruire une nouvelle vision du monde, qui soit plus cohérente que la précédente. Il est donc parfaitement naturel de d'abord investiguer si la solution ne réside pas dans une des deux premières options avant de la considérer. Et on peut avec le temps aboutir à une nouvelle vision du monde radicalement différente, à force d'accumuler des petites modifications.
La prise en compte de l'interconnexion des croyances donne donc une explication parfaitement sensée d'un point de vue bayésien à ces comportements, qu'il me semble donc difficile d'honnêtement qualifier de « biais de raisonnements » qu'il faudrait corriger.
Des convictions politiques
L'autre critique mise en avant par Julia Galef est la tendance des personnes à avoir des opinions politiques très tranchées, où il n'y a pas de place pour l'incertitude et la remise en question. De là, je comprends deux critiques : avoir des opinions politiques très tranchées ne serait pas bayésien, et ce serait particulièrement répandu dans la population.
Concernant la seconde critique, on peut être tenté de répondre par un sarcastique « Source ? ». En effet, Julia Galef ne cite pas d'études scientifiques sur la question, et les réponses qu'elle a pu donner sur Twitter à sa vidéo me laisse l'impression qu'elle se base principalement sur son expérience personnelle. Néanmoins, j'admets volontiers que je partage cette expérience : la plupart des personnes que j'ai pu voir s'exprimer sur des questions sociales et politiques ont des opinions tranchées à ce sujet.
Mais c'est également le cas concernant l'efficacité des vaccins, et leurs bénéfices. La plupart des personnes que j'ai vu s'exprimer à ce sujet ont une opinion tranchée sur cette question. Je peux dire la même chose sur la question des énergies renouvelables et du nucléaire par exemple. Pour moi, on est là dans une situation classique de biais d'échantillonnage : les personnes qui s'expriment le plus volontiers sur un sujet sont justement les personnes qui ont une opinion la plus fermement formée sur ce sujet. Quand on a une opinion incertaine, on a plus tendance à ne pas en parler, ou alors si on en parle c'est plus pour poser des questions que pour affirmer quelque chose. Personne ne va chercher à publier une tribune dans un journal pour dire « Quand même, ce sujet est compliqué, je suis pas sûr de quoi en penser. ».
L'observation de personnes, même nombreuses, ayant des opinions politiques très tranchées n'est donc qu'un argument très faible en faveur de l'affirmation que ça serait une caractéristique très répandue dans la population. Au contraire, il semble qu'une part importante de la population ne s'exprime ouvertement qu'à propos des questions qui la touchent directement [1, 2, 3].
Des idéologies et de la cohérence
Mais je vais également m'attarder sur le premier aspect de la critique, comme quoi avoir des opinions politiques très tranchées ne serait pas bayésien. Pour ce faire, je vais encore une fois m'appuyer sur l'interconnexion des croyances.
Qu'est-ce qu'une idéologie politique ? Loin d'un pack d'opinions prêtes-à-penser qu'on adopterait sans réfléchir, comme certains aiment à présenter le terme, une idéologie politique est avant tout une vision du monde. Une théorie politique développe un angle de compréhension et d'analyse de l'organisation de la société, ainsi qu'une proposition de comment l'améliorer, sur la base de valeurs qu'elle met en avant.
De même sur nos visions du monde internes, les idéologies cherchent également fortement une cohérence interne au fil de leurs élaborations et raffinements. Ce faisant, au fur et à mesure qu'une personne se renseigne sur les différentes idéologies existantes, sur les philosophies politiques qui les sous-tendent, il n'est pas surprenant qu'elle finisse par constater que certaines de ces idéologies s'alignent mieux avec sa vision personnelle du monde que d'autres, et qu'elle embrasse les conclusions et revendications politiques de ces idéologies.
Au contraire, la position qui voudrait picorer entre les idéologies pour « ne garder que le bon de chacune » se retrouve donc à dépouiller ces revendications de ce qui leur donne un sens : la cohérence interne. D'un point de vue bayésien, c'est une position qui ne me semble tenable qu'associée à une méconnaissance des différentes idéologies : on adopte alors des revendications justifiées par des visions du monde contradictoires entre elles. Ce manque de cohérence fait qu'on se retrouve finalement difficilement capable de justifier de manière construite et précise pourquoi on défend ces revendications.
Le mot de la fin
Je me suis focalisé dans ce billet sur une analyse « bayésienne formelle » de ce que j'ai nommé le bayésianisme quotidien, et sur pourquoi je n'adhère pas à cette tendance des milieux sceptiques, pour des raisons que je considère comme bayésiennes. D'une part la justification de sa nécessité ne m'apparaît pas convaincante, mais ses principes qui tendent à traiter les croyances comme individuelles et non interconnectées me semblent justement aller à l'encontre du principe fondamental du bayésianisme qu'est l'exigence de cohérence.
Il y a d'autres critiques à faire sur la tendance à considérer que les gens en général ne raisonnent pas bien et qu'il faudrait qu'on apprenne à le faire mieux, mais n'étant pas qualifié pour les faire, je ne peux que vous renvoyer vers les billets de Zet-Ethique Métacritique, notamment leur série d'articles Les gens pensent mal : le mal du siècle ?, mais également le reste du blog.