MB 00: Enjeux de la modélisation bayésienne
J'entame une série sur la Modélisation Bayésienne, où je compte explorer les enjeux pratiques liées à l'utilisation de modèles bayésiens. Il s'agit de présenter les outils existants, leurs compromis, et les questionnements que lève leur utilisation, en fonction du contexte. Ce billet introduit cette série, en donnant une vue d'ensemble de sujet et de la manière dont je compte l'aborder.
Pour commencer, posons bien le contexte. Je ne vais pas ici m'intéresser à un hypothétique agent bayésien parfait pour essayer de prédire comment il se comporterait. Je vais plutôt adopter une approche assez terre-à-terre : mettons que vous soyez très motivé⋅e⋅s à tirer au clair un certain sujet. Il s'agit d'un sujet dans le cadre duquel vous avez des décisions importantes à prendre, et vous voulez prendre ces décisions avec la meilleure information possible. Vous avez décidé de faire ceci avec un raisonnement bayésien le plus rigoureux possible, et êtes prêt⋅e⋅s à remplir des feuilles de calcul Excel s'il le faut. Alors donc, comment allez-vous vous y prendre, en pratique ? C'est ce thème que je veux explorer dans cette série.
La modélisation bayésienne, en pratique
Pour ça, on va se plonger dans ce qu'on appelle en mathématiques la modélisation bayésienne, et le travail se compose de deux grandes étapes : la modélisation puis l'inférence.
La modélisation va consister à choisir comment représenter mathématiquement le problème du monde réel qui nous intéresse. Notre problème se compose de questions, d'informations, de connaissances, d'hypothèses, de compromis… Pour lui appliquer les outils bayésiens il faut traduire tout ceci en langage mathématique. Il n'y a en général pas une unique manière de le faire, et nos choix de représentation auront un impact sur nos conclusions.
L'inférence consiste à « faire les calculs ». Une fois la représentation mathématique choisie, la réponse bayésienne se présente sous la forme d'un ensemble de probabilités, qu'il faut bien calculer. Or, il se trouve que dès que l'on s'éloigne des problèmes les plus simples, ces calculs ne sont pas faciles à réaliser, même à l'aide de puissants ordinateurs. On est donc souvent contraint⋅e⋅s de faire des approximations, car attendre 7.5 millions d'années pour avoir la réponse est rarement une option réaliste.
Comme vous pouvez vous en douter, ces deux étapes ne sont en réalité pas indépendantes : la complexité de la modélisation va généralement largement déterminer la difficulté de la tâche d'inférence. On se retrouve donc globalement à chercher un compromis entre un calcul approché sur un modèle fidèle et un calcul exact sur un modèle approximatif. Il est donc important de bien comprendre quelles approximations ont été faites à ces deux étapes si on veut être capable d'interpréter le résultat final du calcul bayésien, faute de quoi on risque de donner trop de confiance à un résultat sans savoir quel est son domaine de validité ou son degré de précision.
Vue d'ensemble de la série de billets
Dans cette série de billets, je compte donc explorer les outils dont on dispose pour ces deux tâches, leurs forces, leurs faiblesses et leurs compromis. Je commencerai tout d'abord par les méthodes d'inférence, en supposant que l'on dispose déjà d'un modèle « vrai ». Puis dans un second temps, je reviendrai explorer les enjeux de la modélisation à la lumière de contraintes que nous impose l'inférence.
Je choisis de traiter les sujets dans cet ordre là car je pense qu'il est très important tout au long de la conception d'un modèle bayésien de garder en tête la manière dont on abordera ensuite l'étape d'inférence. Sans ça, il est très facile de concevoir des modèles pour lesquels il est en pratique impossible de faire une inférence satisfaisante, voire pire, pour lesquels il est impossible de savoir si notre approximation de l'inférence est bonne ou non. Dans ces cas le résultat est alors totalement inutilisable, et on pourrait tout aussi bien prendre nos décisions à pile ou face.
Je tâcherai d'organiser cette série en billets relativement courts, chacun traitant d'un point précis, pour la rendre la plus digeste possible. Il ne sera pas possible de totalement éviter les mathématiques, mais je tâcherai de les vulgariser autant que possible, et de m'assurer que le message général de chaque billet reste compréhensible sans se plonger dans les détails les plus techniques.
Sur ce, à bientôt pour le premier billet, où on commencera à poser le cadre : qu'est-ce qu'un modèle bayésien, et comment travaille-t-on avec ? 🙂