background preloader

Raisonnement Bayésien

Facebook Twitter

LA LOI DE BAYES (2/2) - L'inférence bayesienne pour les nuls - Argument frappant #3. LA LOI DE BAYES (1/2) - Argument frappant #3. An Example | STAT 414 / 415. Printer-friendly version Example A desk lamp produced by The Luminar Company was found to be defective (D). There are three factories (A, B, C) where such desk lamps are manufactured. A Quality Control Manager (QCM) is responsible for investigating the source of found defects. The QCM would like to answer the following question: If a randomly selected lamp is defective, what is the probability that the lamp was manufactured in factory C?

Now, if a randomly selected lamp is defective, what is the probability that the lamp was manufactured in factory A? Solution. And, the probability that a lamp was manufactured in factory B given that it is defective is: Note that in each case we effectively turned what we knew upside down on its head to find out what we really wanted to know! The probabilities P(A), P(B) and P(C) are often referred to as prior probabilities, because they are the probabilities of events A, B, and C that we know prior to obtaining any additional information. Bayes' Theorem. An Intuitive Explanation of Bayes' Theorem Bayes' Theorem for the curious and bewildered; an excruciatingly gentle introduction.

This page has now been obsoleted by a vastly improved guide to Bayes's Theorem, the Arbital Guide to Bayes's Rule. Please read that instead. Seriously. I mean it. Your friends and colleagues are talking about something called "Bayes' Theorem" or "Bayes' Rule", or something called Bayesian reasoning. It's this equation. So you came here. Why does a mathematical concept generate this strange enthusiasm in its students? Soon you will know. While there are a few existing online explanations of Bayes' Theorem, my experience with trying to introduce people to Bayesian reasoning is that the existing online explanations are too abstract. Or so they claim. And let's begin. Here's a story problem about a situation that doctors often encounter: What do you think the answer is?

Do you want to think about your answer again? Group 1: 100 women with breast cancer. E. Decibels? Théorème de Bayes. Bayes. Comprendre le théorème de Bayes – R-atique. Les modèles bayésiens viennent de faire une entrée subite et fracassante dans ma vie. Cela peut sembler étonnant car cela fait maintenant quelques années que le paradigme bayésien connaît un grand succès chez (notamment) les écologues, peut-être du fait des problèmes qu'ils connaissent avec les modèles inférentiels plus classiques (problèmes liés aux données manquantes ou trop peu nombreuses, aux distributions non gaussiennes, aux difficultés d'ajustement des modèles, à l'importance des erreurs, etc.).

Avec ce billet sur le théorème de Bayes, je souhaite entamer une série de billets relatifs aux modèles bayésiens. J'aimerais notamment expliquer leur principe, montrer leurs avantages et inconvénients, et montrer (aussi succintement que possible) comment les construire, les ajuster, et les interpréter sous R. Le théorème de Bayes est le suivant: Il exprime la probabilité de "A sachant B" en fonction des probabilités de "B sachant A" et de la probabilité de A.

En effet: Les bébés, ces génies de la statistique. Vous avez peut-être lu dans la presse ces jours-ci cette découverte incroyable: avec un peu d’entrainement, des babouins sont capables de distinguer un vrai mot écrit en anglais d’un faux. Et ceci sans évidemment sans savoir lire et encore moins connaître le sens de ces mots.

On pourrait croire que les singes mémorisent simplement la forme visuelle des vrais mots et qu’ils finissent par savoir les distinguer des pseudo-mots qu’on leur présente. Mais cette explication est insuffisante, car les singes sont capables de distinguer un vrai mot d’un faux, même s’ils ne l’ont jamais vu auparavant! C’est donc du côté de la statistique qu’il faut rechercher l’explication. Selon Stanislas Dehaene (dont je vous ai parlé dans ce billet), l’apprentissage de la lecture se fait à force de voir se répéter certaines combinaisons de lettres, plus fréquentes que d’autres.

La statistique pour se répérer dans le langage Le même test passé sur des singes Tamarins a donné des résultats identiques. Sources: Bayes ou le bon sens réduit au calcul. On a vu dans le billet précédent que les bébés -mais aussi les singes ou les rats- sont sensibles aux moindres régularités statistiques dans ce qu’ils perçoivent. Ils montrent une capacité phénoménale à généraliser à bon escient ces règles pour apprendre à lire (dans le cas des bébés), à parler, à faire fonctionner un jouet etc. et à affiner leur compréhension du « modèle » avec l’expérience.

Mais comme le commente à juste titre David, comment explique-t-on du coup que nous soyons si sujets aux généralisations abusives et aux contre-sens statistiques? C’est ce que je vous propose d’explorer aujourd’hui… Inférence compulsive Quatre cartes sont posées devant vous sur une table. On a spontanément tendance à répondre plutôt la quatrième (le 4), mais si vous y réfléchissez il peut y avoir n’importe quelle lettre au verso du 4, sans que la règle soit ni violée ni confirmée.

Alors quoi, les soi-disant « génies de la statistiques » se fourvoient au premier petit problème de logique venu? Bayes ou le bon sens réduit au calcul. Les probabilités conditionnelles (Bayes level 1) Vous venez de passer un test pour le dépistage du cancer.

Le médecin vous convoque pour vous annoncer le résultat : mauvaise nouvelle, il est positif. Pas de chance, alors que ce type de cancer ne touche que 0.1% de la population. Vous demandez alors au praticien si le test est fiable. Sa réponse est sans appel : « Si vous avez le cancer, le test sera positif dans 90% des cas ; alors que si vous ne l’avez pas, il sera négatif dans 97% des cas ».

L’affaire paraît entendue… Et pourtant, à votre avis, après le résultat d’un tel test, quelle est la probabilité que vous ayez le cancer ? Pour répondre à cette question, il va falloir faire un tout petit peu de probabilités…mais ça en vaut la peine, vous allez découvrir que malgré votre test positif, la probabilité d’être malade n’est que de 2.9% !

Le calcul facile Si on pose correctement les choses, vous allez voir que le calcul est en fait très facile. Considérons maintenant ceux qui n’ont pas ce cancer : ils sont 9990. Rappels de probabilités. L’inférence bayésienne (Bayes level 2) Préliminaire : Ce billet est la suite de celui de la semaine dernière, qui portait sur les probabilités conditionnelles et introduisait la formule de Bayes. Si ces notions vous sont familières, vous n’êtes pas obligés d’aller le lire. Dans le cas contraire, n’hésitez pas à vous rafraîchir la mémoire ! La semaine dernière, je vous ai présenté la célèbre règle de Bayes, qui permet de relier la probabilité conditionnelle de « A sachant B » à celle de « B sachant A » Nous avions vu un cas simple, où A et B désignaient respectivement le fait d’être rouge et carré pour un objet que l’on tire au hasard dans une urne (« quelle est la probabilité qu’il soit carré sachant qu’il est rouge »), ainsi qu’un cas plus subtil où il était question de dépistage du cancer.

L’idée était de souligner la différence entre « la probabilité d’avoir le cancer sachant qu’on est dépisté positif », notée P(C | +), et « la probabilité d’être dépisté positif sachant qu’on a le cancer », notée P(+ | C). WordPress: L'implémentation neuronale des mécanismes Bayésiens - Psychologie cognitive expérimentale - Stanislas Dehaene - Collège de France - 14 février 2012 09:30. Toutes ces données comportementales et électro-physiologiques suggèrent que le cerveau des primates, et sans doute de nombreuses autres espèces, abrite des mécanismes qui approximent la statistique bayésienne. Au minimum, ces mécanismes doivent représenter plusieurs distributions de probabilité ; représenter et stocker leurs a priori ; combiner plusieurs distributions selon la règle du produit (ou par addition de leur logarithme) ; et enfin, en identifier le maximum a posteriori.

Quels circuits neuronaux remplissent ces fonctions ? Selon Alex Pouget et ses collaborateurs, le calcul sur des distributions fait partie du répertoire naturel de toute population de neurones dont les taux de décharge sont aléatoires selon une certaine loi de probabilité (Beck et al., 2008; Ma, Beck, Latham & Pouget, 2006). Sans titre. Interprétation de la preuve et théorème de Bayes - Police Scientifique. A la fin des années 1960, un consensus s’établit dans la communauté scientifique pour minimiser les erreurs d’interprétation dans la présentation de la preuve matérielle. Cela consiste à appliquer un modèle probabiliste, le théorème de Bayes et plus précisément à étudier le rapport de vraisemblance intervenant dans le calcul. Pour évaluer la pertinence d’un résultat analytique dans l’enquête judiciaire, le théorème de Bayes est encore aujourd’hui un modèle acceptable.

Ce modèle utilisé dans d’autres domaines scientifiques, comme la médecine, permet d’évaluer la valeur de l’élément matériel indépendamment de l’élément moral (données d’enquête, témoignages, aveux). Dès 1912, Edmond Locard énonçait le principe selon lequel « L’idéal de l’expertise moderne, telle qu’elle se fait dans les laboratoires, est de réduire l’élément moral de la preuve et d’en augmenter l’élément physique ». L’interprétation de la preuve avec le théorème de Bayes et le modèle « Bayesien »