« 35 % des utilisateurs réguliers de chatbots croient que le ROR cause l'autisme » : le chiffre qui dérange
L'outil conçu pour synthétiser la connaissance humaine se retrouve statistiquement lié à l'adhésion à des croyances non scientifiques. C'est le paradoxe central que révèle un sondage du KFF (Kaiser Family Foundation) publié en juin 2026. Alors que des centaines de millions de personnes interrogent chaque semaine les assistants conversationnels sur leur santé, les données montrent une corrélation troublante entre l'usage fréquent de ces outils et la croyance en des mythes anti-vaccins.

Le chiffre qui frappe : 35 % des Américains qui utilisent un chatbot IA pour des questions de santé au moins une fois par semaine croient que le vaccin ROR (rougeole-oreillons-rubéole) cause l'autisme. Chez les non-utilisateurs, cette proportion tombe à 20 %. L'écart est similaire pour d'autres idées reçues : 29 % des utilisateurs réguliers pensent que les vaccins à ARNm modifient l'ADN, contre 20 % des autres. Et 22 % jugent le vaccin contre la rougeole plus dangereux que la maladie elle-même, contre 15 %.
Un sondage KFF robuste qui trouve une corrélation persistante
La méthodologie du KFF Tracking Poll mérite d'être détaillée. Réalisé en mai 2026 auprès de 2 480 adultes américains, ce sondage téléphonique bilingue (anglais et espagnol) a interrogé les participants sur leurs sources d'information santé, leur confiance dans l'IA, et leurs croyances concernant six mythes vaccinaux courants. Les résultats ont été ajustés selon des variables démographiques classiques : âge, niveau d'éducation, origine ethnique, appartenance politique, et statut d'assurance maladie.
Le point crucial est que la corrélation entre usage fréquent de l'IA santé et adhésion aux mythes vaccinaux tient après contrôle de toutes ces variables. Ce n'est donc pas simplement que les utilisateurs d'IA sont plus jeunes ou moins diplômés — des facteurs qui pourraient expliquer une plus grande vulnérabilité à la désinformation. Non, l'effet statistique persiste indépendamment de ces caractéristiques. Lunna Lopes, analyste senior chez KFF, précise que le lien est « statistiquement robuste », même si l'étude ne prétend pas établir de causalité.
Les chercheurs ont également isolé un sous-groupe particulièrement exposé : les personnes sans professionnel de santé de confiance. Chez ces répondants, l'écart entre utilisateurs d'IA et non-utilisateurs est encore plus marqué. L'hypothèse est que le chatbot devient alors un substitut au médecin, sans les garde-fous du serment médical.
« Centaines de millions de questions santé par semaine » : OpenAI conscient de l'enjeu
OpenAI ne cache pas l'ampleur du phénomène. Dans un billet de blog publié en janvier 2026, l'entreprise reconnaissait que la santé est l'un des usages les plus populaires de ChatGPT, avec « des centaines de millions de personnes posant des questions de santé et de bien-être chaque semaine ». Ce chiffre donne le vertige : jamais un outil n'a été consulté à une telle échelle pour des conseils médicaux.
The Guardian, qui a relayé les résultats du sondage KFF le 30 juin 2026, souligne une lacune méthodologique importante : le sondage n'a pas demandé aux répondants quel modèle d'IA ils utilisaient. Or, comme nous le verrons plus loin, la fiabilité varie considérablement d'un chatbot à l'autre. ChatGPT, Gemini, Claude, Grok, Mistral — chaque modèle a ses forces et ses faiblesses, et l'utilisateur moyen n'a aucun moyen de savoir lequel est le plus fiable pour une question de santé.
Sam Altman, PDG d'OpenAI, a lui-même reconnu le problème dans des propos rapportés par NewsGuard : « Les gens ont un très haut niveau de confiance en ChatGPT, ce qui est intéressant puisque l'IA hallucine. » Cette franchise contraste avec la difficulté de l'entreprise à résoudre le problème. Car la popularité massive de ces outils pose une question existentielle : comment concilier accessibilité et fiabilité quand chaque réponse non vérifiée peut influencer des décisions de santé ?
Le piège technique : quand l'IA génère du « faux équilibre » au lieu de faits vérifiés
Comment un outil entraîné sur des milliards de documents, dont une large part de littérature scientifique, peut-il produire des réponses qui entretiennent la confusion ? La réponse tient en deux mots : faux équilibre. Les grands modèles de langage (LLM) sont optimisés pour générer des réponses qui semblent complètes et équilibrées, pas nécessairement vraies. Quand ils ne disposent pas d'informations suffisantes pour trancher, ils présentent les différentes positions comme également valables — un biais particulièrement dangereux en médecine.
L'étude BMJ Open : comment les chatbots noient le poison dans une neutralité trompeuse
L'étude publiée en avril 2026 dans le BMJ Open par Tiller et ses collègues est édifiante. Les chercheurs ont testé cinq chatbots majeurs — Gemini, DeepSeek, Meta AI, ChatGPT et Grok — en leur posant dix questions issues de cinq catégories santé, dont les vaccins. Résultat : près de la moitié des réponses (49,6 %) étaient problématiques. 30 % ont été jugées « quelque peu problématiques » et 19,6 % « hautement problématiques ».
Le concept de false balance est au cœur du problème. Lorsque les chercheurs ont demandé aux chatbots de comparer les thérapies alternatives à la chimiothérapie, les modèles ont certes averti que les alternatives n'étaient pas scientifiquement validées, mais ils les ont quand même listées — acupuncture, plantes médicinales, thérapie Gerson. Un chatbot a même présenté la thérapie Gerson, qui décourage explicitement la chimiothérapie, comme une option envisageable.
Le Dr Michael Foote, oncologue au Memorial Sloan Kettering Cancer Center, a déclaré à NBC News : « Certaines de ces réponses font du mal directement. » Le Dr Ashwin Ramaswamy, du Mount Sinai, a renchéri : les efforts des chatbots pour « ne pas prendre parti » aboutissent à une neutralité qui n'a pas sa place en médecine. Quand un patient cancéreux lit qu'une thérapie non validée est présentée sur un pied d'égalité avec la chimiothérapie, le mal est fait.
L'audit NewsGuard : les erreurs doublent en un an, ChatGPT atteint 40 % de fausses réponses
NewsGuard, organisme de vérification des informations, a réalisé deux audits des chatbots en août 2024 et août 2025. La comparaison est alarmante : le taux de répétition d'informations fausses est passé de 18 % à 35 % en un an. Dans le même temps, le taux de non-réponse — les cas où le chatbot refusait de répondre à une question dangereuse — est tombé de 31 % à 0 %. Les chatbots répondent désormais à tout, mais se trompent plus d'une fois sur trois.
ChatGPT a répété des affirmations fausses dans 40 % des cas. Sam Altman, cité par NewsGuard, a commenté : « Les gens ont un très haut niveau de confiance en ChatGPT, ce qui est intéressant puisque l'IA hallucine. » Il a ajouté : « C'est typiquement le genre de technologie où les gens attribuent trop de crédibilité à la machine. »
La dégradation en un an s'explique par plusieurs facteurs : la course à l'audience pousse les entreprises à répondre à tout, la modération éditoriale coûte cher en temps de calcul, et les modèles plus récents sont entraînés sur des données incluant davantage de contenus non vérifiés. Le résultat est contre-intuitif : plus les chatbots deviennent performants, plus ils sont dangereux en matière de santé.
Grok, Gemini, Mistral : des niveaux de fiabilité très inégaux face aux questions de vaccins
Tous les chatbots ne se valent pas. L'audit NewsGuard et l'étude Tiller convergent sur un point : les performances varient considérablement. Claude (Anthropic) obtient les meilleurs résultats avec seulement 10 % d'erreurs, suivi de Gemini (Google) à 16,67 %. ChatGPT est dans la moyenne basse, tandis que Grok (xAI) est le plus mauvais, avec des taux d'erreur dépassant 50 % sur certaines catégories.
Cette disparité pose une question fondamentale : les utilisateurs savent-ils quel modèle ils consultent ? La plupart des gens ouvrent l'application la plus populaire (ChatGPT) sans savoir que d'autres modèles sont plus fiables en matière de santé. La notoriété d'un outil n'a aucun rapport avec sa fiabilité médicale.
Le simple fait d'utiliser Claude plutôt que Grok change radicalement la probabilité de recevoir une information erronée. Mais cette information n'est pas accessible au grand public. Les entreprises communiquent sur les performances générales de leurs modèles, pas sur leurs taux d'erreur spécifiques à la santé. Le consommateur est donc aveugle face à un risque qu'il ne peut pas évaluer.
Le profil à risque : jeunes, confiants et privés de médecin traitant
Si le bug technique explique comment les chatbots produisent des réponses problématiques, le bug social explique pourquoi certains publics y sont plus exposés. Les données du KFF dessinent un profil type de l'utilisateur vulnérable : jeune, confiant dans la technologie, et souvent sans accès régulier à un professionnel de santé.
25 % des moins de 30 ans consultent l'IA pour leur santé
L'enquête KFF distincte, menée par Lunna Lopes, révèle qu'environ 17 % des adultes américains utilisent un chatbot IA pour une information santé au moins une fois par mois. Chez les moins de 30 ans, ce taux monte à 25 %. L'IA est donc un canal d'information santé de premier plan pour les jeunes, bien avant les sites officiels souvent jugés moins accessibles ou moins attrayants.
Le paradoxe est frappant : seuls 5 % des adultes se disent « très confiants » dans la précision des informations santé générées par IA. Six adultes sur dix déclarent avoir « pas trop » ou « pas du tout » confiance. Pourtant, on utilise massivement ce qu'on ne juge pas fiable. Cette dissonance cognitive s'explique par la facilité d'usage : poser une question à ChatGPT prend cinq secondes, consulter le site de l'OMS ou de l'assurance maladie en prend cinq minutes.
Les jeunes adultes sont aussi plus enclins à faire confiance aux conseils santé de l'IA que leurs aînés. Une étude complémentaire citée par MedVasc montre que cette confiance est corrélée à une moindre utilisation des sources officielles. Le chatbot devient le premier réflexe, le médecin traitant une option secondaire.
Le chaînon manquant : absence de médecin traitant et dépendance à l'IA
La KFF a mis en évidence une corrélation particulièrement forte entre usage de l'IA et croyances anti-vaccins chez les personnes sans professionnel de santé de confiance. Ce résultat est logique : quand on n'a pas de médecin régulier, on cherche des réponses ailleurs. L'IA devient un substitut au médecin, sans les garde-fous du serment médical.
Ce phénomène n'est pas nouveau. L'affaire du chatbot « Dr Emilie », qui usurpait le titre de psychiatre sur la plateforme Character.AI, illustre les dérives possibles. Comme nous l'avons relaté dans notre article sur le procès Character.AI, ce chatbot se présentait comme un professionnel de santé diplômé, donnant des conseils psychologiques à des adolescents sans aucune supervision médicale. Le parallèle avec les chatbots santé est frappant : dans les deux cas, l'autorité algorithmique se substitue à l'autorité humaine, sans les mécanismes de responsabilité qui encadrent la médecine.
Le danger n'est pas seulement l'erreur technique. C'est la substitution d'une relation de confiance humaine par une relation de confiance machine. Un médecin qui se trompe peut être poursuivi, radié, sanctionné. Un chatbot qui se trompe n'a aucune responsabilité. L'utilisateur, lui, n'a aucun recours.
L'essai clinique UPenn : l'IA ne fait pas mieux qu'une brochure d'information
L'essai contrôlé randomisé mené par Sehgal et ses collègues à l'Université de Pennsylvanie (2025) apporte un éclairage crucial. Les chercheurs ont testé des conversations brèves avec GPT-4o sur le vaccin contre le HPV, comparées à des documents de santé publique classiques et à une absence d'intervention. L'échantillon : 1 297 parents.
Résultat : le chatbot augmentait l'intention de vacciner à court terme par rapport à l'absence d'intervention, mais il ne faisait pas mieux que les documents papier classiques. Pire : l'effet du chatbot ne durait pas. À 45 jours, l'intention de vacciner était revenue au niveau de base. En revanche, les documents de santé publique maintenaient un effet modeste mais persistant.
La conclusion des chercheurs est sans appel : « Une communication de santé publique bien conçue peut égaler ou dépasser l'efficacité des chatbots. » L'« avantage IA » est un mythe marketing. Les chatbots sont peut-être plus agréables à utiliser, mais ils ne sont pas plus efficaces pour changer les comportements de santé. Et ils présentent un risque supplémentaire : celui de propager des informations erronées.
Responsabilité des plateformes et régulation : qui paiera pour des réponses fiables ?
Face à ces constats, la question de la responsabilité des plateformes devient centrale. Les garde-fous actuels sont-ils à la hauteur ? L'Europe peut-elle imposer des standards plus stricts ? Et surtout, qui paiera pour la fiabilité ?
Des garde-fous cosmétiques face à une explosion des usages santé
OpenAI, Google, Mistral et les autres ont ajouté des disclaimers du type « je suis une IA, consultez un professionnel de santé ». Mais ces avertissements sont souvent ignorés, noyés dans une réponse qui semble par ailleurs complète et autoritaire. L'audit NewsGuard montre que le taux de non-réponse aux questions dangereuses est tombé à zéro : les garde-fous ne bloquent plus, ils répondent à tout.
La course à l'audience explique cette évolution. OpenAI revendique des centaines de millions d'utilisateurs santé, et chaque réponse refusée est une interaction perdue. Les entreprises sont donc incitées à maximiser le volume de réponses, pas leur qualité. L'absence de mécanisme robuste de citation des sources n'est pas un bug technique : c'est un choix économique. Citer des sources fiables en temps réel coûte cher en calcul et réduit la fluidité de l'expérience utilisateur.
Le problème est structurel. Dans l'économie actuelle de l'IA, la vérité n'a pas de valeur marchande. Ce qui compte, c'est le temps passé sur la plateforme et le nombre d'interactions. Un chatbot qui répond avec assurance à toutes les questions, même en se trompant, génère plus d'engagement qu'un chatbot prudent qui refuse de répondre.
L'IA Act européen peut-il imposer un devoir de source aux assistants santé ?
L'Union européenne a adopté l'IA Act, qui classe les IA génératives comme présentant un risque systémique. Mais la mise en œuvre concrète reste floue. Un chatbot santé pourrait-il demain relever du règlement des dispositifs médicaux ? La question est ouverte.
Plusieurs pistes sont sur la table : obligation de citer les sources pour toute affirmation médicale, transparence sur les données d'entraînement, audit indépendant des taux d'erreur par catégorie, responsabilité juridique des éditeurs en cas de préjudice. La France et l'Europe poussent pour des « IA de confiance », mais le lobbying des GAFAM et la difficulté technique de citer des sources fiables en temps réel freinent les avancées.
L'enjeu économique est central. Qui paiera pour la modération éditoriale d'un modèle de langage grand public ? Actuellement, personne. Les entreprises d'IA dépensent des milliards en capacités de calcul, mais presque rien en vérification des faits. Imposer un devoir de source augmenterait le coût de fonctionnement, ce que les entreprises refusent.
Le solutionnisme technologique — cette croyance que la technologie résoudra tous les problèmes — trouve ici ses limites. On ne peut pas à la fois célébrer l'IA comme outil de démocratisation de l'information et ignorer les biais structurels qui la rendent dangereuse pour la santé publique.

Reprendre le contrôle : quatre réflexes critiques pour un usage éclairé de l'IA santé
Faut-il jeter l'IA avec l'eau du bain ? Non. Les chatbots sont des outils puissants, à condition de savoir les utiliser. Voici quatre réflexes critiques, tirés des études citées, pour un usage éclairé.
Demander des sources, vérifier les dates, comparer les modèles
Premier réflexe : exiger des sources. Les chatbots récents sont capables de citer leurs références quand on le leur demande explicitement. La phrase magique : « Quelles études scientifiques citent cette affirmation ? » Si le chatbot ne peut pas répondre ou cite des sources douteuses, méfiance.
Deuxième réflexe : vérifier la date des données d'entraînement. Les modèles gratuits ont souvent des coupes datées de plusieurs mois, voire années. Une information sur les vaccins qui date de 2023 peut être obsolète en 2026.
Troisième réflexe : poser la même question à deux modèles différents. Si Gemini et ChatGPT donnent des réponses divergentes, c'est un signal d'alarme. La fiabilité est douteuse. Si Claude et Mistral convergent, la réponse est plus crédible.
Quatrième réflexe : croiser avec un site officiel. Vaccination Info Service, AMELI, l'OMS — ces sources ne sont pas parfaites, mais elles sont conçues pour être fiables. Un chatbot peut orienter vers ces sites, mais il ne les remplace pas.
L'IA comme assistant de rédaction, pas comme oracle médical
L'essai UPenn l'a montré : un chatbot peut être utile pour reformuler des concepts complexes, préparer des questions pour son médecin, ou résumer une brochure officielle. Mais il ne remplace ni le jugement clinique ni la relation de confiance avec un soignant.
Le piège du solutionnisme technologique est de croire que plus un outil parle vite et bien, plus il dit vrai. Or, la fluidité d'un chatbot n'a rien à voir avec sa fiabilité. Les modèles les plus bavards sont souvent les moins fiables, car ils sont optimisés pour la complétude plutôt que pour la précision.
L'affaire Character.AI et du chatbot « Dr Emilie » est un avertissement : l'usurpation d'autorité médicale par une machine n'est pas un scénario de science-fiction, c'est un risque systémique. La frontière entre un assistant utile et un oracle dangereux est ténue, et elle dépend de notre capacité à garder un regard critique.
Conclusion : le coût de la vérité à l'ère des machines à consensus
La corrélation mise en évidence par le sondage KFF n'est pas une fatalité. Elle décrit un état du marché de l'IA où l'économie de l'attention prime sur la rigueur scientifique. Les modèles les plus utilisés sont aussi les plus bavards et les moins fiables en matière de santé. Ce n'est pas un accident : c'est le résultat de choix économiques et techniques.
Le problème n'est pas tant l'IA en elle-même que l'absence d'incitations fortes pour la vérité et la traçabilité des sources. Dans un marché où la rapidité et la complétude des réponses sont récompensées, la fiabilité devient une variable d'ajustement. Les entreprises ne sont pas punies quand leurs chatbots propagent des mythes anti-vaccins — elles sont récompensées pour le nombre d'interactions générées.
Le futur de l'information vaccinale ne se joue pas seulement dans l'amélioration des algorithmes. Il se joue dans la capacité des régulateurs — IA Act, DSA — à exiger des mécanismes de citation robustes, et dans la capacité des utilisateurs à cultiver une hygiène numérique critique. Le véritable risque n'est pas l'IA elle-même : c'est la confiance aveugle dans une machine qui n'a pour objectif que de nous plaire.