Accueil » Actualités » FAQ » Hallucinations de l’IA : votre chatbot peut-il déclencher une crise ?
Hallucinations de l’IA : votre chatbot peut-il déclencher une crise ?
- Qu'est-ce qu'une hallucination de l'IA ?
- Air Canada : le cas qui a fait jurisprudence
- Hallucination ou manipulation ? Deux dérapages, une même crise
- Pourquoi un chatbot qui dérape est une bombe réputationnelle
- Les garde-fous : comment éviter qu'un chatbot ne déclenche une crise
- Que faire quand le chatbot a déjà commis l'erreur
- Checklist : déployer un chatbot sans déclencher de crise
- FAQ : hallucinations et chatbots IA
- Conclusion : votre chatbot parle en votre nom
La réponse tient en un mot : oui. Et contrairement aux deepfakes ou à la fraude au dirigeant, cette crise-là ne vient pas d’un attaquant extérieur — elle vient de votre propre outil. En 2024, le chatbot d’Air Canada a inventé de toutes pièces une politique tarifaire ; un tribunal a condamné la compagnie à l’honorer. La même année, le chatbot du transporteur DPD s’est mis à jurer et à écrire un poème qualifiant son employeur de « pire entreprise de livraison au monde », sous les yeux de plus de deux millions d’internautes. Et un chatbot de concessionnaire Chevrolet a « vendu » un SUV neuf pour un dollar.
L’hallucination d’un chatbot IA n’est donc pas une mésaventure cocasse : c’est un risque réputationnel et juridique de premier plan, parce que ce robot est devenu le visage numérique de la marque analyse l’expert en communication de crise Florian Silnicki, Président Fondateur de l’agence LaFrenchCom. Ce guide explique ce qu’est une hallucination, décrypte le cas Air Canada devenu jurisprudence, distingue l’erreur spontanée de la manipulation, détaille les garde-fous qui protègent l’entreprise et indique quoi faire quand le mal est fait. Pour la vision d’ensemble, reportez-vous à notre guide pilier sur la communication de crise face à l’IA.
Qu’est-ce qu’une hallucination de l’IA ?
Une hallucination, c’est une affirmation fausse, inventée ou trompeuse qu’un modèle d’IA générative produit avec un aplomb total, comme s’il s’agissait d’un fait avéré. La cause est structurelle : un grand modèle de langage ne « sait » pas ce qui est vrai ; il prédit la suite de mots la plus plausible à partir de ses données d’entraînement. Quand il ne dispose pas de l’information exacte, il ne répond pas « je ne sais pas » — il comble le vide par une réponse vraisemblable mais erronée.
Le problème n’est pas marginal. Selon les recherches disponibles, les chatbots hallucinent entre 3 % et 27 % du temps, y compris dans des environnements conçus pour limiter le phénomène. Pour une entreprise qui déploie un agent face à ses clients, cela signifie qu’une part non négligeable des réponses peut être inexacte — et que chacune de ces réponses engage la parole de la marque.
Air Canada : le cas qui a fait jurisprudence
L’affaire est devenue le cas d’école de la responsabilité des entreprises face à leur propre IA. Fin 2022, un passager interroge le chatbot d’Air Canada sur les tarifs de deuil. L’agent lui assure, à tort, qu’il peut acheter son billet immédiatement puis demander une réduction rétroactive dans les 90 jours. Lorsque le client réclame son remboursement, la compagnie refuse : cette politique n’existe pas.
L’affaire arrive devant un tribunal civil canadien. Air Canada tente alors une défense restée célèbre : son chatbot serait une « entité juridique distincte », responsable de ses propres actes. L’argument est balayé. Le tribunal souligne que la compagnie ne peut pas se décharger de la responsabilité des informations fournies par l’un de ses agents — et qu’aucune raison ne rend une page web plus digne de confiance que son chatbot. Air Canada est condamnée à honorer le tarif promis et à verser des dommages-intérêts, puis désactive son agent.
La leçon est limpide et vaut pour toute organisation : une entreprise est responsable de ce que dit son IA, exactement comme elle l’est des propos de ses salariés. « Ce n’est pas le robot qui a dit ça » n’est pas une ligne de défense. Le chatbot municipal MyCity de New York, qui a délivré à des entrepreneurs des informations erronées sur la réglementation locale, a confirmé que la sphère publique n’est pas davantage à l’abri.
Hallucination ou manipulation ? Deux dérapages, une même crise
Tous les dérapages de chatbots ne se ressemblent pas, et la nuance compte pour choisir la bonne parade.
L’hallucination est une erreur que l’IA commet spontanément, sans qu’on l’y pousse. C’est le cas d’Air Canada, ou des AI Overviews de Google qui ont conseillé d’ajouter de la colle pour faire tenir le fromage d’une pizza, ou encore de mettre au menu des cailloux : une désinformation involontaire, mais diffusée à très grande échelle.
La manipulation — souvent par « injection de prompt » — consiste à pousser délibérément le chatbot hors de son script. C’est l’histoire de DPD, dont un client agacé a obtenu jurons et poème assassin, ou celle du concessionnaire Chevrolet, dont des internautes ont tordu le chatbot jusqu’à lui faire accepter une vente à un dollar. Ici, l’erreur n’est pas spontanée : elle est provoquée, en exploitant la souplesse du modèle.
Les deux phénomènes produisent la même conséquence — une crise — mais appellent des réponses différentes : ancrage dans des données fiables contre l’hallucination, défenses anti-manipulation contre l’injection de prompt. Il faut enfin signaler une troisième catégorie, plus grave : les défaillances de sécurité, lorsqu’un chatbot tient des propos dangereux. Plusieurs services conversationnels ont ainsi fait l’objet de poursuites après avoir été accusés d’encourager des comportements à risque, rappelant que la modération et les limites de sécurité ne sont pas optionnelles.
Pourquoi un chatbot qui dérape est une bombe réputationnelle
Trois caractéristiques rendent ces crises particulièrement redoutables. D’abord, l’absence de malveillance n’atténue pas la responsabilité : qu’il s’agisse d’une hallucination ou d’une manipulation, c’est la marque qui répond, juridiquement et publiquement. Ensuite, le format se prête à la viralité : une capture d’écran d’un chatbot absurde ou insultant se partage en quelques secondes — le post de DPD a dépassé deux millions de vues. Enfin, la confiance s’érode doublement : envers la marque, mais aussi envers l’IA en général, ce qui peut compromettre des projets d’automatisation entiers.
L’enjeu n’est pas que symbolique. Une mauvaise expérience client se paie cher en réputation comme en chiffre d’affaires, et les analystes rappellent qu’un chatbot mal préparé n’est pas un gadget marketing mais le visage numérique permanent de l’entreprise. Comme le résume un analyste de Gartner, les agents génératifs ne sont pas prêts pour la relation client si les entreprises qui les déploient n’investissent pas dans des contrôles de fiabilité et de sécurité.
Les garde-fous : comment éviter qu’un chatbot ne déclenche une crise
La bonne nouvelle, c’est que ces crises sont en grande partie évitables. Six garde-fous, combinés, réduisent drastiquement le risque.
Délimiter le périmètre d’action
Définissez des limites strictes — les guardrails — à l’intérieur desquelles l’agent opère : sujets autorisés, ton, actions permises, et refus explicite de sortir de son domaine. Un chatbot de relation client n’a aucune raison de discuter de tout et n’importe quoi ; le cantonner à son périmètre désamorce la plupart des dérapages.
Ancrer les réponses dans des sources fiables
L’erreur d’Air Canada était une réponse non ancrée dans la documentation officielle. La parade s’appelle l’ancrage (souvent via une architecture de type RAG) : le chatbot puise ses réponses dans une base de connaissances validée et à jour, plutôt que d’« inventer » à partir de connaissances génériques. Une politique commerciale doit venir d’une source de vérité, jamais d’une supposition du modèle.
Prévoir l’escalade vers l’humain
Les modèles hybrides homme-machine surpassent les agents totalement autonomes. Le chatbot doit savoir reconnaître ses limites et passer la main à un conseiller humain dès qu’une question est complexe, sensible ou ambiguë. Un protocole d’escalade clair n’est pas une option : c’est un filet de sécurité.
Tester, surveiller, journaliser
Avant le déploiement, testez l’agent face à des cas difficiles et à des tentatives de détournement. Après le déploiement, surveillez ses réponses en continu et conservez les journaux : ils permettent de comprendre un incident (le concessionnaire Chevrolet a analysé ses logs pour reconstituer la manipulation) et constituent une protection juridique. Les captures et transcriptions ont d’ailleurs été décisives dans l’affaire Air Canada.
Se protéger des manipulations
Contre l’injection de prompt, des solutions spécialisées vérifient les messages des utilisateurs avant qu’ils n’atteignent le modèle et bloquent les tentatives de détournement. Combinées à un périmètre d’action restreint, elles limitent fortement le risque qu’un internaute fasse dire n’importe quoi à votre agent.
Transparence et validation juridique avant déploiement
Indiquez clairement à l’utilisateur qu’il s’échange avec une IA, encadrez le service par des conditions d’utilisation, et faites valider le dispositif par le juridique avant la mise en ligne. Cette étape, souvent négligée, est précisément celle qui aurait pu épargner à Air Canada un revers retentissant.
Que faire quand le chatbot a déjà commis l’erreur
Assumer, ne jamais blâmer le robot
La pire réaction est celle d’Air Canada : tenter de se dédouaner en présentant le chatbot comme responsable de lui-même. Non seulement cette défense échoue juridiquement, mais elle aggrave la crise en donnant l’image d’une entreprise qui fuit ses responsabilités. Le réflexe gagnant est inverse : reconnaître l’erreur sans détour.
Corriger vite et communiquer juste
Désactivez ou corrigez l’agent défaillant sans tarder — c’est ce qu’ont fait DPD, Chevrolet et Air Canada. Si une promesse erronée a été faite à un client, évaluez s’il est plus coûteux de l’honorer que de subir la crise (souvent, honorer revient moins cher). Puis communiquez : expliquez ce qui s’est passé, ce que vous corrigez, et ce que vous mettez en place pour que cela ne se reproduise pas. Transformer une faiblesse exposée en preuve de sérieux est tout l’art de la sortie de crise.
Anticiper les implications juridiques
Une hallucination peut engager la responsabilité contractuelle de l’entreprise, soulever des questions de protection des données ou tomber sous le coup de réglementations émergentes sur l’IA. Ces dimensions — responsabilité, RGPD, AI Act — feront l’objet d’articles dédiés de cette série ; retenez ici qu’un incident de chatbot n’est pas qu’une affaire de communication, mais aussi un sujet juridique à traiter sans délai.
Checklist : déployer un chatbot sans déclencher de crise
Avant et pendant la mise en ligne :
- Périmètre d’action restreint et refus explicite de sortir du domaine.
- Ancrage des réponses dans une base de connaissances validée et à jour.
- Protocole d’escalade vers un conseiller humain pour les cas sensibles.
- Protection anti-manipulation (filtrage des prompts, tests de détournement).
- Journalisation systématique des échanges et monitoring continu.
- Mention claire qu’il s’agit d’une IA + conditions d’utilisation.
- Validation juridique du dispositif avant déploiement.
- Plan de réaction : qui désactive, qui communique, qui décide d’honorer ou de corriger.
FAQ : hallucinations et chatbots IA
Qu’est-ce qu’une hallucination d’IA, concrètement ? C’est une réponse fausse ou inventée qu’un chatbot présente avec assurance, parce qu’il prédit des mots plausibles sans vérifier la véracité. Le taux observé se situe entre 3 % et 27 %.
Mon entreprise est-elle responsable des erreurs de son chatbot ? Oui. La jurisprudence Air Canada a établi qu’une entreprise répond des informations délivrées par son agent conversationnel, au même titre que de celles de ses employés. L’argument du « robot autonome » est rejeté.
Quelle est la différence entre une hallucination et une manipulation ? L’hallucination est une erreur spontanée du modèle (Air Canada, Google AI Overviews). La manipulation est un détournement provoqué par l’utilisateur, souvent par injection de prompt (DPD, Chevrolet). Les parades diffèrent.
Comment éviter qu’un chatbot ne nuise à ma marque ? En restreignant son périmètre, en ancrant ses réponses dans des sources fiables, en prévoyant une escalade humaine, en le protégeant des manipulations, en journalisant les échanges et en le faisant valider par le juridique avant déploiement.
Faut-il honorer une promesse erronée faite par un chatbot ? Juridiquement, l’entreprise peut y être contrainte, comme l’a montré Air Canada. Stratégiquement, honorer une promesse limitée coûte souvent moins cher que la crise réputationnelle d’un refus médiatisé.
Un chatbot bien conçu peut-il rester sans risque ? Aucun déploiement n’est à risque zéro, mais des garde-fous solides et un humain dans la boucle réduisent fortement la probabilité d’incident. Des entreprises déploient des agents performants et fiables ; la différence se joue sur la préparation.
Conclusion : votre chatbot parle en votre nom
Un agent conversationnel n’est pas un logiciel parmi d’autres : c’est une voix qui engage publiquement votre marque, vingt-quatre heures sur vingt-quatre. Lorsqu’il hallucine ou qu’on le manipule, c’est l’entreprise qui répond — devant ses clients comme devant un tribunal. La parade ne consiste pas à renoncer à l’IA, mais à l’encadrer : périmètre clair, ancrage dans des sources fiables, escalade humaine, surveillance et validation juridique. Déployé avec ces garde-fous, le chatbot reste un atout ; déployé sans, il devient une bombe à retardement.
Pour situer ce risque dans la stratégie globale de communication de crise à l’ère de l’IA, consultez notre guide pilier. Et puisque l’incident de chatbot débouche presque toujours sur des questions de responsabilité, de données personnelles et de conformité, les prochains articles de cette série exploreront le versant juridique : RGPD, AI Act et communication judiciaire à l’ère de l’IA.