Question 1

Pourquoi une IA invente-t-elle des faits ?

Accepted Answer

Une IA ne possède pas de véritable conscience ni de compréhension de la vérité. C'est un modèle mathématique qui calcule le mot suivant le plus logique en se basant sur des probabilités. S'il existe des lacunes dans ses données d'entraînement, l'IA les comble avec des chaînes de mots statistiquement plausibles, mais totalement inventées.

Question 2

Quel est le rôle des données d'entraînement erronées dans les hallucinations de l'IA ?

Accepted Answer

L'IA apprend à partir de textes issus d'Internet. Si ces données d'entraînement contiennent déjà des contradictions, des fausses informations, des préjugés ou des faits obsolètes, le modèle reproduit ces erreurs. Comme elle ne peut pas vérifier logiquement la fiabilité d'une source, elle présente des contre-vérités comme des faits exacts.

Question 3

Qu'entend-on par surapprentissage (overfitting) dans les erreurs de l'IA ?

Accepted Answer

Lors du surapprentissage, l'IA a pour ainsi dire appris ses données d'entraînement par cœur. Si on lui pose une nouvelle question légèrement différente, elle tente à tout prix d'y appliquer son apprentissage rigide. Cela la conduit à établir des liens erronés et à générer de fausses réponses.

Question 4

Pourquoi l'IA ne se corrige-t-elle pas elle-même lorsqu'elle ment ?

Accepted Answer

Les grands modèles de langage fonctionnent de manière purement linéaire, de gauche à droite. Ils génèrent les mots un par un et ne reviennent pas en arrière de façon dynamique pour vérifier la cohérence logique de la phrase. L'IA ne se rend tout simplement pas compte qu'elle produit des absurdités pendant qu'elle écrit, car elle manque d'une instance de contrôle cognitif.

Question 5

La formulation du prompt influence-t-elle les hallucinations ?

Accepted Answer

Oui, massivement. Si un prompt est imprécis, ambigu ou suggestif (par ex. 'Pourquoi la Terre est-elle plate ?'), on pousse l'IA dans un angle mort. Le modèle mathématique cherche alors à répondre au contexte de la question de manière statistiquement optimale, et invente des arguments pour confirmer la prémisse (fausse) de l'utilisateur.