Avons-nous enfin dépassé le problème des hallucinations de l’IA ? J'ai testé les meilleures IA

Les fonctionnalités clés de Chatgpt et de Gémeaux ont comparé. Qui a fait mieux?

Alors que l’IA fait progressivement partie de la vie quotidienne de nombreuses personnes, il est important de savoir si les informations fournies par ces compagnons sont réellement exactes. Une hallucination de l’IA se produit lorsqu’une IA perçoit des modèles ou des objets qui n’existent pas pour les humains, ce qui signifie qu’ils créent des résultats absurdes ou inexacts. Cela a été un problème majeur avec l'IA, qu'il s'agisse de la génération d'images et du fait que les humains ont trop de doigts sur les mains ou lorsqu'une IA rassemble des informations factuelles et les crache de manière erronée.

J'ai donc décidé de tester cinq chatbots IA différents, mais en leur posant une série de questions triviales et en suivant les réponses. J'ai posé à chaque chatbot IA dix questions différentes qui ont certaines réponses qui ne sont pas susceptibles d'être interrompues. Cela garantissait que l’IA pouvait avoir raison ou tort lorsqu’elle fournissait ses réponses. Je voulais également enregistrer si les différents chatbots proposaient ou non des sources d'informations et si cela nécessitait ou non une incitation.

Voici toutes les questions que j’ai posées aux chatbots IA :

  • Quelle est la date aujourd'hui ?
  • Qui était Albert Einstein ?
  • À quelle date les humains ont-ils marché pour la première fois sur la lune et quel était le nom de la première personne ?
  • Qui a été la première femme à remporter un prix Nobel et à quoi sert-il ?
  • Quelle est la seule mer sans littoral ?
  • Quel artiste de la Renaissance est enterré au Panthéon de Rome ?
  • En quelle année les Nations Unies ont-elles été créées ?
  • Quel pays boit le plus de café par habitant ?
  • Quelle est l’épice la plus rare et la plus chère au monde en poids ?
  • Quel personnage Robert Downey Jr. et Benedict Cumberbatch ont-ils joué ?

Résultats

Dans l’ensemble, les résultats ont montré que les hallucinations de l’IA diminuent nettement avec le temps. À mesure que de nouvelles éditions de compagnons d'IA sont publiées, qu'il s'agisse de Gemini 2.5 ou de GPT-5, ils deviennent plus intelligents et moins susceptibles d'halluciner. Cependant, il ne peut jamais être garanti que toutes les informations sont exactes, ce qui signifie que les sources sont essentielles lorsque vous utilisez l'IA. Même si les hallucinations de l’IA sont en baisse, nous n’avons certainement pas résolu le problème à 100 %, puisque 2 chatbots sur 5 se trompent sur une question.

Google Gémeaux ChatGPT Grok IA profonde Copilote Microsoft
Quelle est la date aujourd'hui ? X
Qui était Albert Einstein ?
À quelle date les humains ont-ils marché pour la première fois sur la lune et quel était le nom de la première personne ?
Qui a été la première femme à remporter un prix Nobel et à quoi sert-il ?
Quelle est la seule mer sans littoral ?
Quel artiste de la Renaissance est enterré au Panthéon de Rome ?
En quelle année les Nations Unies ont-elles été créées ?
Quel pays boit le plus de café par habitant ? X
Quelle est l’épice la plus rare et la plus chère au monde en poids ?
Quel personnage Robert Downey Jr. et Benedict Cumberbatch ont-ils joué ?

Panne

  • Google Gemini a répondu correctement à chaque question et a fourni un contexte détaillé entourant chaque réponse ainsi qu'une gamme de liens vers des sources pour chaque élément d'information. Avec en moyenne quatre sources pour chaque réponse, vous pouvez facilement croiser les sources pour vous assurer que les réponses sont correctes.
  • ChatGPT n'a également obtenu aucune mauvaise réponse et a fourni beaucoup de contexte pour chaque réponse. Cependant, l'un des inconvénients est que ChatGPT ne fournit pas automatiquement les sources des informations, mais fournit des liens si on le lui demande.
  • Grok a fourni des réponses beaucoup plus concises tout en vous donnant le contexte dont vous avez besoin. Il n'y avait aucun lien vers des sources pour les informations fournies, mais encore une fois, si on le lui demandait, le chatbot vous fournirait des liens.
  • En fait, Deep AI s'est trompé sur la première question, me disant que la date d'aujourd'hui était le 27 octobre 2023 alors que c'était le 10 octobre 2025 lorsque j'ai posé la question. A part ça, toutes les autres questions étaient correctes. Les réponses étaient très brèves avec peu de contexte fourni pour la plupart et juste des réponses simples. Aucune source n'a été fournie, mais des liens seraient donnés sur demande.
  • Microsoft Copilot s'est trompé sur la question numéro 8, mais a quand même fourni une source qui étayait sa réponse, ce qui signifie que cela pourrait simplement être le résultat de sources contradictoires plutôt que d'hallucinations. Copilot a fourni des sources sans être invité à répondre à la plupart des questions, mais pas à toutes, mais il fournissait des liens lorsqu'on le lui demandait.

Dans l'ensemble, cela confirme que les sources d'informations fournies par l'IA doivent être vérifiées et même si cela peut nécessiter que vous demandiez la source, cela vaut la peine de prendre cette mesure supplémentaire pour garantir que les informations que vous voyez sont exactes.

Rate this post
Total
0
Shares
Previous Post
Je viens de déballer le nouvel Air Apple iPhone, et je suis amoureux

J'espère que davantage d'entreprises feront de l'iPhone des concurrents aériens, voici pourquoi

Next Post
Détails clés sur le chipset Galaxy S26 Pro « confirmés » avant la sortie 2026

Détails clés sur le chipset Galaxy S26 Pro « confirmés » avant la sortie 2026

Related Posts