Zavřít reklamu

Google se svou AI platformou Gemini čelí tvrdé kritice po zveřejnění rozsáhlé mezinárodní studie, kterou provedla Evropská vysílací unie (EBU) ve spolupráci s BBC. Výsledky ukazují, že právě Gemini vykazuje nejvíce závažných chyb při generování shrnutí zpráv.

Studie porovnávala výkon čtyř hlavních AI systémů: ChatGPT od OpenAI, Copilot od Microsoftu, PerplexityGoogle Gemini. Testovalo se, jak dobře umí AI shrnout aktuální zpravodajství – s důrazem na přesnost, citace, kontext a odkazování na zdroje.

Podle výsledků byla Gemini naprosto nejhorší ze všech hodnocených modelů. Trpěla problémy jako:

  • nejasné odkazy na původní zdroje,
  • neschopnost rozlišit důvěryhodné a satirické zdroje,
  • přílišná závislost na Wikipedii,
  • chybné citace a zkomolené přímé výroky,
  • nedostatečný kontext.

Všechny ostatní nástroje vykazovaly podobnou míru běžných chyb, Gemini vykázala nejvíce závažných nedostatků, které přímo ovlivňují důvěryhodnost výstupu.

Přestože se v průběhu šesti měsíců, kdy byla studie prováděna, zlepšila přesnost u všech nástrojů, Gemini i nadále zaostává. Výzkum zároveň ukázal, že 15 % mladých lidí do 25 let spoléhá na AI pro čtení zpráv. A věří jejich souhrnům. To zvyšuje význam těchto zjištění a lidé by měli vědět, že i když je Gemini napojena na vyhledávač Google, nedá se jí zcela věřit.

Google zatím na výsledky nereagoval, ale jak se AI nástroje stávají běžnou součástí mediálního prostoru, roste i tlak na jejich transparentnost a spolehlivost.

Související články

Dnes nejčtenější

.