Google překvapil trh novou verzí svého vlajkového modelu Gemini 3.1 Pro, která přichází jen pár měsíců po Gemini 3. A i když papírově nejde o revoluci, v praxi Google mluví o zásadním posunu – hlavně v oblasti logického uvažování, spolehlivosti odpovědí a práce s komplexními úlohami.
Rekordní posun v uvažování
Největší pozornost si Gemini 3.1 Pro vysloužil díky benchmarkům. V testu Humanity’s Last Exam, který hodnotí hluboké znalosti napříč obory, dosáhl model skóre 44,4 %. Pro srovnání: předchozí Gemini 3 měl 37,5 % a konkurenční OpenAI GPT-5.2 skončil na 34,5 %.
Ještě výraznější skok přišel v testu ARC-AGI-2, zaměřeném na řešení zcela nových logických problémů. Zatímco Gemini 3 zvládl 31,1 %, verze 3.1 Pro vyskočila na masivních 77,1 %. To je víc než dvojnásobné zlepšení a jasný signál, že Google dokáže AI „naučit přemýšlet“ konzistentněji než dřív.
Konkurence boduje jinde, ale…
Ano, v některých uživatelských žebříčcích stále vede Anthropic Claude Opus 4.6, hlavně v textových úlohách nebo kódování. Tyto testy jsou ale založené na hlasování uživatelů a často zvýhodňují líbivější odpovědi, ne nutně ty nejpřesnější.
Google naopak sází na stabilitu a reálné použití. Gemini 3.1 Pro zvládne pracovat až s milionem vstupních tokenů, analyzovat celé smlouvy, technickou dokumentaci nebo rozsáhlý kód bez nutnosti dělení na části.
Gemini 3.1 Pro možná nevyhraje každou tabulku, ale v tom nejdůležitějším má navrch. V uvažování, agentních úlohách a dlouhém kontextu dnes Google působí dospěleji než konkurence. Pokud tenhle trend vydrží, bude se OpenAI i Anthropic muset začít dívat Googlu na záda – ne naopak.