Technologický gigant Google zásadně mění způsob, jakým měří a rozděluje strojový čas pro své velké jazykové modely. Na nedávné konferenci I/O 2026 platforma Gemini přešla na nový systém limitů, který je primárně určen reálným výpočetním výkonem. V reakci na uživatelskou kritiku ohledně předčasného vyčerpání dostupných zdrojů nyní Google nasazuje sérii optimalizací, které mají zajistit spravedlivější a transparentnější rozdělení systémových prostředků. ale ne každý bude spokojený.
Výpočetní výkon namísto fixních dotazů
Nový výpočetní model limitů Gemini zohledňuje hardwarovou náročnost každé operace. Spotřeba se tak odvíjí od komplexnosti promptu, zapojení externích nástrojů a celkové délky konverzačního kontextu. Tento přístup funguje v pětihodinovém cyklu obnovy, který běží až do momentu dosažení týdenního limitu.
Zatímco standardní textový dotaz zatěžuje infrastrukturu minimálně, pokročilé multimodální operace – jako je analýza videa nebo generování kódu – vyžadují řádově vyšší množství výpočetních prostředků. Jako řešení pro náročné uživatele proto plánuje Google zavést možnost dokupování AI kreditů na bázi modelu „pay-as-you-go“.
Změny u modelů Gemini Pro, Flash-Lite a AI Ultra
Vedoucí projektu Gemini Josh Woodward potvrdil zavedení stropu na množství kvóty, kterou dokáže spotřebovat jeden ultra-komplexní dotaz. Tímto krokem, cílícím na model Gemini 3.1 Pro, se zamezí situacím, kdy rozsáhlé prompty se soubory plně vyčerpaly uživatelský limit. Cílem je umožnit uživatelům získat z verze Pro vyšší efektivitu.
Zároveň dochází k úpravám u dalších modelů v portfoliu:
- Gemini 3.1 Flash-Lite: Dotazy na tento odlehčený model jsou nově zcela zdarma a do celkové kvóty se nezapočítávají.
- Gemini AI Ultra: Uživatelé této nejvyšší řady získávají dvojnásobný objem generací pro Omni funkce. Google tak opravil chybu, kdy zpracování pouhých dvou Omni videí dokázalo kompletně vyčerpat systémové limity.
Systém si navíc nově pamatuje manuální volbu konkrétního modelu napříč jednotlivými relacemi. K automatickému přepnutí na lehčí model dojde pouze v případě, že uživatel dosáhne svého aktuálního limitu.
Férové účtování chyb
Google explicitně deklaroval, že systémové chyby a selhání požadavků na straně infrastruktury nebudou uživatelům započítávány do limitů. Kvóta je odečítána výhradně za úspěšně dokončené operace.
Vzhledem k tomu, že pokročilé analytické úlohy typu Deep Research generují extrémní výpočetní zátěž, současný základní přehled v dashboardu brzy nahradí detailnější reporting. Uživatelé získají podrobné přehledy o spotřebě energie a prediktivní upozornění, což jim umožní efektivněji plánovat a optimalizovat své vývojářské i uživatelské limity.