Google udělal další významný krok směrem k éře skutečně autonomních AI asistentů. Společnost totiž integrovala funkci Computer Use přímo do modelu Gemini 3.5 Flash, který nyní dokáže nejen odpovídat na dotazy, ale také aktivně pracovat s aplikacemi a ovládat počítač podobně jako člověk. Vedle toho přichází i praktická novinka pro běžné uživatele v prohlížeči Chrome.
Zatímco dosavadní generativní AI fungovala především jako chytrý chatbot, nová generace Gemini se snaží stát digitálním spolupracovníkem. Cílem už není pouze poskytovat informace, ale také vykonávat konkrétní úkoly v reálném softwarovém prostředí.
Mohlo by vás zajímat
Gemini nyní kliká, scrolluje a pracuje s aplikacemi
Největší novinkou je nativní podpora technologie Computer Use v modelu Gemini 3.5 Flash. AI díky ní dokáže analyzovat obrazovku, rozpoznávat prvky uživatelského rozhraní a následně s nimi pracovat podobně jako člověk pomocí myši a klávesnice.
Na rozdíl od tradiční automatizace, která často vyžaduje složité skripty nebo přístup k API jednotlivých služeb, Gemini pracuje vizuálně. Sleduje obsah obrazovky, identifikuje tlačítka, formuláře nebo nabídky a podle zadaného úkolu provádí potřebné kroky.
Pro firmy i vývojáře to otevírá široké možnosti využití:
- automatické vyplňování formulářů,
- zpracování administrativních úkolů,
- sběr dat z webových stránek,
- testování aplikací a webů,
- automatizaci opakujících se kancelářských procesů.
Právě kancelářská automatizace patří mezi oblasti, kde by podobní AI agenti mohli během příštích let výrazně změnit způsob práce milionů lidí.
Chrome dostává praktickou funkci
Zajímavá novinka míří také na běžné uživatele. Chrome 149 přináší funkci „Select from screen“, která umožňuje rychle vybrat část obrazovky a okamžitě ji vložit do konverzace s Gemini.
Uživatel Chrome jednoduše označí obrázek, text nebo konkrétní část webové stránky a během několika sekund se může Gemini zeptat na její obsah. Odpadá tak pořizování screenshotů nebo jejich ruční nahrávání.
Google tím dále propojuje svůj AI ekosystém s prohlížečem Chrome, Androidem i cloudovými službami. Právě hlubší integrace napříč produkty je jednou z hlavních strategií společnosti v souboji s konkurenty jako OpenAI, Microsoft nebo Anthropic.
Bezpečnost jako klíčové téma
Možnost dát umělé inteligenci kontrolu nad počítačem samozřejmě vyvolává otázky týkající se bezpečnosti. Pokud by AI například narazila na škodlivou webovou stránku nebo skryté instrukce, mohla by teoreticky provést akce, které uživatel nezamýšlel.
Google proto oznámil několik ochranných mechanismů. Systém využívá speciální trénink zaměřený na odhalování pokusů o manipulaci prostřednictvím takzvaných prompt injection útoků. Firmy navíc mohou nastavit povinné schvalování citlivých operací člověkem.
Další bezpečnostní vrstva dokáže automaticky zastavit běžící úlohu v okamžiku, kdy zaznamená podezřelé instrukce nebo pokus o převzetí kontroly nad agentem.
Novinka ukazuje, kam se celý trh s umělou inteligencí posouvá. Místo chatbotů, kteří pouze odpovídají na otázky, nastupují AI agenti schopní samostatně vykonávat konkrétní práci. Google přitom není jediný, kdo tímto směrem míří, ale díky propojení Gemini s Chrome, Androidem a dalšími službami má velmi silnou výchozí pozici.