Představte si, že mluvíte česky a člověk na druhém konci světa vás okamžitě slyší ve své rodné španělštině – bez zadrhávání, bez trapných pauz a s dokonalou intonací. Google právě mění pravidla hry v oblasti živého překladu.
Google oficiálně spustil novou éru globální komunikace. Do aplikací Google Překladač a platformy Google Meet míří přelomový model Gemini 3.5 Live Translate. Nejde o žádný běžný upgrade, na jaké jsme byli dosud zvyklí. Tento model totiž kompletně odbourává největší neduh současných překladačů: otravné čekání, až mluvčí dokončí větu.
Živý překlad, který vám skočí do řeči
Klasické systémy fungují stylem „poslech – pauza – překlad“. Nové Gemini 3.5 Live Translate však generuje řeč kontinuálně. Inteligentní algoritmus neustále balancuje mezi okamžitým překladem a čekáním na kontext, aby byl výsledek stoprocentně přesný.
Výsledkem je plynulý zvuk, který za mluvčím zaostává pouhých několik sekund. Zapomeňte na ticho a mechanický hlas robota.
Novinka dokáže detekovat více než 70 jazyků a přeložený hlas zní naprosto přirozeně. Model si totiž dokáže poradit s takovými detaily, jako je intonace, tempo řeči a výška hlasu. Výsledný monolog nebo dialog tak zní, jako byste mluvili s živým tlumočníkem na telefonu.
Geniální „režim poslechu“ změní způsob, jakým cestujeme
Nová funkce se už nyní rozšiřuje do aplikací Google Překladač pro systémy Android a iOS. Pokud máte nasazená sluchátka, stačí v levém dolním rohu klepnout na novou ikonu „Live translate“.
Co když ale sluchátka zrovna nemáte po ruce?
Pro Android přichází naprosto geniální „listening mode“ (režim poslechu). Ten řeší situace, kdy stojíte na ulici v cizím městě a potřebujete se rychle domluvit. Telefon si jednoduše přiložíte k uchu jako při běžném hovoru. Překladač bude poslouchat okolí a vy uslyšíte překlad přímo ze sluchátka telefonu, aniž byste museli na veřejnosti zapínat hlasitý odposlech.
Revoluce v online schůzkách: Google Meet propojí celý svět
Zatímco dosavadní překlad v aplikaci Google Meet podporoval pouhých 5 jazyků, integrace Gemini 3.5 Live Translate přináší podporu pro více než 70 jazyků. V praxi to znamená neuvěřitelných 2 000+ jazykových kombinací v rámci jediné videokonference.
Už nejste limitováni překladem pouze z a do angličtiny. Na webu se v ovládací liště objevilo nové tlačítko, kterým překlad okamžitě spustíte.
- Dostupnost pro firmy: Tento měsíc startuje uzavřené testování (private preview) pro vybrané firemní zákazníky služby Google Workspace. Širší nasazení se očekává v průběhu letošního roku.
- Pro vývojáře: Model je již nyní dostupný ve veřejném náhledu prostřednictvím Gemini Live API a Google AI Studio.
Bezpečnost na prvním místě: Skrytý podpis SynthID
S masivním nástupem takto pokročilých hlasových modelů roste riziko zneužití a šíření dezinformací (deepfakes). Google na to myslel dopředu. Veškerý vygenerovaný zvukový výstup v sobě nese neviditelný digitální vodoznak SynthID.
Tento vodoznak je lidským uchem zcela nepostřehnutelný, je však pevně vtkán do struktury audia. Speciální softwarové nástroje tak dokáží okamžitě a s jistotou identifikovat, že nahrávka byla vytvořena umělou inteligencí, což má zabránit zneužití hlasu.