Zavřít reklamu

Zatímco většina mobilních AI funkcí působí jako narychlo přilepený marketingový tah pro investory, Google Meet přišel s něčím, co má reálný dopad na produktivitu. Od dubna 2026 Google do svých mobilních aplikací pro Android a iOS zavedl funkci Speech Translation. Nejde přitom o běžné titulky, ale o plnohodnotný živý dabing hovorů v reálném čase, který zcela mění styl mezinárodní komunikace.

Starší systémy hlasového překladu trpěly kritickým neduhem – vysokou latencí. Proces zahrnoval tři separátní kroky: převod řeči na text (ASR), strojový překlad a následnou syntézu textu do hlasu (TTS). Výsledkem bylo třeba i desetisekundové zpoždění, které spolehlivě zabilo jakoukoli přirozenou dynamiku rozhovoru.

Nové řešení od Google DeepMind tento řetězec rozbíjí. Využívá sjednocený end-to-end model převodu řeči na řeč, který minimalizuje prodlevu na nezbytné minimum. Inženýři Googlu systém vyladili tak, aby překlad nebyl příliš rychlý (což by vedlo k matoucímu překrývání hlasů), ale ani příliš pomalý.

Syntetický AI hlas navíc přebírá rytmus i tón mluvčího, přičemž původní stopa zůstává slabě slyšitelná v pozadí. Díky tomu se neztrácí nonverbální složka komunikace – v překladu stále cítíte emoce, naléhavost nebo humor.

Živý dabing vs. titulky

Většina současných AI asistentů vyžaduje od uživatele aktivitu navíc: psaní promptů, přepínání oken nebo neustálou kontrolu halucinací chatbota. Speech Translation vGoogle Meet naproti tomu integruje technologii přímo do workflow, které uživatelé již používají.

Čtení drobných titulků na malém displeji smartphonu během chůze nebo řízení je nepraktické a únavné. Živý dabing oproti tomu umožňuje uživateli nasadit sluchátka a plně se soustředit na obsah sdělení bez nutnosti upřeně sledovat obrazovku. Aktivace je přitom triviální – stačí v nabídce Nástroje zvolit jazykový pár a potvrdit souhlas se zpracováním mikrofonu z důvodu ochrany soukromí.

Speech translation Google Meet

Jazykové limity v Google Meet

I přes technologický pokrok má systém svá omezení. Aktuálně se Google soustředí na kvalitu na úkor kvantity. Mobilní verze podporuje v rámci jedné schůzky vždy pouze jednu jazykovou dvojici. Pokud je hovor nastaven na angličtinu a španělštinu, účastník mluvící francouzsky zůstane bez překladu, dokud hostitel nespustí jiný profil.

Aktuální seznam podporovaných jazyků zahrnuje obousměrný překlad mezi angličtinou:

  • španělštinou
  • francouzštinou
  • němčinou
  • portugalštinou
  • italštinou

Exotičtější jazyky nebo asijské trhy (mandarínština, japonština) si na integraci musí počkat. Dalším omezením je archivace – přeložené audio se aktuálně nepropisuje do nahrávek hovorů ani livestreamů, kde zůstává zachován pouze originální zvukový záznam.

Dostupnost: AI za paywallem

Google funkci Speech Translation neposkytuje každému, je bohužel součástí předplatného. Pro individuální uživatele to znamená nutnost tarifu Google AI Pro nebo AI Ultra. V korporátní sféře je vyžadován odpovídající balíček Workspace (např. Business Standard/Plus nebo Enterprise edice).

Pozitivní zprávou pro týmovou spolupráci je fakt, že licenci nemusí vlastnit všichni účastníci. Stačí, aby jeden oprávněný uživatel s placeným tarifem funkci aktivoval, a výhody živého dabingu mohou využívat všichni přítomní. Google však funkci stále označuje nálepkou „beta“, což naznačuje, že modely se budou i nadále kalibrovat.

 

Tato implementace v Google Meet splňuje základní test smysluplnosti technologie: byla by užitečná, i kdyby na ní nebyl štítek „AI“? Odpověď zní ano. Právě tímto směrem by se měla ubírat i další integrace. Představte si Google Mapy, které vám do uší v reálném čase překládají místní hlášení rozhlasu na nádraží, nebo Google Wallet, která okamžitě vysvětlí skryté právní kličky v podmínkách vrácení peněz u letenky. Právě v neviditelné, ale okamžitě dostupné asistenci leží skutečná budoucnost mobilní umělé inteligence.

Související články

Dnes nejčtenější

.