I ty nejpokročilejší modely umělé inteligence, jako je Gemini od Googlu, mají své limity. Možná jste si také všimli, že po určité době začne chat reagovat nestandardně: odpovědi jsou pomalejší, objevují se irelevantní detaily nebo AI úplně mine podstatu vašeho dotazu. Problémem většinou není špatně napsaný prompt, ale fenomén, který technologičtí experti nazývají zahlcením kontextového okna.
Mnoho uživatelů přistupuje k AI chatu jako k jednomu nekonečnému dokumentu. Logika velí mít všechny informace na jednom místě, aby na sebe prompty navazovaly. Jenže u velkých jazykových modelů (LLM) platí, že čím je vlákno delší a roztříštěnější, tím více kontextového šumu vzniká.
Gemini se snaží zohlednit celou historii konverzace, což vede k vysoké latenci a ztrátě kontextu. Algoritmus pak může přikládat váhu informacím z minulého týdne, které jsou pro váš aktuální úkol již zcela nepodstatné. Jakmile se vlákno stane „přetrénovaným“ na balastu předchozích zpráv, efektivita klesá k nule.
Strategie restartu
Řešení je překvapivě prosté – průběžné zakládání nových chatů. Přechod do nového vlákna působí jako okamžitý restart výkonu. Aby však nový chat neztratil návaznost, je klíčové ovládnout techniku přenosu kontextu. Namísto kopírování celých bloků textu využijte samotnou Gemini k destilaci toho nejpodstatnějšího.
Před uzavřením dlouhého vlákna použijte specifické prompty pro vytvoření tzv. „briefu“:
- „Shrň klíčové body této konverzace do pěti odrážek.“
- „Vytvoř krátké zadání, které vložím do nového chatu, aby Gemini pochopila kontext. Zahrň cíle, omezení a technické detaily.“
Tímto způsobem přenesete do nového čistého prostředí pouze čistou informační hodnotu bez zbytečného balastu.
Osobní kontext
Jedním z důvodů, proč uživatelé lpí na dlouhých chatech, je nechuť neustále opakovat své preference ohledně tónu hlasu, formátování nebo pracovního zaměření. Google pro tento účel implementoval funkci Osobní kontext (Custom Instructions).
Tento nástroj naleznete v nastavení pod položkou „Osobní kontext“. Zde definované instrukce si Gemini pamatuje napříč všemi novými chaty. Můžete zde specifikovat:
- Preferovaný formát výstupu (např. tabulky, odrážky).
- Vaši profesní roli nebo cílovou skupinu textů.
- Stylistická omezení (např. nepoužívat pasiva).
Díky tomu se každý nový chat okamžitě adaptuje na vaše standardy, aniž byste museli „nafukovat“ historii konverzace opakujícími se pokyny. Odměnou vám bude blesková odezva a precizní výsledky, které skutečně odpovídají vašemu záměru.