AI chatboti jsou čím dál populárnější a spousta lidí si z nich udělala rádce, terapeuty, finanční poradce nebo zpovědníky. Služby, které využívají stovky milionů uživatelů, ale nefungují ve vakuu. Stojí za nimi velké firmy, které provozují sociální sítě nebo další globálně rozšířené systémy. A badatelé prokázali, že za zdánlivě užitečnými odpověďmi se skrývá komplexní mechanismus sběru dat, nad kterými uživatelé nemají žádnou kontrolu.
Data putující na servery v zámoří se stávají trvalou součástí digitální stopy, kterou nelze jednoduše smazat. Pryč jsou ty doby, kdy tvůrci AI chatbotů využívali k tréninku LLM modelů jen obsah internetu, knihy nebo novinové články. Tento zdroj informací už vysychá, a tak hojně sahají po tom nejsnazším zdroji, který mají – uživatelských datech. Neboli po všem, co do chatbotů napíšete.
AI potřebuje vaše soukromí
Vývojáři chatbotů jako Gemini, ChatGPT nebo Grok nyní čelí fenoménu „datového hladomoru“ a hledají nové cesty, jak své modely zdokonalovat. Řešením se stalo RLHF (Reinforcement Learning from Human Feedback), tedy přímé vytěžování uživatelských konverzací.
Studie provedená vědci ze Stanfordovy univerzity potvrzuje, že technologičtí giganti jako Google, Microsoft či Meta využívají interakce s chatboty k dalšímu ladění svých algoritmů. Mnohastránkové licenční podmínky, které většina uživatelů automaticky potvrzuje, dávají firmám právo tyto informace archivovat na dobu neurčitou a v rámci školicích procesů je zpřístupňovat i lidským anotátorům. Citlivá firemní data či osobní zpovědi se tak stávají součástí tréninkových datasetů.
Konec anonymity
Riziko nespočívá pouze v úniku dat k hackerům, ale především v hloubkové integraci AI do širších digitálních ekosystémů. Velcí hráči neprovozují pouze chatboty; disponují e-mailovými klienty, cloudovými úložišti, vyhledávači a operačními systémy. Příkladem může být Google, který má svůj webový prohlížeč Chrome, Gmail, operační systém pro mobily Android a mnoho dalšího. Meta zase stojí za sociálními sítěmi.
Tato komplexní integrace umožňuje propojovat zdánlivě nesouvisející stopy. Informace, kterou svěříte chatbotovi, může být spárována s vaším chováním na sociálních sítích nebo historií nákupů. Výsledkem je precizní uživatelský profil, který slouží nejen k personalizaci služeb, ale i k vysoce cílené reklamě. A nejsou to jen nepodložené dohady. Spousta uživatelů už se s takovým cílením setkala, jen si to mnozí ještě neuvědomili.
Moderní algoritmy navíc už nepracují jen s tím, co jim explicitně řeknete. Díky pokročilé analýze vzorců a statistik dokážou vyvodit závěry, které jste nikdy nevyslovili. Stačí několik dotazů na specifické potraviny nebo úpravu životního stylu a systém dokáže s vysokou pravděpodobností predikovat váš zdravotní stav. Nebo těhotenství. A najednou začnete vídat reklamy na doplňky stravy nebo kojenecké potřeby.
Tento princip detektivní práce algoritmů dnes v kombinaci s LLM dosahuje nové úrovně, kdy anonymizovaná data de facto přestávají existovat. Proto by si každý z nás měl dávat pozor, co AI chatbotům sděluje. Nic z toho se totiž neztrácí. A velké firmy čím dál víc prahnou po uživatelských datech.