Google pressar tydligen Gemini till den grad att den inte längre bara svarar, utan faktiskt utför uppgifter direkt på din Android-telefon. I en ny betaversion av Google-appen visas kodsträngar som beskriver "Få uppgifter gjorda med Gemini" – internt under kodnamnet bonobo. I praktiken är det skärmautomation, d.v.s. möjligheten för Gemini "såg" skärmen och slutförde uppgiften steg för steg i de program som stöds.
Beskrivningen från betaversionen gör det tydligt – Gemini borde kunna hantera gör beställningar eller kanske boka en resa och liknande rutinmässiga saker. Och det är bara baserat på vad du har på skärmen. Den viktiga detaljen är att det inte kommer att gälla universellt överallt, utan bara i "viss" apps”, dvs. i utvalda tillämpningar. Det har tidigare funnits indikationer på att Android 16QPR3 banar väg för dessa framsteg, och nu har Google faktiskt kommit för att göra Gemini virtuell assistent.
Det viktiga är att detta inte är en "trollstav" som fungerar utan kontroll. Google varnar direkt för det. Gemini kan göra misstag och det du är ansvarig för vad han gör för din räkning. Så det finns ett system där du kan anlita en agent stoppa när som helst och slutför uppgiften manuellt.
Den största frågan gäller logiskt sett integritet. Google uppger att när Gemini interagerar med applikationen, skärmdumpar kan granskas av utbildade utvärderare och används för att förbättra tjänsten – om du har aktiverat aktivitetssparning. Samtidigt lägger den till en mycket praktisk varning:
- att inte komma in chatinloggnings- eller betalningsuppgifter
- använd inte automatisering för känsliga situationer eller nödsituationer
Ändring i Ge-webbapplikationenmini
Förändringen i Ge-webbapplikationen passar också in i samma mosaik.miniEtt nytt avsnitt visas i Verktyg-menyn. Glasleverantör, vilket skiljer experimentella funktioner från vanliga. Och bredvid det kommer en omkopplare "Personifiera" chat när det är hjälpsamt", vilket avgör om Gemini kommer att nå till Ansluten appsDet viktiga är att detta bara gäller den aktuella konversationen, så du kan välja när du vill ha mer sammanhang och när du vill ha ett rent, osammanhängande svar.
Sammantaget ser det ut som att Google rör sig mot en modell där Gemini fungera som en AI-agent, som inte bara ger råd, utan också agerar. Och samtidigt etablerar den tydliga gränser så att användaren bättre kan förstå, vad är ett experiment och där det är en funktion som är redo för regelbunden användning.