Aizvērt sludinājumu

Google atver piekļuvi nākamās paaudzes Gemini 2.5 Datora lietošanas modelis, kas ir Mariner projekta pamatā, un tā sauktās aģenta funkcijas mākslīgā intelekta režīmā. Šis specializētais modelis Gemini Tas var mijiedarboties ar grafiskām lietotāja saskarnēm, proti, tīmekļa vietnēm un pārlūkprogrammām, un veikt uzdevumus pilnīgi automātiski.

Gemini 2.5 Datora lietošana darbojas vairākos atkārtotos soļos: vispirms tas saņem lietotāja ievadi, t. i., viņa pieprasījumu, pašreizējās vides momentuzņēmumu un darbību vēsturi. Pēc tam tas veic GUI analīze un rada atbildi — piemēram, klikšķi, rakstīšanu vai kursora pārvietošanu. Pēc darbības veikšanas tā nosūta atjauninātu ekrānuzņēmumu, un viss process atkārtojas, līdz uzdevums ir pabeigts.

Gemini 2.5 var veikt tādus uzdevumus kā meklēšana, URL navigācija, ritināšana, elementu vilkšana, taustiņu kombinācijas vai noklikšķinot. google Viņš arī parādīja praktiskus piemērus, piemēram, klienta automātisku pievienošanu CRM sistēmai no tīmekļa veidlapas vai piezīmju pārkārtošanu digitālajā ziņojumu dēlī pa kategorijām.

Modelis pašlaik ir optimizēts galvenokārt priekš tīmekļa pārlūkprogrammas, taču testi uzrāda daudzsološus rezultātus pat Android vidē. Google piemin etalonu AndroidWorld, kas apstiprina augstu veiktspēju mobilajā automatizācijā, lai gan tas vēl pilnībā neatbalsta darbvirsmas vadību.

Pateicoties spējai nolasīt ekrānu un saprast saskarni, Google izmanto Gemini 2.5 arī iekšēji priekš automatizēta lietotāja interfeisa testēšanaModelis ir balstīts uz sistēmas vizuālu izpratni. Gemini 2.5 Pro un nodrošina zemāku latentumu nekā konkurējoši risinājumi, piemēram, Claude vai chatGPT.

Gemini 2.5 Datora lietošana ir pieejama publisks priekšskatījums vairāk nekā Gemini API Google AI Studio un Vertex AI platformās. Izstrādātāji var sākt veidot savus palīgus un rīkus tīmekļa darbplūsmas automatizācija.

Saistītie raksti

Šodien visvairāk lasītais

.