Gemini 2.5: il modello di intelligenza artificiale che visita siti web autonomamente

Google ha recentemente introdotto un innovativo modello di intelligenza artificiale, denominato Gemini 2.5 Computer Use, progettato per interagire con l’internet in modo sorprendentemente umano. Questa AI avanzata è in grado di navigare all’interno dei browser web, cliccare su pulsanti, compilare moduli e persino scorrere tra le pagine, tutto grazie a comandi testuali semplici. Si tratta di un passo significativo verso la creazione di agenti intelligenti capaci di svolgere autonomamente compiti digitali complessi.

gemini 2.5 computer model: il nuovo agente ai di google

Il cuore del modello Gemini 2.5 Computer Use si basa su un ciclo di feedback iterativo. Quando viene assegnato un compito all’AI, questa riceve la richiesta insieme a uno screenshot della schermata corrente e alla cronologia delle azioni precedenti. Successivamente, elabora queste informazioni e propone una specifica azione dell’interfaccia utente, come ad esempio cliccare su un link o digitare testo in un campo. L’azione viene eseguita tramite codice client-side e lo schermo si aggiorna, inviando nuovamente uno screenshot all’AI per proseguire il ciclo fino al completamento del compito originale.

Google ha ottimizzato questo modello principalmente per i browser web, ma mostra anche potenzialità per il controllo delle app mobili. Test interni hanno già dimostrato l’utilizzo di versioni di questo modello per attività come il testing delle interfacce utente e l’accelerazione dello sviluppo software.

performance e sicurezza al centro dell’attenzione

Secondo Google, il modello Gemini 2.5 Computer Use supera le alternative più diffuse in diversi benchmark web e mobile con una latenza ridotta. Le dimostrazioni mostrano l’AI capace di gestire compiti come giocare al gioco 2048 o navigare su siti web. È interessante notare che brevi test hanno persino dimostrato la capacità dell’AI di risolvere CAPTCHA di Google, rappresentando una sfida significativa per gli utenti non umani.

Google sta ponendo particolare enfasi sulla sicurezza. L’azienda è consapevole dei rischi associati agli agenti AI che controllano i computer; comportamenti imprevisti potrebbero verificarsi o malintenzionati potrebbero sfruttarli indebitamente. Per questo motivo, sono state integrate funzionalità di sicurezza direttamente nel modello e gli sviluppatori ricevono strumenti per prevenire azioni ad alto rischio da parte dell’AI.

Attualmente, Gemini 2.5 Computer Use è disponibile per gli sviluppatori attraverso l’API Gemini in Google AI Studio e Vertex AI, ma non è ancora accessibile direttamente ai consumatori. Questa tecnologia segna comunque un passo verso un futuro in cui l’intelligenza artificiale gestisce gran parte delle nostre interazioni digitali quotidiane.

Continue reading

NEXT

Offerte imperdibili: iPad A16 e iPad Mini A17 Pro ai prezzi più bassi di sempre!

Il mercato dei tablet è dominato da Apple, che offre modelli di alta qualità e prestazioni. Attualmente, due delle opzioni più interessanti sono l’Apple iPad A16 e l’Apple iPad Mini A17 Pro, entrambi disponibili a prezzi molto competitivi. Queste offerte […]
PREVIOUS

Apple AirPods Max in offerta: risparmia 120 dollari ora

offerta imperdibile per le apple airpods max Per gli appassionati di audio, l’attuale promozione sulle Apple AirPods Max rappresenta un’occasione da non perdere. Questi cuffie di alta qualità, solitamente vendute a $549, sono disponibili al prezzo speciale di $429, con […]

Potrebbero interessarti

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

I più popolari

Di tendenza

Per guestpost o linkbuilding scrivi a [email protected]