COSMO rappresenta un nuovo approccio all’intelligenza artificiale su dispositivi mobili: un assistente che punta a comprendere il contesto sullo schermo e a proporre azioni successive senza richiedere continui interventi da parte dell’utente. questa analisi riassume le nozioni chiave emerse dal recente leak, descrivendo dimensioni, modalità di funzionamento e potenziale utilizzo quotidiano, con attenzione alla sicurezza e alle prospettive di integrazione futura.
cosmo: l’assistente di google e la svolta locale
contesto e conseguenze del leak
il leak indica una piattaforma di assistente incentrata sul contesto visivo, capace di suggerire il prossimo passo in base a ciò che si sta facendo al momento. la presenza di un lancio accidentale nel negozio ufficiale e la successiva rimozione hanno acceso l’interesse sull’idea di un’interazione più fluida tra utente e IA, riducendo la necessità di input descrittivi manuali.
dimensioni e modelli di esecuzione
una delle prime indicazioni riguarda la dimensione dell’app, stimata intorno a 1,13 GB, una misura significativa per un assistente. la soluzione presunta integra una versione locale di un modello IA, denominata Gemini Nano, che permette di eseguire parte del ragionamento direttamente sul dispositivo.
l’esecuzione locale non è senza costi: mantenere l’IA sul telefono può comportare un maggiore consumo di energia se non gestito con criteri adeguati. sono individuate tre modalità operative per i modelli di completamento:
- Nano Only – esecuzione locale per privacy e uso offline.
- PI Only – affidamento al server remoto di Google per ragionamenti più pesanti.
- Hybrid – configurazione predefinita che alterna elaborazione locale e in cloud in base al compito.
consapevolezza dello schermo: un vantaggio potenziale
l’elemento distintivo evidenziato dal leak è la possibilità di sfruttare il contesto dello schermo per guidare le azioni dell’assistente. l’uso dell’AccessibilityService API – originariamente pensata per strumenti come i lettori di schermo – potrebbe fornire al sistema una finestra sulla visualizzazione corrente senza inviare dati sensibili al cloud.
la logica è semplice: se testo, schede aperte o note sono visibili, COSMO potrebbe proporre azioni mirate, ad esempio suggerire l’inserimento di un evento nel calendario quando si identifica un’impostazione di pianificazione.
per una parte degli utenti, l’idea di concedere accesso a contenuti sensibili sul display sembra invasiva. grazie a una componente locale, denominata Gemini Nano, si potrebbe contenere una parte dell’elaborazione direttamente sul dispositivo, riducendo la diffusione di dati nei server remoti.
le abilità integrate: cosa potrebbe fare in pratica
sono state delineate 14 abilità strutturate per accompagnare le attività quotidiane. tra queste spiccano:
- List Tracker: suggerisce una lista non appena emergono segnali di pianificazione.
- Document Writer: propone una bozza quando viene menzionata la necessità di redigere un documento.
- Calendar Event Suggester: individua piani con ora e propone l’inserimento nel calendario.
- Browser Agent: utilizza una funzione di navigazione avanzata per completare attività nel browser.
- Add Timer: individua compiti con scadenze e propone un timer dedicato.
- Deep Research: offre un approfondimento quando una risposta breve non basta.
- Quick Photo Lookup: permette di trovare rapidamente una foto citata per condividerla.
- Google it: suggerisce ricerche sul web quando utile.
- Jargon Definitions: spiega termini tecnici non familiari durante la lettura o una discussione.
- Provide Insight: aggiunge contesto utile durante la lettura o la conversazione.
- People Understanding: fornisce contesto su una persona specifica.
- Event Understanding: offre contesto su un evento.
- Recall: aiuta a ricordare qualcosa che si sta cercando di ricordare.
- Conversation Summary: riassume una conversazione recente quando si passa a un tema diverso.
queste abilità si concentrano su attività ordinarie e di uso quotidiano, ma con un approccio che riduce i cicli di lavoro manuale, puntando a una produttività più fluida.
probabilmente un banco di prova e non una nuova gemini app
detto in modo chiaro, l’insieme di elementi disponibili nel build leakato suggerisce uno stato ancora incompleto. l’interfaccia di chat risulta essenziale e rudimentale, e le immagini allegate mostrano proporzioni non corrette, segni comuni di una versione non rifinita destinata a test interni.
non si può configurare COSMO come un sostituto completo di Gemini: l’ipotesi prevalente è che Google utilizzi COSMO come banco di prova per le abilità e le componenti tecnologiche, integrandole poi in Gemini o in Android nel tempo.
in questa prospettiva, COSMO viene visto come un laboratorio di funzionalità che potrebbero evolversi in strumenti più maturi, piuttosto che come un prodotto finale destinato al grande pubblico.



Lascia un commento