Google sta implementando nuove funzionalità avanzate per migliorare l’interazione con l’intelligenza artificiale Gemini, offrendo strumenti innovativi per l’annotazione diretta sulle immagini. Queste novità rappresentano un significativo passo avanti nell’elaborazione e modifica visiva tramite AI, rendendo più intuitivo e preciso il processo di comunicazione con l’assistente digitale.
gemini: nuova funzione di disegno diretto sulle immagini
La piattaforma Gemini consente ora di disegnare direttamente su fotografie, fornendo così una modalità immediata per indicare all’intelligenza artificiale gli elementi specifici da analizzare o modificare. Questa soluzione elimina la necessità di lunghe descrizioni testuali, permettendo invece di evidenziare, cerchiare o annotare le aree d’interesse in modo visivo.
L’utente può utilizzare diversi tipi di segni:
- cerchi e frecce per indicare oggetti particolari;
- evidenziazioni per porre attenzione a dettagli precisi;
- scritte e note aggiuntive come spiegazioni supplementari;
- sbozzature libere per guidare meglio l’analisi dell’immagine.
vantaggi dell’annotazione visiva nelle analisi e modifiche delle immagini
L’introduzione degli strumenti di markup migliora sia la comprensione che la capacità di editing dell’AI. Invece di affidarsi esclusivamente a prompt testuali che possono risultare ambigui o insufficienti, è possibile segnalare con precisione ciò che si desidera analizzare o trasformare all’interno della foto.
Questo metodo consente di:
- identificare esattamente un soggetto o un dettaglio specifico;
- suggerire modifiche puntuali senza dover scrivere lunghe spiegazioni;
- aumentare l’efficacia delle richieste rivolte all’assistente AI;
- ridurre errori dovuti a interpretazioni errate dei comandi testuali.
difficoltà riscontrate nei primi utilizzi reali del sistema
I test iniziali hanno mostrato risultati variabili nell’applicazione pratica della nuova funzione. Ad esempio, nel tentativo di inserire un edificio generato accanto a una struttura reale, l’intelligenza artificiale ha sostituito completamente quella esistente anziché affiancarla come richiesto.
sviluppo e diffusione della funzionalità markup in gemini
L’integrazione degli strumenti per il disegno sulle immagini è frutto di mesi di preparativi da parte di Google. Precedenti anticipazioni avevano già suggerito lo sviluppo di funzioni dedicate alla messa a fuoco migliorata su elementi selezionati nelle fotografie. Inoltre, sono stati perfezionati modelli capaci di effettuare modifiche tramite linguaggio naturale mantenendo coerenza tra i soggetti presenti.
L’attuale rollout avviene in modo graduale tramite aggiornamenti lato server, motivo per cui non tutti gli utenti possono ancora usufruire delle novità anche se dispongono dell’ultima versione dell’app Gemini. L’espansione del servizio appare comunque imminente.













Lascia un commento