Google sta sviluppando una nuova funzionalità innovativa per migliorare l’esperienza degli utenti nell’utilizzo di Gemini, il suo sistema di generazione immagini basato su intelligenza artificiale. La novità consiste nell’introduzione di strumenti che consentiranno di intervenire direttamente sulle immagini generate prima del salvataggio, ampliando le possibilità creative e operative.
funzionalità di annotazione per immagini generate da gemini
Secondo recenti indiscrezioni trapelate dalla piattaforma TestingCatalog su X, Google sta lavorando a un sistema di annotazioni integrate che permetterà agli utenti di aggiungere elementi grafici e testuali alle immagini create con Gemini. Questa funzione non si limiterà alla semplice digitazione, ma offrirà la possibilità di disegnare liberamente o inserire testi direttamente sull’immagine.
L’interfaccia prevista include una palette colori orizzontale accompagnata da due strumenti principali: uno per il disegno a mano libera rappresentato da una linea ondulata e un altro per l’inserimento di testo identificato con la lettera “T”.
possibile funzionalità di risottomissione delle immagini modificate
Un ulteriore sviluppo ipotizzato riguarda la capacità degli utenti di risottomettere le immagini annotate. Ciò significa che dopo aver modificato un’immagine con cerchiature, frecce o note testuali, sarà possibile inviarla nuovamente a Gemini come prompt visivo per perfezionare i risultati senza dover riscrivere completamente la descrizione testuale iniziale.
Questa modalità potrebbe semplificare notevolmente il processo iterativo con l’IA, facilitando correzioni puntuali e personalizzate sulle immagini generate.
integrazione della modifica diretta nelle capacità attuali di gemini
Dall’inizio dell’anno Google ha già implementato all’interno di Gemini strumenti nativi per l’editing delle immagini generate dall’intelligenza artificiale o caricate dagli utenti stessi. Questi consentono ad esempio:
- modifica dello sfondo;
- aggiunta o rimozione di oggetti;
- sovrapposizione e fusione creativa delle foto;
- generazione visuale basata su storie raccontate dagli utenti.
L’introduzione della funzione annotazioni rappresenta un’evoluzione significativa che aggiunge un livello più diretto e creativo d’interazione tra utente e IA.
aggiornamenti tecnologici recenti: nano banana pro
Nell’ambito del potenziamento delle capacità visive, Google ha recentemente presentato il modello Nano Banana Pro, progettato per garantire:
- aumento della precisione nella generazione delle immagini;
- dettagli più ricchi nei contenuti prodotti;
- miglioramento della leggibilità dei testi e dei font incorporati nelle immagini.
Tali progressi potrebbero essere funzionali anche al corretto funzionamento della futura funzione annotazioni, rendendo più nitide e comprensibili le modifiche apportate manualmente dagli utenti.










Lascia un commento