Gemini offre nuovi strumenti di markup delle immagini per migliorare l’accuratezza delle app

Google sta implementando nuove funzionalità avanzate per migliorare l’interazione con l’intelligenza artificiale Gemini, offrendo strumenti innovativi per l’annotazione diretta sulle immagini. Queste novità rappresentano un significativo passo avanti nell’elaborazione e modifica visiva tramite AI, rendendo più intuitivo e preciso il processo di comunicazione con l’assistente digitale.

gemini: nuova funzione di disegno diretto sulle immagini

La piattaforma Gemini consente ora di disegnare direttamente su fotografie, fornendo così una modalità immediata per indicare all’intelligenza artificiale gli elementi specifici da analizzare o modificare. Questa soluzione elimina la necessità di lunghe descrizioni testuali, permettendo invece di evidenziare, cerchiare o annotare le aree d’interesse in modo visivo.

L’utente può utilizzare diversi tipi di segni:

  • cerchi e frecce per indicare oggetti particolari;
  • evidenziazioni per porre attenzione a dettagli precisi;
  • scritte e note aggiuntive come spiegazioni supplementari;
  • sbozzature libere per guidare meglio l’analisi dell’immagine.

vantaggi dell’annotazione visiva nelle analisi e modifiche delle immagini

L’introduzione degli strumenti di markup migliora sia la comprensione che la capacità di editing dell’AI. Invece di affidarsi esclusivamente a prompt testuali che possono risultare ambigui o insufficienti, è possibile segnalare con precisione ciò che si desidera analizzare o trasformare all’interno della foto.

Questo metodo consente di:

  • identificare esattamente un soggetto o un dettaglio specifico;
  • suggerire modifiche puntuali senza dover scrivere lunghe spiegazioni;
  • aumentare l’efficacia delle richieste rivolte all’assistente AI;
  • ridurre errori dovuti a interpretazioni errate dei comandi testuali.

difficoltà riscontrate nei primi utilizzi reali del sistema

I test iniziali hanno mostrato risultati variabili nell’applicazione pratica della nuova funzione. Ad esempio, nel tentativo di inserire un edificio generato accanto a una struttura reale, l’intelligenza artificiale ha sostituito completamente quella esistente anziché affiancarla come richiesto.

sviluppo e diffusione della funzionalità markup in gemini

L’integrazione degli strumenti per il disegno sulle immagini è frutto di mesi di preparativi da parte di Google. Precedenti anticipazioni avevano già suggerito lo sviluppo di funzioni dedicate alla messa a fuoco migliorata su elementi selezionati nelle fotografie. Inoltre, sono stati perfezionati modelli capaci di effettuare modifiche tramite linguaggio naturale mantenendo coerenza tra i soggetti presenti.

L’attuale rollout avviene in modo graduale tramite aggiornamenti lato server, motivo per cui non tutti gli utenti possono ancora usufruire delle novità anche se dispongono dell’ultima versione dell’app Gemini. L’espansione del servizio appare comunque imminente.

Continue reading

NEXT

Galaxy Z TriFold di Samsung esaurito in poche ore, prossimo rifornimento mercoledì

Il Galaxy Z TriFold, il nuovo smartphone pieghevole di Samsung, ha riscosso un successo immediato in Corea del Sud, esaurendosi rapidamente dopo il lancio. La forte domanda ha portato a un rapido sold out sia nei negozi fisici sia online, […]
PREVIOUS

Google search presenta conversazioni dal vivo più fluide e espressive in modalità AI

Google ha introdotto un importante aggiornamento per la funzione Search Live, integrando un modello audio nativo avanzato che rende le conversazioni con l’intelligenza artificiale più naturali e dinamiche. Questa novità migliora significativamente l’esperienza utente durante le interazioni vocali con il […]

Potrebbero interessarti

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

I più popolari

Di tendenza

Per guestpost o linkbuilding scrivi a [email protected]