Gemini 2.5 di google rende l’IA più conversazionale con audio nativo avanzato

Google ha recentemente potenziato il modello audio Gemini 2.5 Flash Native Audio, introducendo miglioramenti significativi nelle capacità conversazionali e nell’interazione con flussi di lavoro complessi. Questa evoluzione interessa diversi servizi, tra cui Gemini Live e Search Live, offrendo un’esperienza utente più fluida e naturale.

gemini 2.5 flash native audio: innovazioni principali

Il nuovo modello Gemini 2.5 Flash Native Audio versione 12-25 si distingue per una qualità superiore nella gestione delle conversazioni multi-turno, mantenendo il contesto delle interazioni precedenti per garantire dialoghi più coerenti e organici. Inoltre, è in grado di integrarsi con sistemi esterni senza interrompere la fluidità della comunicazione vocale, riconoscendo segnali audio per attivare funzioni esterne in tempo reale.

  • Miglioramento nella continuità delle conversazioni multi-turno
  • Integrazione efficiente con flussi di lavoro esterni
  • Risposte vocali arricchite da dati aggiornati in tempo reale

capacità avanzate dei live voice agents basati su gemini

I Live Voice Agents alimentati dal modello aggiornato dimostrano una maggiore affidabilità nel comprendere e eseguire istruzioni complesse, incrementando la soddisfazione degli utenti grazie a risposte più complete e precise. L’adesione alle direttive fornite dagli sviluppatori raggiunge il 90%, superando del 6% la versione precedente del modello (9-25).

  • Esecuzione autonoma di compiti multi-step senza necessità di intervento umano
  • Aumento dell’affidabilità nell’interpretazione delle richieste vocali
  • Migliore gestione delle interazioni complesse e articolate

prestazioni benchmark e disponibilità del modello gemini aggiornato

Nell’ambito del benchmark ComplexFuncBench Audio, Gemini 2.5 Flash Native Audio versione aggiornata ottiene un punteggio del 71,5%, superando sia il proprio predecessore che il modello gpt-realtime di OpenAI. Il rilascio è già avvenuto su piattaforme come Google AI Studio, Vertex AI e tramite API in fase preview.

  • Punteggio elevato nei test di performance audio avanzata
  • Disponibilità per sviluppatori su Google AI Studio e Vertex AI
  • Accesso anticipato tramite Gemini API in preview
  • Implementazione pratica in applicazioni come Gemini Live e Search Live su dispositivi Android

Continue reading

NEXT

Honor magic8 lite: un’analisi di qualità e prezzo conveniente

HONOR Magic8 Lite rappresenta la proposta più economica della serie Magic8, rivolta a un pubblico attento al budget o a chi non necessita di uno smartphone top di gamma. Nonostante il prezzo contenuto, questo dispositivo offre caratteristiche interessanti e un […]
PREVIOUS

Quest 3 a soli 407 dollari per un periodo limitato: non perdere l’occasione

Meta Quest 3 rappresenta attualmente uno dei dispositivi di realtà virtuale più avanzati e apprezzati sul mercato. Grazie a un’offerta imperdibile su Amazon, è possibile acquistarlo a un prezzo scontato senza precedenti, accompagnato da un credito digitale aggiuntivo. L’occasione è […]

Potrebbero interessarti

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

I più popolari

Di tendenza

Per guestpost o linkbuilding scrivi a [email protected]