Il panorama delle applicazioni di intelligenza artificiale sta subendo un’evoluzione significativa con l’introduzione della funzionalità di upload audio nell’app Gemini di Google. Questa nuova opzione permette agli utenti di caricare file audio, una richiesta molto attesa da tempo.
supporto ampliato e casi d’uso ampliati
una funzionalità desiderata da mesi
Josh Woodward, Vice President di Google Labs e Gemini, ha confermato il lancio della funzione tramite un post su X, definendola la “richiesta numero uno”. L’aggiornamento è ora disponibile su Android, iOS e web, consentendo l’upload di file in formati comuni come MP3 e WAV attraverso l’opzione “Carica file”.
È importante notare che esistono alcune limitazioni per gli utenti del piano gratuito: è possibile caricare fino a 10 file contemporaneamente, ma la durata totale non deve superare i 10 minuti. Per gli abbonati ai piani a pagamento — Gemini Advanced via AI Pro o AI Ultra — il limite si estende a tre ore.
Queste restrizioni sono relativamente generose rispetto ad altre funzionalità dell’app. Ad esempio, gli upload video per gli utenti gratuiti sono limitati a 5 minuti, mentre i paganti possono caricare contenuti fino a un’ora. La nuova opzione audio raddoppia il limite per gli utenti gratuiti e offre tre volte quello per i piani premium, rendendola utile per attività come trascrizioni e analisi di podcast.
un’omissione strana nel supporto audio
L’assenza del supporto audio era stata una mancanza sorprendente dall’arrivo degli upload dei file all’inizio dell’anno. Sebbene Gemini fosse già in grado di riassumere video da YouTube e gestire brevi clip, non era possibile registrare un memo vocale e chiedere all’intelligenza artificiale di elaborarlo fino ad ora.
Con questa novità, Gemini si avvicina alla parità delle funzionalità offerte dai concorrenti come ChatGPT di OpenAI, che supporta l’upload audio e la trascrizione da diversi mesi. La questione se dieci minuti siano sufficienti per gli utenti occasionali rimane aperta; Questo sviluppo sembra indicare che Google intenda utilizzare il processamento audio come incentivo per le sottoscrizioni.
- Josh Woodward – Vice President Google Labs
- Utenti gratuiti Gemini
- Piano Gemini Advanced via AI Pro
- Piano AI Ultra
- OpenAI ChatGPT
Per coloro che desiderano provare a caricare estratti da podcast o note vocali personali in Gemini, questa rappresenta finalmente un’opportunità concreta.
Lascia un commento