Il recente aggiornamento di Google Gemini ha introdotto funzionalità di analisi video, suscitando interesse tra gli utenti. Questa nuova capacità si basa sull’abilità preesistente dell’intelligenza artificiale di riassumere i contenuti dei video su YouTube. La seguente analisi esplora l’efficacia di Gemini nell’analizzare diversi tipi di video e le sue prestazioni in vari test pratici.
come funziona l’analisi video di gemini
Per valutare le capacità di Gemini, sono stati selezionati vari video dal proprio archivio personale, ponendo domande specifiche ad ogni test. Le risposte fornite dall’IA variavano a seconda delle domande formulate.
test 1: riconoscimento oggetti
Gemini è riuscita a identificare correttamente il tipo di anatre presenti nel video, grazie anche ad alcuni suggerimenti. Inoltre, ha determinato la posizione della registrazione con una precisione sorprendente, arrivando a localizzarla entro 100 metri.
test 2: riconoscimento localizzazione
Durante un secondo test che riguardava un’eruzione del vulcano Kilauea, Gemini ha identificato correttamente il vulcano ma non è stata in grado di stabilire la data esatta della registrazione.
test 3: riconoscimento localizzazione (parade)
In un altro esempio relativo a una parata durante il Karneval a Colonia, Gemini ha avuto difficoltà a fornire informazioni precise sulla città, pur riconoscendo il paese e il contesto festivo.
test 4: riconoscimento audio
L’interesse per la capacità di Gemini di riconoscere brani musicali si è rivelato deludente. I risultati ottenuti sono stati imprecisi:
- Identificazione errata del brano “Solid Rock” come “I Know Alone”.
- Confusione tra “Surfing with the Alien” e “Can’t Stop”.
- Corretto riconoscimento di “Like a Rolling Stone”.
- Errori nel identificare “Wildflowers” come “You Belong To Me”.
gemini e le sue limitazioni nell’analisi video
Anche se alcune funzioni hanno mostrato potenziale, molte altre prove hanno evidenziato limiti significativi nelle performance complessive dell’intelligenza artificiale. L’accuratezza nelle analisi dipendeva fortemente dalla presenza di indizi visivi chiari e da domande ben formulate.
A seguito delle esperienze condotte con Gemini, si conclude che l’affidabilità dell’analisi video rimane discutibile rispetto alle aspettative iniziali. Gli utenti potrebbero preferire continuare a guardare e analizzare i contenuti autonomamente piuttosto che affidarsi esclusivamente all’intelligenza artificiale per tale scopo.
Lascia un commento