Xiaomi ha recentemente ampliato il panorama dell’intelligenza artificiale open-source con l’introduzione di MiMo, un modello linguistico che si propone di migliorare le capacità di ragionamento. Questo nuovo sistema è frutto del lavoro del neonato team “Xiaomi Big Model Core Team” e rappresenta un modello da 7 miliardi di parametri. Sebbene non sia tra i più grandi, Xiaomi sostiene che MiMo offre prestazioni superiori rispetto a modelli ben più complessi, in particolare nell’ambito della risoluzione matematica e nella generazione di codice.
xaiomi mimo: caratteristiche principali
MiMo si distingue per la sua capacità di affrontare compiti complessi nonostante le dimensioni contenute. La strategia adottata da Xiaomi prevede un’ottimizzazione delle fasi di pre-addestramento e post-addestramento, massimizzando il potenziale del modello base attraverso tecniche specifiche. Questa scelta consente anche una maggiore usabilità per aziende con risorse limitate.
pre-addestramento: ottimizzazione dei dati
La fase iniziale ha visto una cura particolare nella gestione dei dati, con l’obiettivo di aumentare la densità dei modelli di ragionamento. È stato creato un dataset composto da circa 200 miliardi di “token” dedicati al ragionamento, utilizzando una strategia di miscelazione in tre fasi su un totale impressionante di 25 trilioni di token.
post-addestramento: apprendimento per rinforzo
Dopo la costruzione iniziale, MiMo è stato perfezionato mediante l’apprendimento per rinforzo (RL), affrontando circa 130.000 problemi matematici e informatici verificati per accuratezza e difficoltà.
prestazioni del modello mi mo
I risultati ottenuti dal modello MiMo-7B-RL sono promettenti, mostrando punteggi competitivi nei benchmark:
- Matematica:
- MATH-500: 95.8% di accuratezza al primo tentativo.
- AIME 2024: media del 68.2% Pass@1 su 32 prove.
- AIME 2025: media del 55.4% Pass@1 su 32 prove.
- Generazione codice:
- LiveCodeBench v5: 57.8% Pass@1 (media su 8 prove).
- LiveCodeBench v6: 49.3% Pass@1 (media su 8 prove).
- Compiti generali:
- GPQA Diamond: 54.4% Pass@1 (media su 8 prove).
- MMLU-Pro: 58.6% Exact Match.
dove trovare xiaomi mimo?
Xiaomi ha reso disponibile l’intera serie MiMo-7B come open-source, consentendo a sviluppatori e ricercatori di scaricare e utilizzare i modelli tramite Hugging Face, accompagnati da report dettagliati pubblicati su GitHub.
- Xiaomi Big Model Core Team
- Sviluppatori AI open-source
- Ecosistema Hugging Face
- Pionieri dell’intelligenza artificiale collaborativa
- Cercatori nel campo della tecnologia AI avanzata
L’accessibilità ai modelli rappresenta un passo significativo verso l’innovazione nel settore dell’IA, contribuendo alla comunità tecnologica globale.
Lascia un commento