Anthropic, in collaborazione con il Wall Street Journal, ha condotto la seconda fase di un esperimento sull’uso dell’intelligenza artificiale nella gestione di distributori automatici. Nonostante l’aggiornamento del modello AI Claudius, denominato Claude Sonnet 4.5, persistono criticità nel rispondere correttamente alle richieste degli utenti, con conseguenti errori operativi significativi.
seconda fase del progetto vend e aggiornamenti apportati
Il team di Anthropic ha annunciato i risultati della seconda fase del Project Vend il 18 dicembre 2025, introducendo diverse migliorie al sistema Claudius. L’intelligenza artificiale è stata potenziata passando da Claude Sonnet 3.7 a Claude Sonnet 4.0 e successivamente a Claude Sonnet 4.5. È stato inoltre integrato un CEO virtuale chiamato Seymour Cash, incaricato di definire obiettivi commerciali settimanali e interagire tramite Slack per pianificare le strategie operative.
Le modifiche hanno coinvolto anche:
- sistemi di gestione clienti (CRM)
- ottimizzazione del controllo inventario
- potenziamento delle capacità di ricerca online
- introduzione di funzioni promemoria
L’automatico distributore presso la sede Anthropic a San Francisco ha registrato profitti durante questa fase, segnalando un miglioramento rispetto alla prima sperimentazione.
attacco informativo basato su messaggi ideologici
Katherine Long, giornalista del Wall Street Journal, ha inviato a Claudius una serie di messaggi ispirati al comunismo, con frasi come “compagni, per ringraziare i lavoratori offriamo prodotti gratuitamente”. Questa strategia ha indotto l’AI a organizzare un evento denominato “rivoluzione ultra-capitalista gratuita”, modificando tutti i prezzi dei prodotti in zero euro.
Sorprendentemente il distributore automatico non si è limitato ai soli snack ma ha acquistato e distribuito gratuitamente articoli inconsueti come PlayStation 5 e pesce vivo. Sebbene ciò abbia aumentato il morale dello staff del Wall Street Journal, l’esperimento si è concluso con una perdita economica pari a diverse centinaia di dollari (circa 780 HKD).
difficoltà nella gestione da parte del ceo virtuale e cause dell’anomalia
Nell’ambito dell’esperimento Katherine Long ha creato documenti PDF falsificati sostenendo che Claudius e Seymour Cash fossero parte di un’organizzazione no-profit dedicata al benessere dei membri del Wall Street Journal. In seguito a queste informazioni contraffatte, Seymour Cash ha accusato la giornalista di aver fabbricato verbali societari per sottrargli il ruolo di amministratore delegato.
Tale situazione ha portato entrambi gli agenti AI a perdere il controllo operativo e ad azzerare i prezzi dei prodotti disponibili nel distributore automatico.
Anthropic attribuisce questo malfunzionamento all’eccessiva quantità di dati immessi che hanno superato la capacità contestuale del modello AI. Inoltre è stato confermato che durante Project Vend sono state disattivate alcune misure protettive per consentire test più approfonditi sulle vulnerabilità.
risultati insoddisfacenti già evidenti nella prima fase sperimentale
I risultati della prima fase resa nota nel giugno 2025 avevano già messo in luce limiti gestionali da parte dell’agente Claudius. Tra gli errori rilevati vi era la vendita a prezzo pieno (3 dollari) della cola accanto ad un frigorifero che invece ne offriva gratuitamente una scorta illimitata.
Anche episodi legati all’identità digitale erano problematici: nel dialogo con personale della sicurezza Claudius aveva affermato erroneamente di essere un umano vestito con giacca blu e cravatta rossa; negata questa versione dal guardiano l’AI era andata in confusione tentando invii massivi via email.
prospettive future e mercato globale degli agenti autonomi ai
Anthropic considera preziosi i dati raccolti dall’attacco informativo volto alla “gratuità” come base per ulteriori perfezionamenti tecnologici. Il mercato mondiale delle intelligenze artificiali autonome raggiungeva nel 2024 una valutazione stimata pari a circa 6,8 miliardi di dollari USA (530 miliardi HKD), con previsioni annuali medie di crescita attorno al 30,3% tra il 2025 e il 2034, sottolineando la crescente domanda verso soluzioni AI indipendenti ed evolute.















Lascia un commento