Questo testo presenta Codex Security, la nuova soluzione di OpenAI dedicata al rilevamento delle vulnerabilità software ad alto impatto. L’approccio si fonda su agenti intelligenti capaci di analizzare il contesto di un progetto, ridurre il rumore dei falsi positivi e proporre patch mirate. Verranno illustrate le basi operative, i risultati dei test su progetti di rilievo e le prospettive competitive, insieme alle modalità di accesso disponibili.
openai presenta codex security: un nuovo strumento di rilevamento delle vulnerabilità
OpenAI propone Codex Security, originariamente noto con il nome in codice “Aardvark”, come strumento agentico orientato al rinvenimento di vulnerabilità software di grande impatto. Dopo una fase privata di beta, passa all’anteprima di ricerca ed è accessibile agli utenti di ChatGPT Pro, Enterprise, Business ed Edu. Per incentivare l’uso, viene offerto un mese gratuito.
come funziona codex security
Il principio essenziale è la costruzione di un contesto dettagliato del progetto: non si limita a individuare errori generici, ma genera un modello di minaccia basato sul ruolo del sistema e sui componenti affidati. Tale approccio permette di minimizzare i falsi positivi e di fornire indicazioni mirate per la mitigazione.
risultati della fase di test
Durante la fase di valutazione, Codex Security è stato testato su 1,2 milioni di commit, identificando quasi 800 vulnerabilità critiche e oltre 10.000 problemi di severità elevata. Le analisi hanno riguardato progetti di portata ampia, tra cui Chromium, OpenSSL e PHP, evidenziando la capacità del sistema di rilevare criticità significative in ambienti reali.
una risposta diretta ad anthropic?
La tempistica del rilascio appare mirata: di recente, Claude 4.6 ha riportato 14 vulnerabilità ad alta severità in Mozilla Firefox in sole due settimane, stimolando l’interesse verso strumenti agentic AI per la sicurezza. In tale contesto, Codex Security si presenta come soluzione in grado di offrire un ragionamento avanzato non solo per individuare la falla, ma anche per suggerire la patch esatta necessaria per la correzione.
confronto con claude
Rispetto agli strumenti di scansione della vulnerabilità disponibili da tempo, come quelli offerti da GitHub e Google, la nuova generazione di agenti promette un livello di ragionamento superiore, capace di andare oltre la scoperta e di proporre interventi specifici per la remediation.
disponibilità e prezzo
Nel prossimo periodo, utenti idonei possono esplorare Codex via web gratuitamente. L’adozione nell’anteprima di ricerca lascia prevedere una futura definizione del modello di prezzo, con l’obiettivo di consentire ai team di distribuire codice più rapidamente senza compromettere la sicurezza finale.










Lascia un commento