OpenAI ha appena lanciato tre nuovi modelli all'interno della sua API: GPT-4.1, GPT-4.1 mini e GPT-4.1 nano. Questi modelli apportano miglioramenti significativi in termini di codifica, rispetto delle istruzioni e offrono una gestione estesa del contesto, fino a 1 milione di token.

Prestazioni ottimizzate

Il modello di punta, GPT-4.1, migliora sensibilmente le prestazioni rispetto a GPT-4o, in particolare nei seguenti ambiti:

  • Codifica: GPT-4.1 raggiunge il 54,6% nel benchmark SWE-bench Verified, un aumento notevole rispetto a GPT-4o (33,2%) e GPT-4.5 (38%). Questo risultato indica un miglioramento della sua capacità di risolvere problemi complessi di sviluppo software.

  • Rispetto delle istruzioni: Nella valutazione MultiChallenge di Scale, GPT-4.1 ottiene il 38,3%, migliorando di 10,5 punti assoluti le prestazioni rispetto a GPT-4o.

  • Contesto lungo: GPT-4.1 stabilisce un nuovo record con il 72% nel benchmark Video-MME, dedicato alla comprensione di contenuti multimodali in contesto esteso.

Una gamma completa per rispondere a bisogni vari

Oltre a GPT-4.1, le versioni mini e nano offrono compromessi efficaci tra prestazione e costo:

  • GPT-4.1 mini: questo modello più compatto supera GPT-4o in diverse valutazioni riducendo notevolmente la latenza (quasi della metà) e il costo (riduzione dell'83%).

  • GPT-4.1 nano: il modello più veloce ed economico, ideale per compiti come la classificazione o l'autocompletamento, offrendo nonostante la sua dimensione ridotta, un contesto fino a 1 milione di token.

Capacità potenziate per gli agenti intelligenti

Grazie ai suoi miglioramenti in affidabilità nel rispetto delle istruzioni e nella comprensione del contesto esteso, GPT-4.1 rafforza le applicazioni basate su agenti autonomi. Gli sviluppatori possono ora costruire sistemi più affidabili ed efficienti per la gestione documentale, lo sviluppo software, o il trattamento automatizzato delle richieste dei clienti.

Fine programmata di GPT-4.5 Preview

OpenAI ha annunciato la futura deprezzamento del modello GPT-4.5 Preview a favore di GPT-4.1, offrendo prestazioni superiori a un costo inferiore. GPT-4.5 Preview sarà disattivato a partire dal 14 luglio 2025, per consentire agli sviluppatori di effettuare una transizione fluida.

Disponibilità esclusiva tramite API

Si noti che GPT-4.1 sarà disponibile esclusivamente tramite l'API di OpenAI. Tuttavia, gli utenti di ChatGPT beneficiano progressivamente dei miglioramenti di GPT-4.1 integrati nella versione GPT-4o.

Tariffazione ottimizzata

Con una tariffazione rivista al ribasso, GPT-4.1 è ora accessibile a un costo inferiore del 26% rispetto a GPT-4o per le richieste comuni. La tariffazione molto competitiva di GPT-4.1 nano la rende l'offerta più conveniente mai proposta da OpenAI.

 

Fonte: https://openai.com/index/gpt-4-1/

Per capire meglio

Che cos'è il benchmark SWE-bench Verified utilizzato per valutare i modelli di OpenAI?

Lo SWE-bench Verified è una suite di test progettata per valutare le capacità dei modelli di intelligenza artificiale nel risolvere problemi complessi di sviluppo software. Misura le competenze di codifica dei modelli e la loro efficienza nel seguire istruzioni di sviluppo precise.

Qual è l'attuale regolamentazione riguardante i modelli di IA come GPT-4.1?

I modelli di IA come GPT-4.1 devono conformarsi a regolamentazioni che includono la protezione dei dati personali, la trasparenza degli algoritmi e la responsabilità per eventuali bias. L'Unione Europea sta lavorando sull'AI Act, che potrebbe imporre rigidi standard di conformità per i modelli ad uso commerciale.