Con il lancio di R1, DeepSeek non solo ha creato un'onda d'urto nella Silicon Valley ma ha anche intensificato la concorrenza all'interno dell'Impero di Mezzo. Lo scorso febbraio, Baidu, un attore chiave cinese della GenAI, detentore del motore di ricerca omonimo, ha risposto con l'annuncio dell'apertura open source il prossimo giugno del suo modello di IA Ernie e della gratuità del suo chatbot Ernie Bot. Ha raddoppiato gli sforzi poiché ieri ha pubblicato ERNIE 4.5, l'ultima versione del suo modello di fondazione multimodale, ma anche ERNIE X1, un modello focalizzato sul ragionamento, offrendo prestazioni comparabili a R1, ma a metà prezzo. Entrambi sono integrati in Ernie Bot, che di fatto, è gratuito un po' prima del previsto. Secondo
Baidu, ERNIE 4.5 integra significativi progressi in comprensione, generazione, ragionamento e memoria. Beneficia in particolare di una migliore gestione delle allucinazioni e di un'ottimizzazione del ragionamento logico. La sua capacità di trattare simultaneamente testo, immagini, suoni e video lo rende uno strumento potente per applicazioni varie, che vanno dal dialogo alla creazione di contenuti.
I miglioramenti apportati al modello sono attribuiti a diverse tecnologie chiave, tra cui il mascheramento dinamico dell'attenzione "FlashMask", il mix multimodale eterogeneo di esperti, la compressione della rappresentazione spaziotemporale, la costruzione di dati di addestramento centrata sulle conoscenze, l'auto-feedback migliorato post-formazione.
Nel suo comunicato, la società afferma che ERNIE 4.5 supera GPT-4.5 in diversi benchmark, pur essendo 100 volte meno costoso.
Da parte sua, ERNIE X1, focalizzato sul ragionamento multimodale e l'utilizzo di strumenti avanzati, eccellerebbe in pianificazione, analisi e risoluzione di problemi complessi. Integra funzionalità specifiche come la ricerca avanzata, la generazione e l'interpretazione di immagini, la lettura di pagine web così come la mappatura concettuale tramite TreeMind.
Una scommessa sull'accessibilità e la competitività
Rendendo questi modelli gratuiti per il grande pubblico e offrendo tariffe competitive per le imprese tramite la sua piattaforma cloud Qianfan,
Baidu cerca di rafforzare la sua influenza nell'ecosistema dell'IA. ERNIE 4.5 è così proposto a 0,004 RMB (circa 0,0005 euro) per migliaia di token in entrata e 0,016 RMB (circa 0,002 euro) in uscita, mentre ERNIE X1 mostra prezzi ancora più bassi: è proposto a 0,002 RMB (circa 0,00025 euro) per lo stesso numero di token in entrata e 0,008 RMB (circa 0,001 euro) in uscita.
Questa posizione tariffaria aggressiva è accompagnata da una volontà di democratizzare l'IA generativa, integrando progressivamente questi modelli nei prodotti e servizi di
Baidu, in particolare il suo motore di ricerca e l'applicazione Wenxiaoyan.
Proponendo un modello con prestazioni comparabili a R1, ma a metà prezzo,
Baidu mostra chiaramente la sua ambizione di dominare il settore non solo in Cina ma anche nei confronti degli attori americani.
Per capire meglio
Che cos'è il mascheramento dinamico dell'attenzione « FlashMask » e come funziona?
Il mascheramento dinamico dell'attenzione, noto come « FlashMask », è una tecnica avanzata utilizzata nei modelli di IA per ottimizzare l'allocazione dell'attenzione nel trattamento dei dati multimodali. Consente al modello di focalizzare e regolare dinamicamente la sua attenzione sulle parti più rilevanti dei dati in entrata, migliorando così l'efficienza del trattamento e la precisione dei risultati.
Quali sono le implicazioni normative per Baidu in Cina nell'aprire il suo modello di AI Ernie come open source?
L'apertura del modello di AI Ernie di Baidu come open source potrebbe avere significative implicazioni normative. In Cina, il governo promuove attivamente l'innovazione tecnologica assicurando allo stesso tempo la sicurezza nazionale e la cybersicurezza. Baidu dovrà navigare in questo complesso contesto normativo, garantendo la conformità con le leggi sulla protezione dei dati e le normative relative all'esportazione tecnologica, cercando al contempo di favorire la collaborazione internazionale e l'innovazione aperta.