Cu lansarea R1, DeepSeek nu a creat doar un val de șoc în Silicon Valley, ci a intensificat și concurența chiar în Imperiul de Mijloc. În februarie trecut, Baidu, un actor major chinez în GenAI, deținător al motorului de căutare omonim, a răspuns cu anunțul că va face open source în iunie următor modelul său de IA Ernie și gratuitatea chatbotului său Ernie Bot. A accelerat eforturile întrucât ieri a publicat ERNIE 4.5, cea mai recentă versiune a modelului său de bază multimodal, dar și ERNIE X1, un model axat pe raționament, oferind performanțe comparabile cu R1, dar la jumătate de preț. Ambele sunt integrate în Ernie Bot, care astfel devine gratuit mai devreme decât era prevăzut.
Conform Baidu, ERNIE 4.5 integrează avansuri semnificative în înțelegere, generare, raționament și memorie. Beneficiază în special de o gestionare mai bună a halucinațiilor și o optimizare a raționamentului logic. Capacitatea sa de a procesa simultan text, imagini, sunet și video îl face un instrument puternic pentru aplicații variate, de la dialog la crearea de conținut.
Îmbunătățirile aduse modelului sunt atribuite mai multor tehnologii cheie, inclusiv mascare dinamică a atenției „FlashMask”, amestec multimodal eterogen de experți, compresia reprezentării spațio-temporale, construirea de date de antrenament centrate pe cunoștințe, auto-feedback îmbunătățit post-antrenament.
În comunicatul său, compania afirmă că ERNIE 4.5 depășește GPT-4.5 în mai multe benchmark-uri, fiind în același timp de 100 de ori mai puțin costisitor.
De partea sa, ERNIE X1, axat pe raționament multimodal și utilizarea de instrumente avansate, ar excela în planificare, analiză și rezolvarea problemelor complexe. Integrează funcționalități specifice cum ar fi căutarea avansată, generarea și interpretarea imaginilor, citirea paginilor web, precum și cartografierea conceptuală prin TreeMind.
Un pariu pe accesibilitate și competitivitate
Făcând aceste modele gratuite pentru publicul larg și oferind tarife competitive pentru companii prin platforma sa cloud Qianfan, Baidu caută să-și consolideze influența în ecosistemul IA. ERNIE 4.5 este astfel oferit la 0,004 RMB (aproximativ 0,0005 euro) pe mia de tokeni de intrare și 0,016 RMB (aproximativ 0,002 euro) la ieșire, în timp ce ERNIE X1 afișează prețuri și mai mici: este oferit la 0,002 RMB (aproximativ 0,00025 euro) pentru același număr de tokeni de intrare și 0,008 RMB (aproximativ 0,001 euro) la ieșire.
Această poziționare tarifară agresivă este însoțită de o dorință de a democratiza IA generativă, integrând treptat aceste modele în produsele și serviciile Baidu, inclusiv motorul său de căutare și aplicația Wenxiaoyan.
Oferind un model cu performanțe comparabile cu R1, dar la jumătate de preț, Baidu își arată clar ambiția de a domina sectorul nu doar în China, ci și în fața actorilor americani.
Pentru a înțelege mai bine
Ce este mascherarea dinamică a atenției « FlashMask » și cum funcționează aceasta?
Mascherarea dinamică a atenției, cunoscută sub numele de « FlashMask », este o tehnică avansată utilizată în modele de inteligență artificială pentru a optimiza alocarea atenției atunci când procesează date multimodale. Permite modelului să-și focalizeze și să-și ajusteze dinamic atenția asupra celor mai relevante părți ale datelor de intrare, îmbunătățind astfel eficiența procesării și precizia rezultatelor.
Care sunt implicațiile de reglementare pentru Baidu în China prin deschiderea sursei modelului său de IA Ernie?
Deschiderea sursei modelului de IA Ernie de către Baidu ar putea avea implicații de reglementare semnificative. În China, guvernul promovează activ inovația tehnologică, asigurând în același timp securitatea națională și cibersecuritatea. Baidu va trebui să navigheze în acest mediu de reglementare complex, asigurând conformitatea cu legile privind protecția datelor și reglementările privind exportul tehnologic, în timp ce vizează să stimuleze colaborarea internațională și inovația deschisă.