Baidu przyspiesza w GenAI z ERNIE 4.5 i ERNIE X1, dwoma darmowymi modelami

Baidu przyspiesza w GenAI z ERNIE 4.5 i ERNIE X1, dwoma darmowymi modelami

W skrócie : Baidu wprowadza darmowe modele AI ERNIE 4.5 i ERNIE X1, konkurując z amerykańskimi firmami dzięki zaawansowanym technologiom i agresywnej polityce cenowej.

Wraz z wprowadzeniem R1, DeepSeek nie tylko wywołał falę uderzeniową w Dolinie Krzemowej, ale także zaostrzył konkurencję w samym Państwie Środka. W lutym ubiegłego roku Baidu, główny chiński gracz w dziedzinie GenAI, posiadacz wyszukiwarki o tej samej nazwie, odpowiedział zapowiedzią otwartego udostępnienia w czerwcu swojego modelu AI Ernie oraz udostępnienia za darmo swojego chatbota Ernie Bot. Zintensyfikował swoje działania, ponieważ wczoraj opublikował ERNIE 4.5, najnowszą wersję swojego multimodalnego modelu bazowego, a także ERNIE X1, model skoncentrowany na rozumowaniu, oferujący wydajność porównywalną z R1, ale za połowę ceny. Oba modele są zintegrowane z Ernie Bot, który tym samym jest dostępny za darmo nieco wcześniej niż planowano.
Według Baidu, ERNIE 4.5 zawiera znaczące postępy w zakresie rozumienia, generowania, rozumowania i pamięci. Obejmuje on lepsze zarządzanie halucynacjami i optymalizację rozumowania logicznego. Jego zdolność do jednoczesnego przetwarzania tekstu, obrazów, dźwięku i wideo czyni go potężnym narzędziem do różnorodnych zastosowań, od dialogu po tworzenie treści.
Ulepszenia wprowadzone do modelu przypisuje się kilku kluczowym technologiom, w tym dynamicznemu maskowaniu uwagi „FlashMask”, heterogenicznemu multimodalnemu mieszaniu ekspertów, kompresji reprezentacji czasowo-przestrzennej, budowie danych treningowych skoncentrowanych na wiedzy oraz ulepszonej autorefleksji po szkoleniu.
W swoim komunikacie firma twierdzi, że ERNIE 4.5 przewyższa GPT-4.5 w kilku benchmarkach, jednocześnie będąc 100 razy tańszym.
Z kolei ERNIE X1, skoncentrowany na rozumowaniu multimodalnym i wykorzystaniu zaawansowanych narzędzi, wyróżnia się w planowaniu, analizie i rozwiązywaniu złożonych problemów. Zawiera on specyficzne funkcje, takie jak zaawansowane wyszukiwanie, generowanie i interpretacja obrazów, czytanie stron internetowych oraz mapowanie koncepcyjne za pomocą TreeMind.

Zakład na dostępność i konkurencyjność

Poprzez udostępnienie tych modeli za darmo dla szerokiej publiczności oraz oferowanie konkurencyjnych cen dla firm za pośrednictwem swojej platformy cloud Qianfan, Baidu dąży do wzmocnienia swojego wpływu w ekosystemie AI. ERNIE 4.5 oferowany jest w cenie 0,004 RMB (około 0,0005 euro) za tysiąc tokenów wejściowych i 0,016 RMB (około 0,002 euro) za wyjściowe, podczas gdy ERNIE X1 oferowany jest w jeszcze niższych cenach: 0,002 RMB (około 0,00025 euro) za tę samą liczbę tokenów wejściowych i 0,008 RMB (około 0,001 euro) za wyjściowe.
Ta agresywna polityka cenowa idzie w parze z chęcią demokratyzacji generatywnej AI, jednocześnie stopniowo integrując te modele w produktach i usługach Baidu, w tym w jego wyszukiwarce i aplikacji Wenxiaoyan.
Oferując model o wydajności porównywalnej z R1, ale za połowę ceny, Baidu wyraźnie pokazuje swoje ambicje dominacji w tym sektorze nie tylko w Chinach, ale także na tle amerykańskich graczy.

Bardziej zrozumiałe

Czym jest dynamiczne maskowanie uwagi « FlashMask » i jak działa?

Dynamiczne maskowanie uwagi, znane jako « FlashMask », to zaawansowana technika stosowana w modelach sztucznej inteligencji do optymalizacji alokacji uwagi podczas przetwarzania danych multimodalnych. Pozwala modelowi dynamicznie koncentrować i dostosowywać swoją uwagę na najbardziej istotnych częściach danych wejściowych, poprawiając wydajność przetwarzania i dokładność wyników.

Jakie są implikacje regulacyjne dla Baidu w Chinach w związku z otwarciem kodu źródłowego modelu AI Ernie?

Otwarcie kodu źródłowego modelu AI Ernie przez Baidu może mieć istotne implikacje regulacyjne. W Chinach rząd aktywnie promuje innowacje technologiczne, jednocześnie zapewniając bezpieczeństwo narodowe i cyberbezpieczeństwo. Baidu będzie musiało poruszać się w tym skomplikowanym środowisku regulacyjnym, zapewniając zgodność z przepisami dotyczącymi ochrony danych i regulacjami dotyczącymi eksportu technologii, podczas gdy będą dążyć do promowania współpracy międzynarodowej i otwartych innowacji.