У короткому : Baidu випустила ERNIE 4.5 та ERNIE X1, два безкоштовні ІІ-моделі, інтегровані в Ernie Bot, які пропонують високу продуктивність за низькою ціною, щоб зміцнити свою позицію на ринку ІІ.
З запуском R1, DeepSeek не лише створила сенсацію в Силіконовій долині, але й посилила конкуренцію всередині самого Піднебесної. У лютому минулого року, Baidu, провідний китайський гравець у сфері GenAI та власник однойменної пошукової системи, відповів, оголосивши, що в червні відкриє свій ІІ-модель Ernie та зробить свій чат-бот Ernie Bot безкоштовним. Вчора компанія подвоїла свої зусилля, опублікувавши ERNIE 4.5, останню версію своєї мультимодальної фундаментальної моделі, а також ERNIE X1, модель, орієнтовану на розуміння, яка надає продуктивність, порівнянну з R1, але за половину ціни. Обидві інтегровані в Ernie Bot, який, таким чином, став безкоштовним трохи раніше, ніж планувалося.
За словами Baidu, ERNIE 4.5 інтегрує значні досягнення в розумінні, генерації, розумінні та пам'яті. Він має покращене управління галюцинаціями та оптимізацію логічного мислення. Його здатність одночасно обробляти текст, зображення, звук та відео робить його потужним інструментом для різноманітних застосувань, від діалогів до створення контенту.
Покращення моделі приписуються кільком ключовим технологіям, зокрема динамічному маскуванню уваги «FlashMask», гетерогенному мультимодальному змішуванню експертів, стисненню просторово-часової репрезентації, побудові навчальних даних, зосереджених на знаннях, покращеній авто-відгуковій післятренуванню.
У своєму повідомленні компанія стверджує, що ERNIE 4.5 перевершує GPT-4.5 у кількох бенчмарках, при цьому будучи в 100 разів дешевшим.
Зі свого боку, ERNIE X1, орієнтований на мультимодальне розуміння та використання передових інструментів, відзначається в плануванні, аналізі та вирішенні складних завдань. Він інтегрує специфічні функції, такі як розширений пошук, генерація та інтерпретація зображень, читання веб-сторінок, а також концептуальне картографування через TreeMind.
Ставка на доступність та конкурентоспроможність
Зробивши ці моделі безкоштовними для широкої публіки та запропонувавши конкурентоспроможні тарифи для компаній через свою платформу хмари Qianfan, Baidu прагне зміцнити свій вплив в екосистемі ІІ. ERNIE 4.5 пропонується за ціною 0,004 RMB (приблизно 0,0005 євро) за тисячу вхідних токенів та 0,016 RMB (приблизно 0,002 євро) на виході, тоді як ERNIE X1 має ще нижчі ціни: він пропонується за 0,002 RMB (приблизно 0,00025 євро) за той самий обсяг вхідних токенів та 0,008 RMB (приблизно 0,001 євро) на виході.
Це агресивне цінове позиціонування супроводжується прагненням демократизувати генеративний ІІ, одночасно поступово інтегруючи ці моделі в продукти та послуги Baidu, зокрема в свою пошукову систему та додаток Wenxiaoyan.
Пропонуючи модель з продуктивністю, порівнянною з R1, але за половину ціни, Baidu чітко демонструє своє прагнення домінувати в секторі не лише в Китаї, але й перед американськими гравцями.
Краще зрозуміти
Що таке динамічне маскування уваги « FlashMask » і як воно працює?
Динамічне маскування уваги, відоме як « FlashMask », є передовою технікою, що використовується в моделях штучного інтелекту для оптимізації розподілу уваги під час обробки мультимодальних даних. Це дозволяє моделі динамічно зосереджуватися і коригувати свою увагу на найбільш релевантні частини вхідних даних, покращуючи ефективність обробки та точність результатів.
Які регуляторні наслідки для Baidu в Китаї при відкритті коду їхньої моделі ШІ Ernie?
Відкриття коду моделі ШІ Ernie компанією Baidu може мати суттєві регуляторні наслідки. У Китаї уряд активно сприяє технологічним інноваціям, забезпечуючи при цьому національну безпеку та кібербезпеку. Baidu доведеться орієнтуватися в цьому складному регуляторному середовищі, забезпечуючи відповідність законам про захист даних і положенням про експорт технологій, одночасно намагаючись сприяти міжнародній співпраці та відкритим інноваціям.