Зміст
30 січня Mistral AI, французький єдиноріг у сфері GenAI, представив Small 3, LLM з 24 мільярдами параметрів, демонструючи, що для високої продуктивності LLM не потребує астрономічної кількості параметрів. Small 3.1, його наступник, зберігає компактну архітектуру, водночас впроваджуючи значні покращення у продуктивності, мультимодальному розумінні та управлінні довгими контекстами, перевершуючи такі моделі, як Gemma 3-it 27B від Google та GPT-4o Mini від OpenAI.
Джерело: Mistral AI
Оптимізація продуктивності
- Навчена версія, Mistral Small 3.1 Instruct, готова для використання у розмовних завданнях та розумінні мови;
- Попередньо навчена версія, Mistral Small 3.1 Base, ідеальна для доопрацювання та спеціалізації на конкретних областях (охорона здоров'я, фінанси, юридичні питання тощо).
- Small 3.1 Instruct демонструє кращі результати, ніж Gemma 3-it (27B) від Google у текстових, мультимодальних та багатомовних завданнях;
- Він перевершує GPT-4o Mini від OpenAI у бенчмарках, таких як MMLU, HumanEval та LongBench v2, завдяки розширеному контекстному вікну до 128 000 токенів;
- Він також перевершує Claude-3.5 Haiku у складних завданнях, що передбачають довгі контексти та мультимодальні дані;
- Він відмінно виступає проти Cohere Aya-Vision (32B) у мультимодальних бенчмарках, таких як ChartQA та DocVQA, демонструючи просунуте розуміння візуальних та текстових даних;
- Small 3.1 демонструє високі результати у багатомовності, перевершуючи своїх конкурентів у категоріях, таких як європейські та азійські мови.
Краще зрозуміти
Що таке LLM (велика мовна модель) з точки зору технології та функціонування?
LLM - це модель штучного інтелекту, розроблена для розуміння та генерації природної мови. Вона складається з мільярдів параметрів, які налаштовуються через тренування на великих обсягах тексту для передбачення наступного слова у реченні. LLMи використовуються для таких застосувань, як автоматичний переклад, підсумовування тексту та розмовні агенти.
Що таке ліцензія Apache 2.0 і чому вона важлива для проектів з відкритим кодом?
Ліцензія Apache 2.0 - це ліцензія на програмне забезпечення з відкритим кодом, яка дозволяє користувачам вносити значні зміни та використовувати програмне забезпечення в комерційних чи приватних цілях, надаючи при цьому патенти. Вона важлива, оскільки забезпечує, що внески залишаються безкоштовними та доступними, сприяючи інноваціям і впровадженню нових технологій.