OVHcloud оголошує про офіційний запуск AI Endpoints, нового безсерверного хмарного рішення, призначеного для спрощення інтеграції моделей штучного інтелекту в бізнес-додатки та сервіси. Розроблена для демократизації використання ШІ, платформа пропонує бібліотеку з понад 40 моделей з відкритим кодом, що охоплюють широкий спектр професійних випадків використання.
AI Endpoints дозволяє розробникам отримувати доступ до моделей обробки природної мови (LLM), генерації коду, розпізнавання голосу або генерації зображень без необхідності управління підлягаючою інфраструктурою чи наявності поглиблених знань у галузі машинного навчання. Рішення базується на суверенному хмарному середовищі OVHcloud, забезпечуючи безпечний хостинг даних в Європі, а також їх захист у контексті позаєвропейських регуляторних норм.
Платформа пропонує тестове середовище (sandbox), що дозволяє розробникам експериментувати з можливостями моделей до їх повної інтеграції, а також API, що полегшують інтеграцію в існуючі середовища розробки. Цільові випадки використання включають автоматизацію обслуговування клієнтів, допомогу в кодуванні, вилучення тексту з неструктурованих документів або конвертацію голосу в текст і тексту в голос. OVHcloud підкреслює прозорість свого підходу, з моделями, наданими у відкритій вазі, які можуть бути розгорнуті на сторонніх інфраструктурах або на місці відповідно до потреб організацій.
Після попереднього перегляду рішення було поступово збагачено новими моделями з урахуванням зворотного зв'язку від користувачів (підтримка стабільних моделей, покращене управління ключами API тощо). В даний час AI Endpoints пропонує понад 40 open-source моделей ШІ останнього покоління, серед яких:
LLM : Llama 3.3 70B, Mixtral 8x7B, ...
SLM : Mistral Nemo, Llama 3.1 8B, ...
Код : Qwen 2.5 Coder 32B, Codestral Mamba
Міркування : DeepSeek-R1 (Llama distillé)
Мультимодальний : Qwen 2.5 VL 72B, ...
Генерація зображень : SDXL
Голос і мова : ASR (speech-to-text), TTS (text-to-speech)
Платформа дозволяє інференцію на запит, з тарифікацією за використання, що базується на кількості токенів, спожитих за хвилину та модель. Розміщена в дата-центрі Гравелінес, поблизу Дюнкерка, який використовує систему водяного охолодження для мінімізації впливу на довкілля, вона вже доступна в Європі, Канаді та в Азіатсько-Тихоокеанському регіоні.
Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale
Перекладено з L'IA clé en main : OVHcloud lance AI Endpoints, sa plateforme serverless d’IA open source