OVHcloud ogłasza oficjalne wprowadzenie AI Endpoints, nowego rozwiązania chmurowego serverless, mającego na celu ułatwienie integracji modeli sztucznej inteligencji w aplikacjach i usługach biznesowych. Zaprojektowana w celu demokratyzacji użycia AI, platforma oferuje bibliotekę ponad 40 modeli open source, obejmujących szeroki zakres zastosowań profesjonalnych.
AI Endpoints umożliwia deweloperom dostęp do modeli przetwarzania języka naturalnego (LLM), generowania kodu, rozpoznawania mowy czy generowania obrazów, bez konieczności zarządzania infrastrukturą ani posiadania zaawansowanej wiedzy w dziedzinie uczenia maszynowego. Rozwiązanie opiera się na suwerennym środowisku chmurowym OVHcloud, gwarantującym bezpieczne przechowywanie danych w Europie oraz ich ochronę przed regulacjami spoza Europy.
Platforma oferuje środowisko testowe (sandbox), umożliwiające deweloperom eksperymentowanie z możliwościami modeli przed ich pełną integracją, a także API ułatwiające integrację w istniejących środowiskach deweloperskich. Docelowe przypadki użycia obejmują automatyzację obsługi klienta, wsparcie w kodowaniu, ekstrakcję tekstu z nieustrukturyzowanych dokumentów, a także konwersję głos-tekst i tekst-głos. OVHcloud podkreśla przejrzystość swojego podejścia, z modelami dostarczanymi w formie open weight, które mogą być wdrażane na infrastrukturach zewnętrznych lub lokalnych, zgodnie z potrzebami organizacji.
Po fazie zapoznawczej, rozwiązanie zostało stopniowo wzbogacone o nowe modele, uwzględniając opinie użytkowników (wsparcie dla stabilnych modeli, lepsze zarządzanie kluczami API itp.). Obecnie AI Endpoints oferuje ponad 40 nowoczesnych modeli AI open-source, w tym:
LLM : Llama 3.3 70B, Mixtral 8x7B, ...
SLM : Mistral Nemo, Llama 3.1 8B, ...
Kod : Qwen 2.5 Coder 32B, Codestral Mamba
Rozumowanie : DeepSeek-R1 (Llama distylowany)
Multimodalny : Qwen 2.5 VL 72B, ...
Generowanie obrazów : SDXL
Głos i mowa : ASR (speech-to-text), TTS (text-to-speech)
Platforma umożliwia inferencję na żądanie, z rozliczeniem opartym na liczbie tokenów zużywanych na minutę i model. Hostowana w centrum danych w Gravelines, niedaleko Dunkierki, które wykorzystuje system chłodzenia wodnego w celu minimalizacji wpływu na środowisko, jest już dostępna w Europie, Kanadzie i regionie Azji i Pacyfiku.

Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale

Bardziej zrozumiałe