OVHcloud anunță lansarea oficială a AI Endpoints, o nouă soluție cloud serverless destinată să faciliteze integrarea modelelor de inteligență artificială în aplicațiile și serviciile de afaceri. Concepută pentru a democratiza utilizarea IA, platforma oferă o bibliotecă de peste 40 de modele open source, acoperind o gamă largă de cazuri de utilizare profesională.
AI Endpoints permite dezvoltatorilor să acceseze modele de procesare a limbajului natural (LLM), de generare de cod, de recunoaștere vocală sau de generare de imagini, fără a fi nevoie să gestioneze infrastructura de bază sau să dispună de o expertiză avansată în machine learning. Soluția se bazează pe mediul cloud suveran al OVHcloud, garantând o găzduire securizată a datelor în Europa, precum și protecția acestora față de reglementările extra-europene.
Platforma oferă un mediu de testare (sandbox) care le permite dezvoltatorilor să experimenteze capacitățile modelelor înainte de integrarea completă, precum și API-uri care facilitează integrarea în mediile de dezvoltare existente. Cazurile de utilizare vizate includ automatizarea serviciului clienți, asistența la codare, extragerea de text din documente nestructurate sau conversia voce-text și text-voce. OVHcloud subliniază transparența abordării sale, cu modele furnizate în open weight, care pot fi implementate pe infrastructuri terțe sau on-premise, în funcție de nevoile organizațiilor.
După o previzualizare, soluția a fost treptat îmbogățită cu noi modele, ținând cont de feedback-ul utilizatorilor (suport pentru modele stabile, gestionare rafinată a cheilor API etc.). În prezent, AI Endpoints oferă peste 40 de modele IA open-source de ultimă generație, inclusiv:
LLM : Llama 3.3 70B, Mixtral 8x7B, ...
SLM : Mistral Nemo, Llama 3.1 8B, ...
Cod : Qwen 2.5 Coder 32B, Codestral Mamba
Raționament : DeepSeek-R1 (Llama distilat)
Multimodal : Qwen 2.5 VL 72B, ...
Generare de imagini : SDXL
Voce și discurs : ASR (speech-to-text), TTS (text-to-speech)
Platforma permite inferența la cerere, cu o tarifare pe bază de utilizare, bazată pe numărul de jetoane consumate pe minut și pe model. Găzduită în centrul de date din Gravelines, lângă Dunkerque, care utilizează un sistem de răcire cu apă pentru a minimiza impactul asupra mediului, este deja disponibilă în Europa, Canada și în regiunea Asia-Pacific.
Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale