OVHcloud正式宣布推出AI Endpoints,这是一款新型无服务器云解决方案,旨在简化人工智能模型在业务应用和服务中的集成。该平台设计用于普及AI的使用,提供了一个包含超过40个开源模型的库,涵盖广泛的专业应用场景。
AI Endpoints使开发者能够访问自然语言处理(LLM)、代码生成、语音识别及图像生成等模型,而无需管理底层基础设施或具备深入的机器学习专业知识。该解决方案基于OVHcloud的主权云环境,确保数据在欧洲的安全托管,并保护其免受欧洲以外法规的影响。
该平台提供了一个测试环境(sandbox),允许开发者在完全集成之前测试模型的能力,以及便于在现有开发环境中集成的API。目标应用场景包括客户服务自动化、代码辅助、从非结构化文档中提取文本,以及语音转文本和文本转语音等。OVHcloud强调其透明的方法,提供的模型以open weight形式提供,可以根据组织的需求部署在第三方基础设施或本地。
经过预览阶段后,该解决方案逐步通过新模型的引入得到丰富,考虑了用户反馈(支持稳定模型,更精细的API密钥管理等)。目前,AI Endpoints提供超过40个最新一代的开源AI模型,包括:
LLM : Llama 3.3 70B, Mixtral 8x7B, ...
SLM : Mistral Nemo, Llama 3.1 8B, ...
代码 : Qwen 2.5 Coder 32B, Codestral Mamba
推理 : DeepSeek-R1 (Llama distillé)
多模态 : Qwen 2.5 VL 72B, ...
图像生成 : SDXL
语音和演讲 : ASR (语音转文本), TTS (文本转语音)
该平台支持按需推理,基于每分钟每个模型消耗的代币数量进行计费。托管在接近敦刻尔克的Gravelines数据中心,采用水冷系统以尽量减少环境影响,目前已在欧洲、加拿大和亚太地区提供。

Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale

Pour mieux comprendre