Cohere推出Command A，加拿大企业级AI模型的替代方案

TLDR : Cohere推出Command A，加拿大企业级AI模型，以1110亿参数与GPT-4o和DeepSeek-V3竞争，优化硬件需求和成本。

加拿大独角兽公司Cohere最近推出了“Command A”，这是其旗舰模型的最新版本。与其前代产品一样，该模型专为满足企业需求而设计，这款拥有1110亿参数的大型语言模型结合了高性能和高效能，能够与领先的模型如GPT-4o和DeepSeek-V3竞争。

Command A对企业的一个主要优势是其极小的硬件需求。当大多数类似模型需要多达32个GPU时，Command A只需两个A100或H100 GPU即可高效运行，这显著降低了成本和延迟，同时提高了执行速度。除了更快的首个token生成外，该模型每秒最多可生成156个tokens，吞吐量是GPT-4o的1.75倍和DeepSeek-V3的2.4倍。

Command A的性能评价

Cohere对Command A与GPT-4o和DeepSeek-V3的性能进行了比较，在学术基准测试中包括MMLU（通识知识）、MATH、IFEval（指令跟踪）、智能代理测试（BFCL、Taubench）和编码基准（MBPPPlus、SQL、RepoQA）。

其在指令跟踪、编码，特别是SQL以及代理任务方面的能力超过了竞争对手。

在人工评估测试中，Command A覆盖了23种主要语言，并在多种语言上超越了竞争对手，尤其是在阿拉伯方言中，其表现得比GPT-4o和DeepSeek-V3更为连贯和准确。这种适应本地语境的能力对于在国际市场运营的企业来说是一项战略优势。

为企业优化的功能

与其前代产品支持128,000个token的上下文长度相比，Command A支持256个tokens的上下文长度，使其能够分析长篇企业文档。它集成了先进的功能，如带有可验证引用的增强生成（RAG）和安全的代理工具使用。

在以下方面特别高效：

从大量财务报告中分析和提取信息；
根据当地特定要求管理人力资源政策；
验证和解释复杂的法律法规。

通过与Cohere的AI代理平台North的无缝集成，Command A允许企业在保持高安全性和合规性的同时，开发定制的AI解决方案。

可用性和定价

目前，Command A已经在Cohere平台上提供，并将很快获得主要云供应商的支持。定价为每百万输入tokens 2.50美元，每百万输出tokens 10.00美元。它也可以在Hugging Face上用于研究目的。

翻译自 Cohere dévoile Command A, son alternative canadienne aux modèles d'IA pour entreprise américains et chinois

Pour mieux comprendre

什么是LLM，为什么它对企业很重要？

LLM（大型语言模型）是一种人工智能模型，它使用大量数据来理解、生成和处理自然语言。对企业来说，通过简化客户服务、分析复杂数据、改善沟通和决策，这可以改变运营。

检索增强生成（RAG）如何增强像Command A这样的LLM的功能？

RAG，即检索增强生成，允许LLM用当前和相关的外部数据丰富其响应。通过咨询外部数据库或文档，验证所提供的信息，并提高生成输出的准确性和相关性。