カナダのユニコーン企業Cohereは最近、フラッグシップモデルの最新バージョン「Command A」を発表しました。前任者と同様に、企業のニーズに応えるよう特別に設計されたこの1110億パラメーターのLLMは、パフォーマンスとエネルギー効率を兼ね備え、GPT-4oやDeepSeek-V3といった主要モデルと競合します。
 
Command Aの企業向けの主要な利点の一つは、その最小限のハードウェア要件です。ほとんどの類似モデルが最大32 GPUを必要とする中、Command Aはわずか2つのGPU A100またはH100で効率的に動作し、コストと遅延の大幅な削減、および実行速度の向上をもたらします。最初のトークン生成の速度が向上しただけでなく、156トークン/秒まで生成が可能で、GPT-4oの1.75倍、DeepSeek-V3の2.4倍のスループットを達成します。
Command Aの性能
Cohereは、Command AをGPT-4oおよびDeepSeek-V3と比較して、学術的なベンチマーク(MMLU(一般知識)、MATH、IFEval(指示追跡)、知能エージェントのテスト(BFCL、Taubench)、およびコーディングベンチマーク(MBPPPlus、SQL、RepoQA))で評価しました。
その指示追跡、特にSQLでのコーディング、およびエージェントタスクでの能力は、競合他社を上回ります。
人間による評価テストでは、主要な23言語をカバーするCommand Aは、特にアラビア語の方言で、GPT-4oおよびDeepSeek-V3よりも一貫性と正確性で優れていました。このローカルコンテキストへの適応能力は、国際的に事業を展開する企業にとって戦略的な強みを表しています。
企業向けに最適化された能力
その前任者が128,000トークンのコンテキスト長をサポートしていたのに対し、Command Aは256トークンのコンテキスト長を備え、企業の長文ドキュメントの分析に適しています。検証可能な引用を用いた取得による生成(RAG)や、セキュアなエージェントツールの使用といった高度な機能を統合しています。
特に以下の点で効果的です:
  • 大規模な財務報告書からの情報の分析と抽出;
  • ローカルの特性に応じたHRポリシーの管理;
  • 複雑な法規制の検証と解釈。
CohereのAIエージェントプラットフォームNorthとのスムーズな統合により、Command Aは企業がカスタマイズされたAIソリューションを開発し、セキュリティとコンプライアンスの高いレベルを維持することを可能にします。
利用可能性と価格設定
現在Cohereプラットフォーム上で利用可能で、主要なクラウドプロバイダーによるサポートも予定されています。Command Aは、入力100万トークンあたり2.50ドル、出力100万トークンあたり10.00ドルで提供され、Hugging Faceでの研究目的でも利用可能です。

Pour mieux comprendre

LLMとは何ですか、そしてそれは企業にとってなぜ重要なのですか?

LLM(大規模言語モデル)は、自然言語を理解し、生成し、操作するために膨大な量のデータを使用する人工知能モデルです。企業にとって、これは顧客サービスの合理化、複雑なデータの分析、そしてコミュニケーションと意思決定の改善を通じて運営を変革することができます。

リトリーバル・オーグメンテッド・ジェネレーション(RAG)は、Command AのようなLLMの能力をどのように向上させますか?

RAG、またはリトリーバル・オーグメンテッド・ジェネレーションは、LLMが外部の現在の関連データで応答を豊かにします。これは外部データベースや文書を参照し、提供された情報を確認し、生成された出力の正確性と関連性を高めることで行われます。