Alibaba、WAIC 2025でスマートコックピット、AIメガネ、戦略的パートナーシップを発表
Alibaba CloudはWAIC 2025で、AI言語モデルの応用例としてスマートコックピット、Signifyとの都市照明ソリューション、コネクテッドグラスを発表し、オープンソ...
大規模言語モデル(LLM)は、サイバーセキュリティから医療に至るまで、さまざまな分野で不可欠なツールとしてAIの風景を変え続けています。最近、DeepSeekはそのモデルR1の更新版であるDeepSeek-R1-0528を発表しました。これは、推論、論理、プログラミングの能力を強化しています。このバージョンは2025年5月28日に公開され、OpenAIやGoogleの主要モデルに近い性能を持ちながら、LLMに共通する問題である幻覚の発生率を低下させています。同時に、Tencentは市場のリーダーと競合するために革新的なハイブリッドアーキテクチャを使用した推論モデルHunyuan-T1を導入しました。これらの開発は、LLMの推論能力の向上への関心が高まっていることを強調しており、複雑で重要なシステムに統合するためのキー要素となっています。
サイバーセキュリティの分野では、LLMが脅威の検出と分析を容易にすることでその可能性を示しています。ニューヨーク大学の研究は、LLMが膨大なテキストデータを利用して攻撃を予測し反応する能力を強調しており、サイバーセキュリティをより反応的かつ予防的な分野に変えています。SecureBERTのようなサイバーセキュリティに特化したモデルは、企業にとっての課題であるが、有望な結果を示しています。LLMの専門化への進化は、特定のニーズに応えつつ、精度と信頼性を向上させる言語モデルの適用の多様化を反映しています。
LLMのオープンソースへの関心も続いており、Allen Institute for AIのようなイニシアティブがLlama 3.1に基づいた高性能なオープンソースモデルTülu 3 405Bを発表しました。このモデルは、検証可能な報酬による強化学習を使用し、複雑なタスクでのパフォーマンスを向上させています。同時に、Mistral AIはレイテンシーに最適化されたモデルMistral Small 3を発表し、プロプライエタリモデルに対するオープンソースの代替案を提供しています。これらのイニシアティブは、リソースが限られた環境での採用を拡大するために、推論コストを削減しつつ、LLMへのアクセスを民主化する意欲を反映しています。
大規模言語モデルが進化し続ける中、推論コストや環境への影響といった課題が残っています。Microsoftは最近、1ビットに量子化されたLLMの推論を最適化するオープンソースフレームワークBitNet.cppを発表し、カーボンフットプリントを削減しました。この革新は、モデルのサイズと複雑さが増加し続ける中で、LLMの進化における持続可能性の重要性を強調しています。また、LLMの医療診断への統合はまだ改善の余地があり、UVA Healthの研究によると、LLMは特定のタスクで医師を上回ることができるが、全体的な診断パフォーマンスの向上にはまだ至っていません。
すべての現代LLMの基盤となるtransformerアーキテクチャは、2つの基本要素に支えられています。第1は自己attentionメカニズムであり、モデルがテキスト内の各位置ごとに他の位置の表現を重み付きで組み合わせて計算できるようにします。この処理は本質的に並列化が可能であり、そのためtransformerは2017年までNLP分野を席巻していたRNNやLSTMといったリカレントアーキテクチャに取って代わりました。第2の要素は、同一のtransformer層を数十層(先端モデルでは通常32〜96層)積み重ねることで、それぞれが表現を洗練させていきます。
現代のLLMは、いくつかのアーキテクチャバリエーションに分かれています:
OpenAIはChatGPT、GPT-4o、GPT-4o mini、reasoningモデルo1/o3ファミリーにより市場のリーダーと見なされ続けています。同社は2026年時点で数千億ドル規模の評価額となっており、主にMicrosoftとSoftBankが出資しています。API(トークン課金)、一般向け製品(ChatGPT Plus、月額20ドル)、法人向け(ChatGPT Enterprise、Azure OpenAI Service)を組み合わせた商業戦略を展開。OAI-SearchBot(自社検索クローラー)やSearchGPTの投入で事業領域も拡大しています。
Anthropicは2021年にOpenAI出身のDarioとDaniela Amodeiらによって設立され、安全性を差別化ポイントとしています。Claudeファミリー(Haiku、Sonnet、Opus)は特にライティング、コーディング、長文推論で高評価。Amazon、Google、SoftBankが出資。2026年5月にはxAIのColossus 1の計算リソースの一部を月額約12.5億ドルで借り受けると発表し、計算資源の集中化を象徴しました。
Google DeepMindは2023年からAI事業をGeminiブランドに統合。Geminiファミリー(Nano、Flash、Pro、Ultra、そして2024年12月のGemini 2.0 Flash)は検索エンジン(AI Overviews)やWorkspaceに組み込まれています。Googleは学習データ(Web、YouTube、Books)とTPUインフラを自社でコントロールできる構造的優位性を持っています。
Metaはweights open戦略でLlamaファミリー(Llama 1:2023年2月、Llama 2:2023年7月、Llama 3:2024年4月、Llama 3.1 405B:2024年7月)を展開。foundation modelsへのアクセスを民主化し、VicunaやTulu、分野特化のfine-tuneなど派生モデルのエコシステムを育成しました。一方、2025年7月には欧州GPAI行動規範への署名を拒否し、Llama 3マルチモーダルの欧州リリースを一時停止しました。
Mistral AIは2023年4月にArthur Mensch、Guillaume Lample、Timothée Lacroixによってパリで創業し、欧州のチャンピオンとして台頭。オープンモデル(Mistral 7B、Mixtral 8x7B、Codestral Mamba、Mathstral、Ministral 3B/8B)とプロプライエタリモデル(Mistral Large 2、Pixtral Large)を組み合わせたハイブリッド戦略を展開。GPAI行動規範に署名し、NVIDIA(Mistral NeMo 12B)、Dassault Systèmes、Capgemini、SAPと戦略的提携を結びました。
中国では、Alibaba(Qwenファミリー)、Baidu(ERNIE 4.5、ERNIE X1)、Tencent(Hunyuan-T1)、そして特にDeepSeekが米国勢に追いつき、挑戦しています。DeepSeek-V3は2025年1月、同等品質ながら西側競合の約30分の1の学習コストでコミュニティを驚かせました。続いてリリースされたDeepSeek-R1は2025年6月(R1-0528)にアップデートされ、NVIDIA株価の一時急落を引き起こすなど、過剰なインフラ依存に疑問を投げかけました。
その他にも、xAI(Grok、Colossusインフラ)、Cohere(企業向け多言語モデル、Aya 23)、AI2(Tülu 3 405B、完全openモデル)、Aleph Alpha(Pharia-1-LLMドイツ語版)、Black Forest Labs(FLUX-1:text-to-image用)、LightOn(企業向けParadigm)、Hugging Face(モデルハブ、SmolLM2)、OpenEuroLLM(欧州openコンソーシアム)などが専門分野で活躍しています。
2026年時点の先端LLMは、各ファミリーごとにサイズやバリエーションを持つ十数種で構成されています:
先端LLMの学習には膨大なリソースが必要です。GPT-4の場合、公開推定では約1億ドル、数万台のGPU H100を3カ月間使用したとされます。Llama 3.1 405Bは16,000台のH100と約3,000万GPU時間を要しました。Mistral Large 2やMixtralなど欧州勢は、より控えめな予算で競争力のある性能を達成し、データ品質への注力による効率性を示しました。
OpenAIが提唱し、その後DeepMind(Chinchilla, 2022)が洗練させたscaling lawsは長らく業界の指針となってきました。モデルの品質はパラメータ数と学習データ量の積に比例して向上するというもので、両者のバランスが重要です。しかし2024年末にはこの方程式に変化が生じ、予算の増大がベンチマーク上の劇的な性能向上につながらなくなり、データ品質やpost-training reasoning、エージェント、マルチモーダル性など新たな軸に注目が移っています。
計算インフラは地政学的な争点となりました。NVIDIAはH100/H200/B200 GPUのほぼ独占により市場価値の大半を掌握。米国の輸出規制で中国向け販売が制限され、DeepSeekやAlibabaは劣化版チップ(H800)での学習最適化を迫られました。xAIは2024年、メンフィスにColossusデータセンターを建設し、10万台から20万台のH100/H200を1年足らずで導入するという産業記録を樹立しました。
現代LLMは、執筆、要約、翻訳、コード生成、対話、情報抽出、分類、構造化・非構造化文書処理など幅広いタスクを高水準でこなします。これらは多くのアプリケーション(対話型検索エンジン、コーディングアシスタント(Copilot、Cursor)、法務・医療エージェント、カスタマーサポート、OfficeやWorkspaceの生産性ツール)の標準コンポーネントとなっています。
一方で限界も明確です。LLMは事実と異なるもっともらしい内容(いわゆる「ハルシネーション」)を特に専門的分野や正確な数値、文献情報で生み出す傾向があります。敵対的攻撃(prompt injection、jailbreak)への耐性も十分ではなく、2024年12月のEPFL研究では適応型攻撃に対する脆弱性が指摘されました。2024年4月のEPFL研究では、ユーザーの意見を誘導する操作も可能であることが示されています。また、エネルギー・水消費量も大きく、規制当局や株主の監視が強まっています。バイアスも学習コーパス(主に英語・欧米圏)に由来しています。
open LLMとクローズドLLMの対立は2023年以降、議論の構造を形作っています。openモデルの支持者(Meta、Mistral、Hugging Face、AI2、DeepSeek、La Quadrature du Netなど)は技術主権、独立監査の可能性、学術的普及、産業レジリエンスを主張。反対派(Anthropic、OpenAIの一部領域)は、悪用リスク(バイオテロ、大規模な偽情報、詐欺)や一度公開したモデルの撤回が不可能な点を問題視しています。
AI Actはこの問題に部分的に決着をつけ、パラメータ・アーキテクチャ・利用情報が公開されたモデルには一部免除を認めています。ただし、システミックリスクのあるモデル(10²⁵ FLOPSの学習)は対象外です。2026年時点でopen sourceエコシステムはLlama、Mistral、DeepSeek、Qwenが主導し、ほとんどの企業・学術用途を単一ベンダーAPIに依存せずカバーしています。
汎用モデルに加え、エコシステムは縦型モデルへと多様化しています。医療分野ではBioptimusのH-optimus-0(医療診断支援)、Aleph AlphaのPharia-1-LLM(ドイツ語)、放射線科・腫瘍科向けfine-tuneも登場。法務分野ではLefebvre Dalloz-Barreau de Parisのアシスタント、Talan-Mutuelle Généraleのアプリケーション。コード分野ではCodestral(Mistral)、Code Llama(Meta)、DeepSeek-Coder。金融ではBNP Paribas、Crédit Agricole、JPMorganの社内モデル。小型高効率モデル(SLM、Small Language Models)の動きも活発で、Phi-3、Mistral Ministral、SmolLM2、Gemma 2 2Bなどが、スマートフォン・自動車・IoTなど組み込み用途に向け、低コストで実用的な品質を実現しています。
2025年にはAIエージェントがLLM活用の新パラダイムとして台頭。単一の質問応答にとどまらず、ツール呼び出し、Web参照、ファイル作成、コード実行など一連のアクションを自動で組み合わせ、複雑なタスクを解決します。Gemini 2.0 Flashは2024年12月、この新たな製品群の先駆けとして発表されました。AI BuildersのAI Decision Matrixは、多様化するソリューション選定に悩むIT責任者向けの比較評価フレームワークを提供しています。
今後18カ月で注視すべき動向:
LLMの進化はもはやパラメータ数競争だけではありません。勝者となるプレイヤーは、データ品質、強化学習によるpost-training、推論インフラの制御、ターゲット市場に合致したライセンス戦略、規制遵守を組み合わせる必要があります。今や産業・地政学・法務の課題でもあり、単なる科学技術の話ではありません。
LLMは、数十億から数千億パラメータ規模の非常に大きなニューラルネットワークで、transformerアーキテクチャに基づいています。数千億から数兆のトークンから次のトークンを予測するように訓練されます。この単純なタスクから、対話、推論、コード生成、翻訳などの複雑な能力が現れます。
foundation modelsとは、fine-tuning、RAG、prompt engineeringなどを通じて多くの専門的なアプリケーションの基盤として再利用できるIAモデルです。LLMは言語に特化したfoundation modelsの一種です。しかし、この用語は同じ論理的・経済的アーキテクチャを共有するマルチモーダルモデル(画像、音声、動画)にも拡張されています。
公開ベンチマーク上では、GPT-4oおよびo1/o3(OpenAI)、Claude 3.5 SonnetおよびClaude 3 Opus(Anthropic)、Gemini 2.0 FlashおよびGemini Ultra(Google)、Llama 3.1 405B(Meta)、Mistral Large 2(Mistral AI)、DeepSeek-V3およびDeepSeek-R1(DeepSeek)、Qwen2.5(Alibaba)、Hunyuan-T1(Tencent)などです。どのモデルも全ての側面で圧倒的ではなく、用途(推論、レイテンシ、コスト、言語、マルチモーダル性)によって選択が異なります。
70億パラメータ超のdenseモデルでは、規模と効率により予算は500万から1億ドルに及びます。GPT-4は約1億ドル、Llama 3.1 405Bは約5,000万ドル、DeepSeek-V3は約500万ドル(効率記録)と推定されています。これらは最終トレーニングのみの費用であり、事前の実験やトレーニング後の工程も含めると、総コストは3~10倍となります。
ネットワークを複数の専門的なサブネットワーク(エキスパート)に分割し、ルーターが各トークンごとにいくつかのエキスパートを選択して活性化するアーキテクチャです。これにより、推論コストを比例的に増やさずに全体のパラメータ数を増やせます。Mixtral 8x7B、DeepSeek-V3、GPT-4o(推定)がこのアーキテクチャを利用しています。
DeepSeek-V3およびDeepSeek-R1は、アメリカの最先端プロプライエタリモデルに対し、約30分の1の学習予算かつopen sourceで同等の性能を達成できることを示しました。これにより巨大インフラの優位性が疑問視され、NVIDIAの株価が一時的に急落するなど、現行IAエコシステムの評価の脆弱性を浮き彫りにしました。
Mistral AI(Mistral Large 2、Mixtral、Codestral、Ministral、Pixtral)が欧州のリーダーです。Aleph Alphaはドイツ語のPharia-1-LLMを開発中。LightOnは企業向けParadigmを提供。Black Forest Labsはtext-to-imageのFLUX-1を開発。OpenEuroLLMは欧州の学術コンソーシアムです。これらのプロジェクトは、米中モデルへの主権的な代替を目指しています。
用途によります。プロプライエタリ(OpenAI、Anthropic、Gemini)は管理されたAPIの手軽さと最先端モデルへのアクセスを提供します。open source(Llama、Mistral、DeepSeek)はオンプレミス運用、データ主権、モデル監査、ベンダーロックイン回避を可能にしますが、インフラコストと内部専門性が必要です。規制分野(医療、金融、防衛)では、ホスト型open sourceが標準となることが多いです。
推論モデルは、回答前に明示的にchain-of-thought(思考の連鎖)を生成し、これにより競技数学・論理・プログラミングでの性能が大幅に向上します。OpenAI o1/o3、DeepSeek-R1、Tencent Hunyuan-T1、Gemini Thinkingなどが代表例です。推論コスト(レイテンシ)は上昇しますが、品質も向上します。
ハルシネーション(事実と異なる内容生成)、prompt injectionやjailbreak(ガードレール回避)、バイアス(学習コーパスの反映)、世論操作(EPFL 2024年研究)、エネルギー・水資源消費、個人データ漏洩、モデル・GPUベンダーへの産業依存などです。AI Actは、システミックリスクを持つモデルに対する複数のリスクに対応しています。
公開ベンチマーク(MMLU、GPQA、MATH、HumanEval、SWE-Bench、LiveCodeBench、MT-Bench)、ブラインドの人間評価(Chatbot Arena)、用途に合わせた社内テストなどです。公開ベンチマークはすぐに飽和し、MMLUで90%を超えるとモデル間の差異が分かりづらくなります。実タスク(文章作成、コード生成、長文推論)による評価が不可欠です。
IAエージェント―自律的に複雑なアクションを連鎖できるシステム―が2025~2027年の主要テーマです。その先は、長期的な信頼性(アライメント・セキュリティ)、推論効率、ネイティブなマルチモーダル統合、継続学習、インフラ主権などが産業の課題です。学習データの問題も依然として重要であり、公開ウェブコーパスが飽和しつつある中、合成データや出版社との連携が進む見込みです。
4 articles liés à ce sujet
Alibaba CloudはWAIC 2025で、AI言語モデルの応用例としてスマートコックピット、Signifyとの都市照明ソリューション、コネクテッドグラスを発表し、オープンソ...
DeepSeekはR1モデルをアップデートし、推論、論理、数学、プログラミングにおける性能を向上させました。このアップデートはエラーを減少させ、アプリケーション...
LLMはサイバーセキュリティでますます活用され、脆弱性や攻撃の迅速な検出が可能になります。しかしその効果的な利用には、人間とのハイブリッドアプローチが必...
Mistral AIが、24億パラメーターを持つ低遅延最適化モデルMistral Small 3を発表しました。オープンソースのこのモデルは、専有モデルに対する強力な代替手段と...