Logo ActuIA ActuIA

情報の参考元
人工知能

Français English Español Italiano Deutsch Nederlands Română Polski Português العربية Türkçe Українська 中文 한국어
投稿する
ホーム
AI ウォッチ

カテゴリ別

資金調達 合併・買収 モデルのリリース 製品ローンチ パートナーシップ 公共プログラム / 公募 規制とガバナンス 訴訟 研究・科学 導入・採用 インフラと計算資源 企業・戦略 セキュリティとインシデント レポート・調査 イベント

業界別

エネルギー カルチャー ファイナンス ヘルスケア・医療 マーケティング メディア リスク予防 企業 保険 司法 教育 産業 輸送

カテゴリ別

資金調達 合併・買収 モデルのリリース 製品ローンチ パートナーシップ 公共プログラム / 公募 規制とガバナンス 訴訟 研究・科学 導入・採用 インフラと計算資源 企業・戦略 セキュリティとインシデント レポート・調査 イベント

業界別

エネルギー カルチャー ファイナンス ヘルスケア・医療 マーケティング メディア リスク予防 企業 保険 司法 教育 産業 輸送
最新ニュース
言語

LLM : 大規模言語モデルとfoundation models

最新ニュースを見る
Tech family
大規模言語モデル(英語ではLarge Language Models、略してLLM)は、膨大なテキストコーパスを用いて訓練されたニューラルネットワークであり、単語列の最も確からしい続きを予測することを目的としています。2022年以降、これらは生成AIの主要なエンジンとなり、OpenAI、Anthropic、Google DeepMind、Meta、Mistral AI、Alibaba、DeepSeek、さらに20社以上の企業による前例のない産業競争の舞台となっています。本ページでは、そのアーキテクチャ、主要なプレイヤー、2026年時点での代表的なモデル、そしてそれらを取り巻く論争についてまとめています。

📰 Actualités récentes

最近のニュース

大規模言語モデル(LLM)は、サイバーセキュリティから医療に至るまで、さまざまな分野で不可欠なツールとしてAIの風景を変え続けています。最近、DeepSeekはそのモデルR1の更新版であるDeepSeek-R1-0528を発表しました。これは、推論、論理、プログラミングの能力を強化しています。このバージョンは2025年5月28日に公開され、OpenAIやGoogleの主要モデルに近い性能を持ちながら、LLMに共通する問題である幻覚の発生率を低下させています。同時に、Tencentは市場のリーダーと競合するために革新的なハイブリッドアーキテクチャを使用した推論モデルHunyuan-T1を導入しました。これらの開発は、LLMの推論能力の向上への関心が高まっていることを強調しており、複雑で重要なシステムに統合するためのキー要素となっています。

サイバーセキュリティの分野では、LLMが脅威の検出と分析を容易にすることでその可能性を示しています。ニューヨーク大学の研究は、LLMが膨大なテキストデータを利用して攻撃を予測し反応する能力を強調しており、サイバーセキュリティをより反応的かつ予防的な分野に変えています。SecureBERTのようなサイバーセキュリティに特化したモデルは、企業にとっての課題であるが、有望な結果を示しています。LLMの専門化への進化は、特定のニーズに応えつつ、精度と信頼性を向上させる言語モデルの適用の多様化を反映しています。

LLMのオープンソースへの関心も続いており、Allen Institute for AIのようなイニシアティブがLlama 3.1に基づいた高性能なオープンソースモデルTülu 3 405Bを発表しました。このモデルは、検証可能な報酬による強化学習を使用し、複雑なタスクでのパフォーマンスを向上させています。同時に、Mistral AIはレイテンシーに最適化されたモデルMistral Small 3を発表し、プロプライエタリモデルに対するオープンソースの代替案を提供しています。これらのイニシアティブは、リソースが限られた環境での採用を拡大するために、推論コストを削減しつつ、LLMへのアクセスを民主化する意欲を反映しています。

大規模言語モデルが進化し続ける中、推論コストや環境への影響といった課題が残っています。Microsoftは最近、1ビットに量子化されたLLMの推論を最適化するオープンソースフレームワークBitNet.cppを発表し、カーボンフットプリントを削減しました。この革新は、モデルのサイズと複雑さが増加し続ける中で、LLMの進化における持続可能性の重要性を強調しています。また、LLMの医療診断への統合はまだ改善の余地があり、UVA Healthの研究によると、LLMは特定のタスクで医師を上回ることができるが、全体的な診断パフォーマンスの向上にはまだ至っていません。

完全ガイド

アーキテクチャ:transformerから現代モデルへ

すべての現代LLMの基盤となるtransformerアーキテクチャは、2つの基本要素に支えられています。第1は自己attentionメカニズムであり、モデルがテキスト内の各位置ごとに他の位置の表現を重み付きで組み合わせて計算できるようにします。この処理は本質的に並列化が可能であり、そのためtransformerは2017年までNLP分野を席巻していたRNNやLSTMといったリカレントアーキテクチャに取って代わりました。第2の要素は、同一のtransformer層を数十層(先端モデルでは通常32〜96層)積み重ねることで、それぞれが表現を洗練させていきます。

現代のLLMは、いくつかのアーキテクチャバリエーションに分かれています:

  • denseモデル:すべてのパラメータが各推論時に活性化されます(GPT-4の初期版、Claude、Llama 3.1 405Bなど)。
  • Mixture of Experts(MoE)モデル:トークンごとにごく一部のサブネットワーク(エキスパート)のみが活性化され、同等パラメータ数でも推論コストが低減します(Mixtral、DeepSeek-V3、推定されるGPT-4oなど)。
  • ネイティブマルチモーダルモデル:テキスト、画像、音声、動画を統一された表現空間で入出力できます(Gemini、GPT-4o、Pixtral Large、Claude 3.5 Sonnetなど)。
  • reasoning models(reasoning models):応答前に明示的なchain-of-thoughtを生成するタイプで、DeepSeek-R1、OpenAI o1/o3、Tencent Hunyuan-T1、Gemini Thinkingなどが該当。数学・論理・プログラミングタスクで高品質ですが、レイテンシは増加します。

2026年の主要プレイヤー

OpenAIはChatGPT、GPT-4o、GPT-4o mini、reasoningモデルo1/o3ファミリーにより市場のリーダーと見なされ続けています。同社は2026年時点で数千億ドル規模の評価額となっており、主にMicrosoftとSoftBankが出資しています。API(トークン課金)、一般向け製品(ChatGPT Plus、月額20ドル)、法人向け(ChatGPT Enterprise、Azure OpenAI Service)を組み合わせた商業戦略を展開。OAI-SearchBot(自社検索クローラー)やSearchGPTの投入で事業領域も拡大しています。

Anthropicは2021年にOpenAI出身のDarioとDaniela Amodeiらによって設立され、安全性を差別化ポイントとしています。Claudeファミリー(Haiku、Sonnet、Opus)は特にライティング、コーディング、長文推論で高評価。Amazon、Google、SoftBankが出資。2026年5月にはxAIのColossus 1の計算リソースの一部を月額約12.5億ドルで借り受けると発表し、計算資源の集中化を象徴しました。

Google DeepMindは2023年からAI事業をGeminiブランドに統合。Geminiファミリー(Nano、Flash、Pro、Ultra、そして2024年12月のGemini 2.0 Flash)は検索エンジン(AI Overviews)やWorkspaceに組み込まれています。Googleは学習データ(Web、YouTube、Books)とTPUインフラを自社でコントロールできる構造的優位性を持っています。

Metaはweights open戦略でLlamaファミリー(Llama 1:2023年2月、Llama 2:2023年7月、Llama 3:2024年4月、Llama 3.1 405B:2024年7月)を展開。foundation modelsへのアクセスを民主化し、VicunaやTulu、分野特化のfine-tuneなど派生モデルのエコシステムを育成しました。一方、2025年7月には欧州GPAI行動規範への署名を拒否し、Llama 3マルチモーダルの欧州リリースを一時停止しました。

Mistral AIは2023年4月にArthur Mensch、Guillaume Lample、Timothée Lacroixによってパリで創業し、欧州のチャンピオンとして台頭。オープンモデル(Mistral 7B、Mixtral 8x7B、Codestral Mamba、Mathstral、Ministral 3B/8B)とプロプライエタリモデル(Mistral Large 2、Pixtral Large)を組み合わせたハイブリッド戦略を展開。GPAI行動規範に署名し、NVIDIA(Mistral NeMo 12B)、Dassault Systèmes、Capgemini、SAPと戦略的提携を結びました。

中国では、Alibaba(Qwenファミリー)、Baidu(ERNIE 4.5、ERNIE X1)、Tencent(Hunyuan-T1)、そして特にDeepSeekが米国勢に追いつき、挑戦しています。DeepSeek-V3は2025年1月、同等品質ながら西側競合の約30分の1の学習コストでコミュニティを驚かせました。続いてリリースされたDeepSeek-R1は2025年6月(R1-0528)にアップデートされ、NVIDIA株価の一時急落を引き起こすなど、過剰なインフラ依存に疑問を投げかけました。

その他にも、xAI(Grok、Colossusインフラ)、Cohere(企業向け多言語モデル、Aya 23)、AI2(Tülu 3 405B、完全openモデル)、Aleph Alpha(Pharia-1-LLMドイツ語版)、Black Forest Labs(FLUX-1:text-to-image用)、LightOn(企業向けParadigm)、Hugging Face(モデルハブ、SmolLM2)、OpenEuroLLM(欧州openコンソーシアム)などが専門分野で活躍しています。

2026年の代表的モデル

2026年時点の先端LLMは、各ファミリーごとにサイズやバリエーションを持つ十数種で構成されています:

  • GPT-4o / GPT-4o mini(OpenAI):ネイティブマルチモーダル、低レイテンシ、128kトークンのコンテキストウィンドウ。GPT-4o miniは大規模展開の経済的標準となりました。
  • o1 / o3(OpenAI):内部chain-of-thoughtを持つreasoningモデル。競技数学(AIME、IMO)やプログラミング(Codeforces)で圧倒的な性能。
  • Claude 3.5 Sonnet / Claude 3 Opus(Anthropic):200kウィンドウ、長文執筆や文書読解で優秀。
  • Gemini 2.0 Flash / Gemini Ultra(Google DeepMind):ネイティブマルチモーダル、Googleエコシステムと統合。
  • Llama 3.1 405B / Llama 3.3(Meta):open source denseのリーダー。
  • Mistral Large 2 / Pixtral Large(Mistral AI):欧州勢、一部バージョンはopen weights。
  • DeepSeek-V3 / DeepSeek-R1-0528(DeepSeek):中国のopen source、reasoning、学習コストが驚異的に低い。
  • Qwen2.5(Alibaba):中国多言語open sourceリーダー、1Mトークンウィンドウ。
  • NOVA(Amazon):2024年12月発表の独自foundationファミリー。
  • Phi-3 / Phi-3.5(Microsoft):組み込み向けの小型・高効率モデル。
  • Hunyuan-T1(Tencent):中国のreasoningモデル、最先端に匹敵。
  • Grok 3(xAI):Xへのリアルタイムアクセス、巨大インフラ。

学習とコスト

先端LLMの学習には膨大なリソースが必要です。GPT-4の場合、公開推定では約1億ドル、数万台のGPU H100を3カ月間使用したとされます。Llama 3.1 405Bは16,000台のH100と約3,000万GPU時間を要しました。Mistral Large 2やMixtralなど欧州勢は、より控えめな予算で競争力のある性能を達成し、データ品質への注力による効率性を示しました。

OpenAIが提唱し、その後DeepMind(Chinchilla, 2022)が洗練させたscaling lawsは長らく業界の指針となってきました。モデルの品質はパラメータ数と学習データ量の積に比例して向上するというもので、両者のバランスが重要です。しかし2024年末にはこの方程式に変化が生じ、予算の増大がベンチマーク上の劇的な性能向上につながらなくなり、データ品質やpost-training reasoning、エージェント、マルチモーダル性など新たな軸に注目が移っています。

計算インフラは地政学的な争点となりました。NVIDIAはH100/H200/B200 GPUのほぼ独占により市場価値の大半を掌握。米国の輸出規制で中国向け販売が制限され、DeepSeekやAlibabaは劣化版チップ(H800)での学習最適化を迫られました。xAIは2024年、メンフィスにColossusデータセンターを建設し、10万台から20万台のH100/H200を1年足らずで導入するという産業記録を樹立しました。

能力と限界

現代LLMは、執筆、要約、翻訳、コード生成、対話、情報抽出、分類、構造化・非構造化文書処理など幅広いタスクを高水準でこなします。これらは多くのアプリケーション(対話型検索エンジン、コーディングアシスタント(Copilot、Cursor)、法務・医療エージェント、カスタマーサポート、OfficeやWorkspaceの生産性ツール)の標準コンポーネントとなっています。

一方で限界も明確です。LLMは事実と異なるもっともらしい内容(いわゆる「ハルシネーション」)を特に専門的分野や正確な数値、文献情報で生み出す傾向があります。敵対的攻撃(prompt injection、jailbreak)への耐性も十分ではなく、2024年12月のEPFL研究では適応型攻撃に対する脆弱性が指摘されました。2024年4月のEPFL研究では、ユーザーの意見を誘導する操作も可能であることが示されています。また、エネルギー・水消費量も大きく、規制当局や株主の監視が強まっています。バイアスも学習コーパス(主に英語・欧米圏)に由来しています。

open source vs プロプライエタリ

open LLMとクローズドLLMの対立は2023年以降、議論の構造を形作っています。openモデルの支持者(Meta、Mistral、Hugging Face、AI2、DeepSeek、La Quadrature du Netなど)は技術主権、独立監査の可能性、学術的普及、産業レジリエンスを主張。反対派(Anthropic、OpenAIの一部領域)は、悪用リスク(バイオテロ、大規模な偽情報、詐欺)や一度公開したモデルの撤回が不可能な点を問題視しています。

AI Actはこの問題に部分的に決着をつけ、パラメータ・アーキテクチャ・利用情報が公開されたモデルには一部免除を認めています。ただし、システミックリスクのあるモデル(10²⁵ FLOPSの学習)は対象外です。2026年時点でopen sourceエコシステムはLlama、Mistral、DeepSeek、Qwenが主導し、ほとんどの企業・学術用途を単一ベンダーAPIに依存せずカバーしています。

専門・縦型モデル

汎用モデルに加え、エコシステムは縦型モデルへと多様化しています。医療分野ではBioptimusのH-optimus-0(医療診断支援)、Aleph AlphaのPharia-1-LLM(ドイツ語)、放射線科・腫瘍科向けfine-tuneも登場。法務分野ではLefebvre Dalloz-Barreau de Parisのアシスタント、Talan-Mutuelle Généraleのアプリケーション。コード分野ではCodestral(Mistral)、Code Llama(Meta)、DeepSeek-Coder。金融ではBNP Paribas、Crédit Agricole、JPMorganの社内モデル。小型高効率モデル(SLM、Small Language Models)の動きも活発で、Phi-3、Mistral Ministral、SmolLM2、Gemma 2 2Bなどが、スマートフォン・自動車・IoTなど組み込み用途に向け、低コストで実用的な品質を実現しています。

2025年にはAIエージェントがLLM活用の新パラダイムとして台頭。単一の質問応答にとどまらず、ツール呼び出し、Web参照、ファイル作成、コード実行など一連のアクションを自動で組み合わせ、複雑なタスクを解決します。Gemini 2.0 Flashは2024年12月、この新たな製品群の先駆けとして発表されました。AI BuildersのAI Decision Matrixは、多様化するソリューション選定に悩むIT責任者向けの比較評価フレームワークを提供しています。

2026年以降の争点

今後18カ月で注視すべき動向:

  • 2025年8月から適用されたAI Actに基づくGPAI準拠;
  • 推論経済(インファレンスエコノミー)の台頭とMoEアーキテクチャや量子化(BitNet、vLLM、llm-optimizer)へのシフト;
  • 著作権との関係性、特にフランスのDarcos法の棚上げやMeta-Llama、NYT-OpenAI、Getty-Stable Diffusionの係争を受けた法的整理;
  • OpenAI o3、DeepSeek-R1、Gemini Thinking、Hunyuan-T1が競うreasoningモデル競争;
  • テキスト・画像・動画・音声を統合的に扱えるマルチモーダル収束;
  • エージェントの台頭と、それに伴う信頼性(長期タスクでの成功率)、安全性(実行アクションの管理)、ビジネスモデルの課題;
  • Mistral、OpenEuroLLM、LightOn、Aleph Alpha、OVHcloudと新型NVIDIA Tensor Core GPUによる欧州の主権確立への取り組み。

LLMの進化はもはやパラメータ数競争だけではありません。勝者となるプレイヤーは、データ品質、強化学習によるpost-training、推論インフラの制御、ターゲット市場に合致したライセンス戦略、規制遵守を組み合わせる必要があります。今や産業・地政学・法務の課題でもあり、単なる科学技術の話ではありません。

よくある質問

LLM(大規模言語モデル)とは何ですか?

LLMは、数十億から数千億パラメータ規模の非常に大きなニューラルネットワークで、transformerアーキテクチャに基づいています。数千億から数兆のトークンから次のトークンを予測するように訓練されます。この単純なタスクから、対話、推論、コード生成、翻訳などの複雑な能力が現れます。

LLMとfoundation modelsの違いは何ですか?

foundation modelsとは、fine-tuning、RAG、prompt engineeringなどを通じて多くの専門的なアプリケーションの基盤として再利用できるIAモデルです。LLMは言語に特化したfoundation modelsの一種です。しかし、この用語は同じ論理的・経済的アーキテクチャを共有するマルチモーダルモデル(画像、音声、動画)にも拡張されています。

2026年に最も高性能なLLMは何ですか?

公開ベンチマーク上では、GPT-4oおよびo1/o3(OpenAI)、Claude 3.5 SonnetおよびClaude 3 Opus(Anthropic)、Gemini 2.0 FlashおよびGemini Ultra(Google)、Llama 3.1 405B(Meta)、Mistral Large 2(Mistral AI)、DeepSeek-V3およびDeepSeek-R1(DeepSeek)、Qwen2.5(Alibaba)、Hunyuan-T1(Tencent)などです。どのモデルも全ての側面で圧倒的ではなく、用途(推論、レイテンシ、コスト、言語、マルチモーダル性)によって選択が異なります。

最先端LLMの学習コストはどれくらいですか?

70億パラメータ超のdenseモデルでは、規模と効率により予算は500万から1億ドルに及びます。GPT-4は約1億ドル、Llama 3.1 405Bは約5,000万ドル、DeepSeek-V3は約500万ドル(効率記録)と推定されています。これらは最終トレーニングのみの費用であり、事前の実験やトレーニング後の工程も含めると、総コストは3~10倍となります。

Mixture of Experts(MoE)モデルとは何ですか?

ネットワークを複数の専門的なサブネットワーク(エキスパート)に分割し、ルーターが各トークンごとにいくつかのエキスパートを選択して活性化するアーキテクチャです。これにより、推論コストを比例的に増やさずに全体のパラメータ数を増やせます。Mixtral 8x7B、DeepSeek-V3、GPT-4o(推定)がこのアーキテクチャを利用しています。

2025年1月にDeepSeekが大きな衝撃を与えた理由は?

DeepSeek-V3およびDeepSeek-R1は、アメリカの最先端プロプライエタリモデルに対し、約30分の1の学習予算かつopen sourceで同等の性能を達成できることを示しました。これにより巨大インフラの優位性が疑問視され、NVIDIAの株価が一時的に急落するなど、現行IAエコシステムの評価の脆弱性を浮き彫りにしました。

ヨーロッパ発のLLMには何がありますか?

Mistral AI(Mistral Large 2、Mixtral、Codestral、Ministral、Pixtral)が欧州のリーダーです。Aleph Alphaはドイツ語のPharia-1-LLMを開発中。LightOnは企業向けParadigmを提供。Black Forest Labsはtext-to-imageのFLUX-1を開発。OpenEuroLLMは欧州の学術コンソーシアムです。これらのプロジェクトは、米中モデルへの主権的な代替を目指しています。

open sourceかプロプライエタリか:どちらを選ぶべき?

用途によります。プロプライエタリ(OpenAI、Anthropic、Gemini)は管理されたAPIの手軽さと最先端モデルへのアクセスを提供します。open source(Llama、Mistral、DeepSeek)はオンプレミス運用、データ主権、モデル監査、ベンダーロックイン回避を可能にしますが、インフラコストと内部専門性が必要です。規制分野(医療、金融、防衛)では、ホスト型open sourceが標準となることが多いです。

推論モデルとは何ですか?

推論モデルは、回答前に明示的にchain-of-thought(思考の連鎖)を生成し、これにより競技数学・論理・プログラミングでの性能が大幅に向上します。OpenAI o1/o3、DeepSeek-R1、Tencent Hunyuan-T1、Gemini Thinkingなどが代表例です。推論コスト(レイテンシ)は上昇しますが、品質も向上します。

LLMに関連する主なリスクは何ですか?

ハルシネーション(事実と異なる内容生成)、prompt injectionやjailbreak(ガードレール回避)、バイアス(学習コーパスの反映)、世論操作(EPFL 2024年研究)、エネルギー・水資源消費、個人データ漏洩、モデル・GPUベンダーへの産業依存などです。AI Actは、システミックリスクを持つモデルに対する複数のリスクに対応しています。

LLMはどのように評価されますか?

公開ベンチマーク(MMLU、GPQA、MATH、HumanEval、SWE-Bench、LiveCodeBench、MT-Bench)、ブラインドの人間評価(Chatbot Arena)、用途に合わせた社内テストなどです。公開ベンチマークはすぐに飽和し、MMLUで90%を超えるとモデル間の差異が分かりづらくなります。実タスク(文章作成、コード生成、長文推論)による評価が不可欠です。

LLMの今後の展望は?

IAエージェント―自律的に複雑なアクションを連鎖できるシステム―が2025~2027年の主要テーマです。その先は、長期的な信頼性(アライメント・セキュリティ)、推論効率、ネイティブなマルチモーダル統合、継続学習、インフラ主権などが産業の課題です。学習データの問題も依然として重要であり、公開ウェブコーパスが飽和しつつある中、合成データや出版社との連携が進む見込みです。

同じトピック

Articles récents

4 articles liés à ce sujet

Alibaba、WAIC 2025でスマートコックピット、AIメガネ、戦略的パートナーシップを発表

Alibaba、WAIC 2025でスマートコックピット、AIメガネ、戦略的パートナーシップを発表

Alibaba CloudはWAIC 2025で、AI言語モデルの応用例としてスマートコックピット、Signifyとの都市照明ソリューション、コネクテッドグラスを発表し、オープンソ...

AI市場 商用製品
2025年8月1日 続きを読む →
DeepSeek-R1-0528: 中国のスタートアップ、主要モデルのアップデートで米国の巨人に対抗

DeepSeek-R1-0528: 中国のスタートアップ、主要モデルのアップデートで米国の巨人に対抗

DeepSeekはR1モデルをアップデートし、推論、論理、数学、プログラミングにおける性能を向上させました。このアップデートはエラーを減少させ、アプリケーション...

ツールとテクノロジー 商用製品
2025年6月2日 続きを読む →
AIが盾になるとき:LLMがサイバーセキュリティに具体的に与える影響

AIが盾になるとき:LLMがサイバーセキュリティに具体的に与える影響

LLMはサイバーセキュリティでますます活用され、脆弱性や攻撃の迅速な検出が可能になります。しかしその効果的な利用には、人間とのハイブリッドアプローチが必...

セキュリティ
2025年5月15日 続きを読む →
Mistral Small 3: フランスのオープンソース、GenAI専用モデルに対する低遅延最適化の回答

Mistral Small 3: フランスのオープンソース、GenAI専用モデルに対する低遅延最適化の回答

Mistral AIが、24億パラメーターを持つ低遅延最適化モデルMistral Small 3を発表しました。オープンソースのこのモデルは、専有モデルに対する強力な代替手段と...

2025年5月4日 続きを読む →

Statistiques

Articles totaux 4
Contenu mis à jour 5日前
Logo ActuIA Logo ActuIA

人工知能とその進歩に関する情報源。

ナビゲーション

  • 法的事項
  • お問い合わせ

フォローする

© 2019-2026 Net Square Digital. 無断転載を禁じます。