2025年は、Agentic AIの期待が実装現場の制約に衝突した転換点である。2026年は、デモ価値ではなくP&L寄与を問う「幻滅期的な選別局面」に入る可能性が高い。本稿では、GartnerとMcKinseyの公開データを基に、ROI立証圧力下での実装パラダイムを整理する。

筆者は10年以上にわたり企業のDXコンサルティングと技術顧問を務めてきた経験から、「新技術の導入率」と「事業成果への寄与」の乖離は繰り返されるパターンだと断言できる。クラウド、RPA、そして今回のAgentic AI──テクノロジーの名前は変わっても、PoC止まりの構造的原因は驚くほど共通している。本稿では、その構造的原因を解きほぐしながら、2026年に企業が取るべき具体的なアクションを提示する。

2026年「幻滅期入り」をどう定義するか

本稿でいう幻滅期とは、期待の後退そのものではなく、投資継続の条件が「機能デモ」から「財務成果の証明」に切り替わる局面を指す。Gartnerは2025年6月25日、2027年末までにAgentic AIプロジェクトの40%以上が中止されると予測し、主因としてコスト上昇・価値の不明確性・リスク統制不足を挙げた。また同リリースでは、現状の提案の多くがROIを十分に示せていないと明示している。これらは、2026年に案件評価軸が厳格化する前提を与える。

補助線として、同リリースでは「2028年までに日常業務判断の15%が自律化」「2028年までにエンタープライズソフトの33%がAgentic AIを含む」との予測も示される。すなわち市場は消失ではなく、粗い実験の淘汰と、実装品質・運用能力の再編に向かう公算が高い。

Gartnerハイプサイクルにおける位置づけ

Gartnerのハイプサイクルでは、Agentic AIは2025年時点で「過度な期待のピーク」を通過し、幻滅期への移行が始まっている。過去のハイプサイクルを振り返ると、RPA(2018年ピーク→2020年幻滅期→2022年生産性の安定期)やチャットボット(2016年ピーク→2019年幻滅期)が同じ軌道をたどった。重要なのは、幻滅期を通過した技術は消滅するのではなく、投資対効果が明確なユースケースに収斂して定着することだ。

Agentic AIの場合、この「収斂」は2026年後半から2027年にかけて起きると想定される。つまり、今後12〜18ヵ月は「中止されるプロジェクト」と「スケールするプロジェクト」の分岐点であり、企業にとっては戦略的投資判断の最重要期間となる。

40%中止予測の内訳を読み解く

Gartnerの「40%中止」という予測は、一見すると悲観的に映るが、裏返せば60%はプロジェクトとして継続される見通しである。問題は、中止される40%と継続する60%の間に何が差を生むかだ。公開データから推察される主な分岐条件は以下の3つである。第1に、PoCの段階でビジネスメトリクスと紐づけた評価設計があったかどうか。第2に、既存の業務フローをAgent前提で再設計したか、既存フローにAgentを「かぶせた」だけか。第3に、運用統制・ガバナンスのフレームワークをPoC段階から整備していたかどうかである。この3条件を満たしていないプロジェクトが、中止対象の中核になる。

88%利用でも、スケール到達は約3分の1

McKinsey「The state of AI in 2025」(2025年11月5日)は、AI利用企業が88%に到達した一方で、約3分の2は依然として実験・パイロット段階にあり、全社スケールを開始できているのは約3分の1と報告する。さらに、Agentic AIについては62%が実験、23%がスケール段階とされ、導入率と事業実装率のギャップが明確である。

同調査では、企業全体EBITへの寄与を報告した回答は39%にとどまり、その多くは寄与率5%未満である。つまり「使っている」ことと「P&Lに効いている」ことは別問題であり、2026年の経営要求は利用率よりもユニットエコノミクスに向かう。

なぜPoC→スケールの「死の谷」が生まれるのか

PoC段階では限定的なデータセットと理想的な条件下で動作するため、精度やレスポンスタイムが実運用と乖離する。スケール段階では、例外処理、エラーハンドリング、監査ログ、アクセス制御、SLA定義など、PoCでは不要だった運用要件が一気に積み上がる。McKinseyの高成果企業分析では、この「運用要件の設計」をPoC段階から組み込んでいるかどうかが、スケール到達の最大の差分として報告されている。

加えて、組織的な障壁も大きい。AI推進チームと事業部門の目標不一致、IT部門のガバナンス要求との折り合い、そしてAI人材の確保と教育──これらは技術的問題ではなく、組織設計の問題である。エンタープライズAI投資の80%実装・35%ROI問題でも詳述したように、ガバナンスと測定設計の欠如がROI証明の最大の障壁となっている。

スケール企業に共通する3つの組織特性

McKinsey調査でスケール段階に到達した企業には、3つの共通特性がある。第1に、CxOレベルのスポンサーシップと、事業部門KPIに直結する目標設定。第2に、AI推進チームが中央集権ではなく、各事業部門にエンベデッドされたハブ&スポーク型の組織体制。第3に、失敗を前提とした実験文化と、明確な撤退基準(Kill Criteria)の事前定義である。特に第3の撤退基準は、日本企業で最も欠如している要素であり、「投資したからには成果が出るまで続ける」という惰性がPoC止まりの温床になっている。

「座席数課金崩壊後」の収益モデル転換

Agentic AIの経済設計は、席数(per-seat)中心から消費・成果連動へ移行している。Salesforce Agentforceは会話単位課金(1会話あたり2米ドル)を前面に置き、Copilot Studioは2024年12月導入の従量課金モデルで2025年1月時点に1メッセージ0.01米ドルを提示した。OpenAI API価格もトークン・ツール利用の従量体系であり、AI機能の原価管理は席数ではなく処理量と業務フロー設計に依存する。

この変化は、予算管理の主語を「ユーザー数」から「処理イベント」「自律タスク完了率」「例外処理コスト」に切り替える。結果として、購買・情シス・事業部が共通で見るべきKPIは、アクティブ席数ではなく、案件単位の粗利改善率、手戻り率、SLA達成率になる。

主要ベンダー課金モデル比較

ベンダーサービス名課金モデル単価目安特徴
SalesforceAgentforce会話単位$2/会話CRM統合、業務フロー連動
MicrosoftCopilot Studioメッセージ単位$0.01/メッセージM365統合、Power Platform連携
OpenAIAPI(GPT-5系)トークン単位モデル依存汎用、カスタマイズ自由度高
AnthropicClaude APIトークン単位モデル依存長コンテキスト、安全性重視
GoogleGemini APIトークン単位モデル依存マルチモーダル、検索統合

この課金モデルの多様化は、企業の調達戦略にも影響を与える。従来の「年間ライセンス×席数」という固定費モデルから、「処理量に応じた変動費」モデルへの移行は、CFOにとっては予算の可視性が下がるリスクを伴う一方、適切な設計ができれば従量課金の方がコスト効率は高い。鍵となるのは、業務フローの処理量を事前に予測し、上限設定(キャッピング)を組み込む運用設計である。

実務的には、まず1ヵ月間のパイロット期間で処理量のベースラインを計測し、そのデータを基に月額上限を設定するアプローチが有効だ。上限に達した場合は自動的にHuman Fallbackに切り替わる設計にしておけば、予算超過リスクを抑えつつ業務を止めずに済む。

ROI圧力下で有効な実装パターン

第1に、ユースケースを「意思決定」「定型自動化」「検索補助」に分解し、Agentを当てる範囲を限定することである。Gartnerが示す通り、Agentを使うべきでない課題にまで適用するとコストとリスクだけが増える。第2に、PoCの成功条件を「精度」だけでなく「単位業務あたり総コスト」「人手介入回数」「障害時復旧時間」で定義する。第3に、既存業務をそのまま自動化せず、ワークフローを再設計する。McKinseyでも高成果企業の差分としてワークフロー再設計が強く示されている。

パターン1:Human-in-the-Loop型段階導入

最もリスクの低い導入パターンは、Agentが提案→人間が承認→実行というHuman-in-the-Loop(HITL)設計である。初期段階ではAgentの自律範囲を狭く設定し、承認率・修正率・例外率を測定する。データが蓄積された段階で、特定タスクの自律化範囲を段階的に拡大する。この方式の利点は、Agentの判断精度を実測値で評価でき、かつ業務リスクを最小化できる点にある。具体的な運用としては、最初の30日間はAgent承認率100%(全件人間確認)、次の30日間は80%(信頼度80%以上は自動実行)、最終30日間は60%まで自律化範囲を拡大するといった段階設計が実用的である。

パターン2:業務プロセス分解による選択的自動化

一つの業務プロセスを、判断ノード(Decision)・定型処理ノード(Routine)・例外処理ノード(Exception)に分解し、定型処理ノードのみをAgentに移管するアプローチである。AIガバナンス実装の2026年臨界点で分析したように、ガバナンス統制が効いた範囲でのAgent活用が、結果的にスケール速度を上げる。判断ノードは当面Human-in-the-Loopで運用し、例外処理ノードには専門の人間オペレーターを配置する。定型処理ノードの自動化率が90%を超えた段階で、判断ノードの段階的自律化を検討する。

パターン3:マルチAgent協調型(上級者向け)

複数のAgentが役割分担して一つのワークフローを処理する設計である。例えば、データ収集Agent・分析Agent・レポート生成Agent・検証Agentがパイプラインを構成する。OpenClaw vs GitHub Agentic Workflowsの分析でも触れたように、マルチAgent設計ではオーケストレーション層の設計品質が全体の成否を左右する。現時点では、単一Agent型で成果を出してからマルチAgent型に移行する段階的アプローチが推奨される。

90日で評価可能な3層KPIフレームワーク

実務上は、90日で評価可能な3層KPIを置くとよい。先行KPIは処理量あたりコスト、運用KPIは成功率と例外率、財務KPIは粗利率・回収期間である。これにより、2026年の投資継続判断を「期待値」ではなく実測値で行える。

KPI層指標例測定頻度判断基準
先行KPI(0〜30日)処理単価、応答速度、トークン消費量日次ベースラインとの比較
運用KPI(30〜60日)成功率、例外率、人手介入回数、MTTR週次SLA達成率80%以上
財務KPI(60〜90日)粗利改善率、ROI、回収期間月次回収期間12ヵ月以内

このフレームワークの要点は、90日後に「Go / No-Go / Pivot」の三択で明確に判断できるデータを揃えることにある。「もう少し様子を見よう」という先延ばしこそが、PoC止まりの最大の原因であり、判断期限を事前に設定することでこの罠を回避できる。

KPI設計の実務的注意点

筆者が技術顧問として複数企業のAI導入を支援してきた経験から、KPI設計で最も多い失敗は「精度」を唯一の評価基準にすることだ。精度95%のAgentでも、例外処理に人間が2時間かかるなら総コストは悪化する。逆に精度80%でも、例外処理が標準化されていれば運用コストは安定する。重要なのは「単位業務あたりの総所有コスト(TCO)」であり、精度はその構成要素の一つに過ぎない。

もう一つ見落とされやすいのが、Agentの「沈黙コスト」である。Agentが判断を保留して人間にエスカレーションした場合、人間側の対応待ち時間がボトルネックになる。この待ち時間は従来の手動プロセスでは発生しなかったコストであり、Agent導入後に新たに生まれる隠れコストとして計測対象に含めるべきだ。

ガバナンスとリスク管理の設計

Gartnerが中止要因として挙げた「リスク統制不足」は、2026年においてますます重要度を増す。EU AI Act、日本のAI事業者ガイドライン、各国の規制動向を踏まえると、Agentic AIの導入にはガバナンスフレームワークの整備が不可欠である。

具体的には、以下の4層でリスク管理を設計する必要がある:

第1層:データガバナンス ── Agentがアクセスするデータの範囲、機密度分類、データフロー監査。特にAgentが外部API経由でデータを取得・送信する場合、情報漏洩リスクの評価が必須となる。AIガバナンス導入が成長戦略になる2026年で詳述したWEF・Gartnerの実証データは、ガバナンス整備が採用率を2倍に引き上げることを示している。

第2層:行動ガバナンス ── Agentが実行可能なアクションの定義、権限境界の設定、エスカレーション条件の明文化。特に金融・医療・法務など規制業種では、Agentの判断に人間の承認を必須とする設計が求められる。

第3層:品質ガバナンス ── Agentのアウトプット品質の継続的モニタリング、ドリフト検知、定期的な評価サイクル。モデルのアップデートやデータ分布の変化によりAgent性能が劣化するリスクに対応する。

第4層:コンプライアンスガバナンス ── AI利用に関する法規制対応、監査証跡の保持、説明可能性の確保。EU AI Actの高リスクAI分類に該当する場合、技術文書の作成と適合性評価が義務化される。AIエージェントセキュリティの構造的課題で報告したように、88%の組織がAIエージェント関連のセキュリティ被害を経験しており、ガバナンス設計はコンプライアンスの要請であると同時にビジネスリスク低減の実務的要件でもある。

2026年の意思決定フレーム

2026年の焦点は「Agentを導入するか」ではなく、「どの業務単位で、どの課金単位で、どの速度で黒字化できるか」である。幻滅期は悲観局面ではなく、実装能力の差が財務差に変わる局面である。したがって企業は、席数拡大を追うより、ユースケースごとのP&L証明を標準プロセス化するべきである。

具体的なアクションプランとして、以下の3フェーズを推奨する:

フェーズ1(Q1-Q2 2026):棚卸しと選別 ── 既存のAI/Agent関連プロジェクトを全て棚卸しし、90日KPIフレームワークで再評価する。明確にROIが見えないプロジェクトは中止し、リソースを集中させる。

フェーズ2(Q2-Q3 2026):スケール候補の深耕 ── フェーズ1で生き残ったプロジェクトについて、HITL型から段階的自律化へ移行する。運用KPIが安定した領域から順次拡大する。

フェーズ3(Q3-Q4 2026):組織能力の制度化 ── Agent運用のノウハウを特定チームの属人知から組織の標準プロセスに転換する。評価基準、運用手順、ガバナンスフレームワークを文書化し、横展開可能にする。

筆者の顧問先でも、フェーズ1の棚卸しだけで「実はROIを定義していないプロジェクトが7割」という実態が可視化されたケースがある。見えていない問題は解決できない。まず可視化することが、2026年の最初のアクションである。

FAQ

Q1. 「幻滅期入り」は市場縮小を意味するのか?

必ずしも市場縮小ではない。2025年6月25日のGartnerリリースは中止案件の増加を示す一方、2028年に向けた自律判断・組み込み拡大予測も示しており、実態は淘汰と再編である。過去のRPAやチャットボットと同様に、ROIが明確なユースケースに収斂して市場は再成長に向かうと見るのが妥当である。

Q2. 88%利用なのに、なぜ成果が限定的なのか?

McKinsey 2025調査では、利用拡大と全社スケールは別段階であり、多くが実験段階に留まるためである。導入率は高くても、業務再設計と運用統制が未整備だとEBIT寄与に結びつきにくい。さらに、精度偏重のPoC設計が運用コストを見落とし、スケール時に総コストが膨れ上がるケースが多い。

Q3. 「座席数課金崩壊後」とは何を指すか?

席数課金が消えるという意味ではなく、主要ベンダーで会話単位・メッセージ単位・トークン単位の従量設計が前面化し、費用最適化の主対象が席数から処理量・フロー設計へ移ることを指す。CFOにとっては予算の可視性が変わるため、処理量予測とキャッピング設計が新たな調達スキルとして求められる。

Q4. まず何から着手すべきか?

最初に、1業務フローを選び「処理単価」「例外率」「人手介入工数」を計測する。次に、Agent適用範囲を意思決定点に限定し、90日で粗利改善または回収期間短縮を検証する設計にするのが現実的である。選ぶ業務フローは、データが整備されており、例外パターンが有限で、失敗時のビジネスインパクトが限定的なものが望ましい。

Q5. Agentic AIのROI算出で最も見落とされるコストは何か?

例外処理の人的コストである。Agent精度が90%でも、残り10%の例外処理に人間が対応する工数は、自動化前より増加するケースがある。これは、例外の内容がAgentの判断エラーであるため、原因特定と修正に通常業務以上の時間がかかるためだ。ROI算出時には「例外1件あたりの対応時間×発生率」を必ず織り込むべきである。

Q6. 中小企業でもAgentic AIの導入は現実的か?

従量課金モデルの普及により、初期投資のハードルは大幅に下がっている。ただし、中小企業こそ「どの業務に適用するか」の選別が重要である。推奨は、定型的な顧客対応、データ入力、レポート生成など、処理量が予測しやすく、例外パターンが限定的な業務から始めることだ。年間売上の0.5〜1%をAI実験予算として確保し、90日KPIフレームワークで評価するアプローチが現実的である。

Q7. 2026年中にAgentic AIの投資判断を先延ばしにするリスクは?

最大のリスクは、競合が先にスケール段階に到達し、運用ノウハウとデータの蓄積で差がつくことである。幻滅期は「投資しない時期」ではなく「投資先を厳選する時期」であり、何もしないことは2027年以降の競争力低下に直結する。重要なのは投資額の多寡ではなく、90日で検証可能な粒度で実験を回し続けることである。

参考文献