Claude Agent SDK 並列エージェント実装ガイド ── Task tool設計パターン

2026年4月、AnthropicのClaude Agent SDKがv0.2.119に到達し、並列エージェント実行の設計パターンが実用段階に入った。Claude Codeに内蔵されるTask toolは、Plan・Explore・Bash・General-Purposeといった専門エージェントを同一セッション内で並行起動し、大規模コードベースの調査・修正・テストを同時進行させる。SWE-bench Verifiedで80.8%を記録するClaude Opus 4.6をベースに、16エージェントが10万行規模のRustコンパイラを協調ビルドした内部事例では、従来の逐次開発と比較して開発速度が5倍以上に達した。本稿では、Task toolによる並列エージェントの実装設計から、run_in_backgroundパラメータを活用した背景タスク管理、Auto Memoryによるセッション横断のコンテキスト共有まで、実コード例を交えて詳述する。

Claude Agent SDK のアーキテクチャと Task tool の位置づけ

Claude Agent SDKは、Claude Codeを駆動するエージェントループ・ツール実行・コンテキスト管理の基盤をPython/TypeScriptライブラリとして外部公開したものだ。2026年2月のv2.1.32でAgent Teams機能がリサーチプレビューとして導入され、同年4月25日時点でv0.2.119（SDK）/ v2.1.119（Claude Code）に到達している。従来のClient SDKがツール実行ループを開発者側で実装する必要があったのに対し、Agent SDKはツール呼び出し・結果解析・次のアクション判断をすべて自律的に処理する。

このアーキテクチャの中核をなすのがTask toolだ。Task toolはClaude Code内でサブエージェントを生成する唯一のメカニズムであり、以下の専門エージェントタイプを指定して起動する。

// Task tool の呼び出し構造
Task({
  subagent_type: "Explore",     // エージェントタイプ
  description: "Search auth modules",  // 3-5語の要約
  prompt: "Find all authentication...", // 詳細タスク
  run_in_background: true,      // 背景実行フラグ
  model: "haiku"                // モデル指定（省略時は親を継承）
})

各エージェントタイプの役割と制約は明確に分離されている。ExploreはHaikuモデルで高速・低コストに動作し、Glob・Grep・Readといった読み取り専用ツールのみを使用する。コードベース探索に特化し、Write/Editツールへのアクセスを持たないため、意図しないファイル変更のリスクがない。Planは親セッションのモデルを継承し、読み取り専用ツールで調査した結果をもとに実装戦略を設計する。計画モードでのコンテキスト収集に使われ、ExitPlanModeツールでユーザー承認を求める設計だ。General-Purposeは全ツールにアクセスでき、複雑なマルチステップタスクを自律的に処理する。Bashはコマンド実行に特化し、git操作・テスト実行・ビルドプロセスを担当する。

重要な設計制約として、サブエージェントは他のサブエージェントを生成できない（ネスティング不可）。この制約は意図的なもので、エージェント間の依存関係が無限に深くなることを防ぎ、メインセッションが全体のオーケストレーション責任を保持する。サブエージェントの実行結果は最終サマリーのみがメインセッションに返され、中間の詳細ログ・ファイル読み取り結果はサブエージェントのコンテキストウィンドウ内に留まる。これにより、メインセッションのトークン消費を抑制しつつ、必要な情報だけを集約できる。

筆者の経験では、150人月規模の大規模基幹システム開発においてコードの品質よりコミュニケーション設計が成否を分けたが、AIエージェントの並列実行でもまったく同じ原則が当てはまる。エージェント間の「何を伝え、何を伝えないか」の境界設計が、トークン効率とタスク品質の両立を決定づけるのだ。

Task tool による並列エージェント起動の実装パターン

Task toolで並列エージェントを起動する基本原則は「依存関係のないタスクを単一メッセージ内で複数のTask呼び出しとして発行する」ことだ。Claude Codeは単一レスポンス内で複数のツール呼び出しを並行実行できるため、独立したタスクを同時に走らせることが可能になる。

以下に、認証モジュールのリファクタリングを例にした実装パターンを示す。

// パターン1: 独立リサーチの並列実行
// 単一メッセージ内で3つのExploreエージェントを同時起動

Task({
  subagent_type: "Explore",
  description: "Search auth middleware",
  prompt: "Find all authentication middleware files...",
  model: "haiku"
})

Task({
  subagent_type: "Explore",
  description: "Search session management",
  prompt: "Find session token handling...",
  model: "haiku"
})

Task({
  subagent_type: "Explore",
  description: "Search test coverage",
  prompt: "Find existing auth test files...",
  model: "haiku"
})

この3つのExploreエージェントは同時に実行され、それぞれの結果がメインセッションに返される。逐次実行では各探索に30-60秒かかるところ、並列実行では合計時間が最も遅いエージェントの実行時間に収束する。

パターン2: 競合仮説の並列検証は、デバッグ時に特に有効だ。バグの原因候補が複数ある場合、それぞれの仮説を別々のエージェントに検証させる。

// パターン2: 競合仮説の並列検証
Task({
  subagent_type: "Explore",
  description: "Check race condition",
  prompt: "Investigate if the auth failure is caused by a race condition in token refresh..."
})

Task({
  subagent_type: "Explore",
  description: "Check config mismatch",
  prompt: "Verify if environment config mismatch between staging and production..."
})

Task({
  subagent_type: "Bash",
  description: "Reproduce in test",
  prompt: "Run the auth integration tests with verbose logging to reproduce the failure..."
})

このパターンでは、3つの異なる仮説を同時に検証することで、逐次的な試行錯誤と比較して根本原因の特定速度が3倍以上向上する。Anthropicの内部データによれば、Agent Teams機能を用いた16エージェント並列構成では、約2,000セッション・API費用約2万ドルで10万行規模のRustベースCコンパイラを構築した実績がある（2026年2月5日、v2.1.32リサーチプレビュー）。

パターン3: フェーズ分離型の逐次＋並列ハイブリッドは、エンタープライズ開発で最も実用的なパターンだ。

// フェーズ1: 逐次（前提条件の確認）
Task({
  subagent_type: "Plan",
  description: "Analyze refactoring scope",
  prompt: "Analyze the current auth architecture and propose refactoring plan..."
})

// フェーズ2: 並列（承認後の実装）
// Plan結果に基づき、独立モジュールを並行修正
Task({
  subagent_type: "general-purpose",
  description: "Refactor JWT handler",
  prompt: "Implement the JWT token handler refactoring as planned...",
  run_in_background: true
})

Task({
  subagent_type: "general-purpose",
  description: "Refactor session store",
  prompt: "Implement the session store migration as planned...",
  run_in_background: true
})

// フェーズ3: 逐次（統合テスト）
Task({
  subagent_type: "Bash",
  description: "Run integration tests",
  prompt: "Run full auth integration test suite..."
})

フェーズ2でrun_in_background: trueを指定することで、2つのGeneral-Purposeエージェントがバックグラウンドで並行実行される。メインセッションはブロックされず、開発者は他の作業を続けられる。バックグラウンドエージェントの完了通知はメインセッションに自動的に返される仕組みだ。

AWSのFrontier AgentsがDevOps Agent・Security Agentを専門分化させてSRE業務を3-5倍高速化したのと同様に、Claude Agent SDKもエージェントの専門分化と並列実行の組み合わせで開発効率を飛躍的に向上させる。ただし、AWSがクラウドインフラ運用に特化しているのに対し、Claude Agent SDKはコーディング・リファクタリング・デバッグというソフトウェア開発のコアワークフローを対象としている点が本質的な違いだ。

run_in_background と Auto Memory によるコンテキスト管理の設計

run_in_backgroundパラメータは、Task toolの並列実行を非同期化する重要な機能だ。通常のTask呼び出しでは、サブエージェントの完了を待ってからメインセッションが次のアクションに移る。run_in_background: trueを指定すると、サブエージェントはバックグラウンドプロセスとして起動され、メインセッションは即座に次の処理に進める。

バックグラウンドエージェントの管理には3つの方法がある。

# 方法1: Task tool で明示的に指定
Task({
  ...,
  run_in_background: true
})

# 方法2: 実行中のエージェントをCtrl+Bでバックグラウンドに移行
# （インタラクティブセッション時のみ）

# 方法3: 口頭での指示
# "Run this in the background" とプロンプトで指定

バックグラウンドエージェントには重要な制約がある。事前権限承認（Pre-approval）が必須で、起動前にClaude Codeがユーザーに必要なツール権限を確認する。承認されなかったツール呼び出しは自動的に拒否される。また、AskUserQuestionツールによるユーザーへの質問は失敗するが、エージェント自体は処理を継続する。この設計は、バックグラウンド処理が人間のインタラクションなしに自律動作する前提に基づいている。

バックグラウンドエージェントの出力確認は、TaskOutputツールで行う。

// バックグラウンドタスクの状態確認
TaskOutput({
  task_id: "agent_abc123",
  block: false,        // ノンブロッキングで現在の状態を確認
  timeout: 30000       // 最大待機時間（ミリ秒）
})

// 完了を待機する場合
TaskOutput({
  task_id: "agent_abc123",
  block: true,
  timeout: 600000      // 最大10分待機
})

Auto Memoryはv2.1.59で導入された、セッション横断のコンテキスト共有メカニズムだ。従来、エージェントセッション間で知識を引き継ぐにはMEMORY.mdファイルを手動で管理する必要があったが、Auto Memoryはエージェントが自律的に重要な知見を記録・参照する。

Auto Memoryの記憶構造は4層で設計されている。

~/.claude/projects/<project>/memory/
├── MEMORY.md          # インデックスファイル（先頭200行/25KBをセッション開始時に読み込み）
├── debugging.md       # デバッグで得た知見
├── api-conventions.md # APIの規約・パターン
└── patterns.md        # コードパターン・アンチパターン

MEMORY.mdはセッション開始時に自動ロードされ、トピックファイルは必要に応じてオンデマンドで参照される。エージェントは作業中に発見したビルドコマンド・デバッグの知見・アーキテクチャの注意点・コードスタイルの慣習を自律的に記録し、将来のセッションで活用する。Auto Dream機能は定期的にメモリを整理し、関連性の高い情報を強化し、古くなった情報を除去する。

並列エージェントとAuto Memoryの組み合わせにおいて注意すべき点がある。複数のバックグラウンドエージェントが同時にMEMORY.mdを更新しようとした場合、ファイルの競合が発生する可能性がある。現在の設計では、メモリの書き込みはメインセッションが集約する形で行われ、サブエージェントが直接メモリファイルを更新することは推奨されていない。サブエージェントの発見事項はサマリーとしてメインセッションに返され、メインセッションがメモリ更新の判断を行う。

プロジェクト固有のメモリはgitリポジトリ単位で共有され、ワークツリー間でも同一のメモリディレクトリを参照する。ただし、マシンローカルに保存されるためクラウド同期は行われない。チームメンバーはMarkdownファイルを直接編集でき、エージェントが学習した知見を人間がレビュー・修正することも可能だ。

従来IDE統合との比較 ── Cursor・Windsurf・GitHub Copilotとの構造的差異

Claude Agent SDKの並列エージェントアーキテクチャは、Cursor・Windsurf・GitHub Copilotといった従来のIDE統合型AIツールと根本的に異なる設計思想に基づいている。この差異を理解することが、エンタープライズにおけるAIエージェントプラットフォーム選定の判断軸となる。

フォームファクターの違いが最も根本的だ。Claude Agent SDKはターミナルCLIエージェントとして動作し、任意のエディタ（VS Code拡張、Vim、Emacs、Zed）と組み合わせて使用できる。一方、CursorとWindsurfはVS Codeフォークとして独自IDEを要求し、GitHub CopilotはVS Code拡張として動作する。この違いは、エージェントがコードベース全体にアクセスする方法に直結する。

// アーキテクチャ比較
┌─────────────────────────────────────────────────────┐
│ Claude Agent SDK                                     │
│ ┌─────────┐  ┌─────────┐  ┌─────────┐              │
│ │ Explore │  │  Plan   │  │  Bash   │  ← 並列実行  │
│ │ (Haiku) │  │(inherit)│  │(inherit)│              │
│ └────┬────┘  └────┬────┘  └────┬────┘              │
│      └───────────┬┘────────────┘                    │
│            Main Session (Opus/Sonnet)                │
│            Full codebase access                      │
│            Terminal-native                            │
└─────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────┐
│ Cursor / Windsurf                                    │
│ ┌──────────────────────────────────┐                │
│ │      Single Agent Thread         │ ← 逐次実行    │
│ │      Viewport-constrained        │                │
│ │      IDE-embedded                │                │
│ └──────────────────────────────────┘                │
└─────────────────────────────────────────────────────┘

コンテキストアクセスの差異も決定的だ。Claude Agent SDKはファイルシステム全体にアクセスし、Glob・Grepで任意のファイルを探索できる。Cursor・Windsurfはビューポートに制約され、AIが「見ている」範囲が限定される。40ファイル以上にまたがるリファクタリングでは、この差が品質と速度の両面で顕著に現れる。

並列実行能力はClaude Agent SDKの最大の差別化要因だ。Cursorは基本的に単一スレッドで逐次処理を行い、Windsurfは2026年3月のWave 13アップデートでgitワークツリーを用いたマルチペイン機能を導入したが、Claude Agent SDKのTask toolによるネイティブ並列実行とは設計レベルで異なる。Claude Agent SDKでは、メインセッションが複数のサブエージェントを直接オーケストレーションし、それぞれが独立したコンテキストウィンドウを持つ。

コスト構造の違いも選定の重要な判断軸だ。2026年4月時点のコスト比較を以下に示す。

// 月額コスト比較（2026年4月時点）
Claude Agent SDK: トークン従量制 + $0.08/セッション時間
  - Haiku 4.5:  $1/$5 per 1M input/output tokens
  - Sonnet 4.5: $3/$15 per 1M tokens
  - Opus 4.6:   $15/$75 per 1M tokens
  - セッション時間: $0.08/時間

Cursor Pro:    $20/月（$20分のプレミアムモデルクレジット込み）
Windsurf:      $15/月
GitHub Copilot: $10/月（個人）、$21/月（Business）

少量のタスクではCursorやWindsurfの固定月額が割安だが、大規模プロジェクトで集中的にエージェントを活用する場合、Claude Agent SDKのHaikuモデルを並列Exploreに使うことでコスト効率が逆転する。特にExploreエージェントはHaiku（$1/$5 per 1M tokens）で動作するため、コードベース探索のコストは極めて低い。

筆者は複数のプロダクト開発を横断してきた経験から、技術選定でバイアスなく最適解を選ぶことの重要性を痛感している。Claude Agent SDKが万能というわけではなく、インタラクティブな対話型開発ではCursorの即時フィードバックが優れているし、チーム全体のコード品質管理にはGitHub CopilotのPR連携が効果的だ。エージェントの「自律性」と「人間の介入頻度」のバランスが、ツール選定の本質的な判断軸となる。

エンタープライズ導入の判断軸と実装ロードマップ

Claude Agent SDKの並列エージェントをエンタープライズ環境に導入する際、技術的な実装力だけでなく、ガバナンス・セキュリティ・コスト管理の3軸で判断する必要がある。2026年4月時点で、Anthropicの年間売上は25億ドル（年間換算）に達し、Claude Codeの開発者採用率は41-68%（調査により異なる）と報告されている。

ガバナンス設計では、Hook機能が中核となる。Claude Agent SDKはPreToolUse・PostToolUse・Stop・SessionStart・SessionEndの5種類のフックを提供し、エージェントの全アクションを監査・制御できる。

// .claude/hooks/preToolUse.sh の例
# 本番環境への直接アクセスを禁止
if [[ "$TOOL_NAME" == "Bash" ]] && echo "$TOOL_INPUT" | grep -q "production"; then
  echo "BLOCKED: Production access requires manual approval"
  exit 1
fi

// .claude/settings.json でのHook設定
{
  "hooks": {
    "PreToolUse": [{
      "command": "bash .claude/hooks/preToolUse.sh",
      "timeout": 5000
    }],
    "PostToolUse": [{
      "command": "bash .claude/hooks/audit-log.sh",
      "timeout": 3000
    }]
  }
}

この設計により、エージェントの自律動作を許容しつつ、セキュリティポリシーに違反するアクションを事前にブロックできる。バックグラウンドエージェントに対しても同じHookが適用されるため、非同期実行時のガバナンスも担保される。

セキュリティ設計では、3つのレイヤーで防御を構成する。第1レイヤーはファイルシステムサンドボックスで、エージェントがアクセスできるディレクトリを制限する。第2レイヤーはPIDネームスペース分離（Linux環境）で、サブプロセスの実行を隔離する。第3レイヤーはMCPサーバーの認証制御で、外部システムへのアクセスを個別に管理する。

// MCP サーバー設定例（.claude/mcp.json）
{
  "servers": {
    "github": {
      "command": "mcp-server-github",
      "env": {
        "GITHUB_TOKEN": "${GITHUB_TOKEN}"
      },
      "allowedTools": ["create_pull_request", "list_issues"],
      "blockedTools": ["delete_repository", "update_branch_protection"]
    }
  }
}

コスト管理では、エージェントタイプごとのモデル選択が最も影響が大きい。Exploreエージェントには必ずHaikuを指定し（model: "haiku"）、General-PurposeエージェントにはSonnetを、最終的な品質判断が必要な場面でのみOpusを使用する。この階層化により、16エージェント並列構成でもAPI費用を月額1,000-3,000ドルに抑えることが可能だ。

導入ロードマップとしては、3フェーズが推奨される。フェーズ1（1-2週間）: 個人開発者が単一プロジェクトでExploreエージェントの並列実行を導入し、コードベース探索の効率化を体感する。フェーズ2（2-4週間）: チーム単位でGeneral-Purposeエージェントの並列実行とHook設定を導入し、ガバナンスルールを策定する。フェーズ3（1-3ヶ月）: Agent Teams機能を活用した大規模タスクの並列処理と、Auto Memoryによるチームナレッジの蓄積を本格化する。

Faros.aiの計測データによれば、Claude Code導入チームではストーリー完了率が164%向上し、プルリクエストのマージ速度がほぼ2倍に達している。タスクあたりの所要時間は3.1時間から約15分に短縮された事例もある。50名規模のチームでは、AIが生成したコードの修正に6-8エンジニアリング時間/スプリントが必要だが、それを差し引いてもネットの生産性向上は圧倒的だ。

FAQ

Claude Agent SDKとClaude Codeの違いは何ですか？

Claude CodeはAnthropicが提供するターミナルベースのAIコーディングエージェントであり、Claude Agent SDKはそのClaude Codeの内部エンジンをPython/TypeScriptライブラリとして外部公開したものです。SDKを使えば、Claude Codeと同等のエージェントループ・ツール実行・コンテキスト管理をカスタムアプリケーションに組み込めます。2026年4月時点でSDK v0.2.119が最新です。

Task toolで同時に何個のエージェントを並列実行できますか？

公式には並列数の上限は明示されていませんが、Anthropic内部のAgent Teamsデモでは16エージェントの同時実行が確認されています。実用上は4-8エージェントの並列が最もコスト効率と品質のバランスが取れます。各エージェントが独立したコンテキストウィンドウを消費するため、並列数に比例してAPI費用も増加します。

run_in_backgroundで起動したエージェントの結果はどう確認しますか？

TaskOutputツールを使い、task_idを指定して結果を取得します。block: falseでノンブロッキング確認、block: trueで完了待機が可能です。バックグラウンドエージェントが完了すると、メインセッションに自動通知されます。実行中のタスク一覧は/tasksコマンドで確認できます。

Auto Memoryはチームで共有できますか？

Auto Memoryはプロジェクトのgitリポジトリごとにローカルディスクに保存されます（~/.claude/projects/<project>/memory/）。クラウド同期機能はないため、チーム共有にはメモリファイルをgitリポジトリに含めるか、ドキュメントとして別途共有する必要があります。MEMORY.mdは通常のMarkdownファイルなので、人間が直接編集することも可能です。

CursorからClaude Agent SDKに移行すべきですか？

必ずしも移行が必要ではありません。Cursorはインタラクティブな対話型開発に優れ、即時フィードバックとIDEネイティブな操作性が強みです。Claude Agent SDKは自律的なタスク実行と並列処理に特化しています。両者を併用し、対話型作業はCursor、大規模リファクタリングやバッチ処理はClaude Agent SDKという使い分けが実用的です。

エンタープライズでのセキュリティリスクはどう管理しますか？

3層の防御設計が推奨されます。第1層はHook機能によるアクション制御（PreToolUse/PostToolUse）、第2層はファイルシステムサンドボックスとPIDネームスペース分離、第3層はMCPサーバーの認証・権限管理です。バックグラウンドエージェントにも同じHookが適用されるため、非同期実行時もガバナンスが維持されます。

API費用はどの程度見込めばよいですか？

個人開発者で月額50-200ドル、チーム利用で月額1,000-3,000ドルが目安です。コスト最適化のポイントは、ExploreエージェントにHaiku（$1/$5 per 1M tokens）を指定し、Opusの使用を品質判断が必要な最終段階に限定することです。16エージェント並列で10万行プロジェクトを構築したAnthropicの事例では、総費用約2万ドルでした。

参考文献

Agent SDK overview — Anthropic Claude Code Docs, 2026年4月
Create custom subagents — Anthropic Claude Code Docs, 2026年4月
How Claude remembers your project — Anthropic Claude Code Docs, 2026年4月
Claude Code Changelog — Anthropic, 2026年4月25日
@anthropic-ai/claude-agent-sdk (TypeScript) — npm, v0.2.119
claude-agent-sdk-python — GitHub Anthropic, 2026年
Measuring Claude Code ROI: Developer Productivity Insights — Faros.ai, 2026年
SWE-bench Leaderboards — SWE-bench, 2026年
The Task Tool: Claude Code's Agent Orchestration System — DEV Community, 2026年

Claude Agent SDK 並列エージェント実装の実践ガイド ── Plan・Explore・Bash エージェントの協調設計と背景タスク管理で開発効率を5倍に高める並行実行アーキテクチャ