Anthropicが提供するClaude Agent SDKは、従来のステートレスなLLM APIとは異なり、永続的なシェル環境でコマンドを実行し、ファイル操作を行う長時間実行プロセスとして動作する。このアーキテクチャ上の特性は、デプロイ先のインフラ選定に直接的な影響を与える。本稿では、公式ドキュメントが推奨する7つのサンドボックスプロバイダを、価格・起動速度・機能の観点から比較分析する。
Agent SDKが求めるインフラ要件
Claude Agent SDKの最小構成は、1 vCPU・1 GiB RAM・5 GiBディスクとされている。ランタイムとしてNode.js 18+(TypeScript SDK)またはPython 3.10+(Python SDK)が必要であり、api.anthropic.comへのアウトバウンドHTTPS接続が必須となる。
従来のサーバーレスFaaS(AWS Lambda、Cloudflare Workers等)とは根本的に異なり、Agent SDKは長時間実行プロセスとして動作する。エージェントがユーザーの指示を受けてコードを書き、テストを実行し、結果を返すまでの一連のフローは数分から数時間に及ぶことがある。そのため、実行時間制限が短いサーバーレス環境は不向きであり、コンテナベースのPaaSやサンドボックス環境が適している。
Anthropicは公式ドキュメントで4つのデプロイパターンを定義している。タスクごとにコンテナを起動・破棄するエフェメラルセッション、常駐型のロングランニングセッション、履歴をDBから復元するハイブリッドセッション、そして複数エージェントを1コンテナで動かすシングルコンテナである。プロバイダ選定にあたっては、自身のユースケースがどのパターンに該当するかを見極めることが出発点となる。
7プロバイダ比較:価格・起動速度・機能
以下の比較は、2026年2月時点の公開情報に基づく。価格は1 vCPU相当のサンドボックスを1時間稼働させた場合の概算である。
| プロバイダ | プラン体系 | 従量単価(1vCPU/h) | コールドスタート | 最大実行時間 | GPU | SDK対応言語 |
|---|---|---|---|---|---|---|
| E2B | Hobby:無料($100クレジット) Pro:$150/月(同時実行100、24hセッション) | 約$0.05/h | 〜150ms | Hobby:1時間 Pro:24時間 | なし | Python・TypeScript |
| Daytona | 基本料なし($200クレジット付き) Enterprise:要問合せ | 約$0.05/h | 〜90ms | 無制限 | Enterprise | Python・TypeScript |
| Blaxel | 基本料なし($200クレジット付き) Custom:要問合せ | 約$0.08/h | 〜25ms | 無制限 | なし | Python・TypeScript |
| Cloudflare Sandbox | Workers Free枠内 Workers Paid:$5/月 | 約$0.09/h | 2〜3秒 | 設定可能 | なし | TypeScript |
| Modal | Starter:無料($30/月クレジット) Team:$250/月($100クレジット込み) | Standard:約$0.05/h Sandbox:約$0.14/h | サブ秒 | 24時間 | 充実(T4〜B200) | Python優先 |
| Vercel Sandbox | Hobby:無料(5 CPU時間/月) Pro:$20/月($20クレジット込み) | 約$0.15/h | 高速 | Hobby:45分 Pro:5時間 | なし | Node.js・Python |
| Fly Machines | 基本料なし(完全従量課金) HIPAA対応:$99/月追加 | 約$0.003/h〜 | サブ秒 | 無制限 | なし | 任意 |
Fly.ioの価格が極端に低く見えるのは、shared-cpu-1x(256MB RAM)という最小構成の数値であるためである。Agent SDKの推奨構成(1 GiB RAM)に合わせると実質的には$0.01〜0.03/h程度となるが、それでもコストパフォーマンスは高い。ただし、Fly.ioは汎用コンテナPaaSであり、AIエージェント向けのサンドボックス機能は組み込まれていない。具体的には、E2BやDaytonaが標準提供するFirecracker microVMによるプロセス隔離、ファイルシステムの自動クリーンアップ、ネットワークポリシーの自動適用、エージェントごとのリソース上限設定といった機能を、Fly.ioでは自前でDockerイメージやネットワーク設定を組み合わせて構築する必要がある。運用負荷は上がるが、その分カスタマイズの自由度は高い。
なお、従量単価はプランによって変わるのかという疑問が生じるが、大半のプロバイダではプランを問わず従量単価は同一である。E2B、Vercel、Daytona、Blaxel、Fly.io、Cloudflareのいずれも、プランで変わるのはセッション上限・同時実行数・サポートレベル等の機能制限であり、1秒あたりのコンピュート単価は変わらない。唯一注意すべきはModalで、通常の「Standard Compute」(CPU: $0.0000131/core/sec ≒ $0.05/h)と「Sandbox」カテゴリ(CPU: $0.00003942/core/sec ≒ $0.14/h)で約3倍の単価差がある。Agent SDKをModalで動かす場合はSandbox料金が適用される可能性が高く、見積もり時に注意が必要である。Enterpriseプランではボリュームディスカウントの交渉が可能なプロバイダもある(Modal、Vercel等)。
プラン料金の設計思想もプロバイダごとに大きく異なる。E2Bは月額$150のProプランで同時実行数やセッション上限を大幅に引き上げるゲート方式を採り、本番運用にはPro加入が事実上必須となる(Hobbyではセッション上限が1時間、同時実行が20に制限される)。Modalは$250/月のTeamプランで$100クレジットが付くため、実質的な追加負担は$150/月相当である。一方、DaytonaとBlaxelは月額基本料を設けず完全従量課金とし、初期クレジット($200)の太さで新規ユーザーを獲得する戦略をとっている。Vercelは既存のPro($20/月)プランにSandbox利用を統合しており、Vercelエコシステムを既に使っているチームには追加導入コストが低い。Cloudflareは$5/月のWorkers有料プランが前提となるが、Sandbox自体の追加料金はない。
ユースケース別の推奨構成
コード生成エージェント(エフェメラル型)
タスクごとにサンドボックスを起動し、コード生成・テスト実行・結果返却後に破棄するパターン。起動速度とセキュリティ隔離が最重要となる。E2BがFirecracker microVMベースの隔離とサブ200msの起動速度を両立しており、第一候補となる。Daytonaも90msの起動速度と無制限の実行時間で有力な選択肢である。
常駐型チャットボット(ロングランニング型)
Slackボットやカスタマーサポートのようにメッセージを常時待ち受けるパターン。コンテナの常時起動コストが焦点となる。Fly Machinesは秒単位課金でアイドル時の自動スリープに対応しており、コスト効率が高い。ModalはSlack GIF生成エージェントの公式デモ実装を提供しており、実装の参考になる。
GPU推論を伴うマルチモーダルエージェント
画像処理や独自モデルの推論をエージェント内で行う場合、GPU対応が必須となる。この領域ではModalが圧倒的に強く、T4(約$0.50/h)からB200($6.25/h)まで幅広いGPUを秒単位で利用できる。他のサンドボックスプロバイダはGPU非対応が多い。
エンタープライズ・高セキュリティ要件
SOC 2やHIPAA準拠が求められる環境では、BlaxelがSOC 2 Type II・HIPAA・ISO 27001認証を取得済みである。DaytonaもBYOC(Bring Your Own Cloud)やオンプレミスデプロイに対応しており、データレジデンシー要件を満たしやすい。E2BもBYOCオプションを提供している。
コスト構造の本質:インフラ代はAPIトークン代の前では誤差
Agent SDKのデプロイにおいて最も重要な事実は、支配的なコストはインフラではなくAPIトークン代であるということだ。Anthropicの公式ドキュメントによれば、コンテナの最低コストは約$0.05/時間とされる一方、Claude Sonnet 4.5のAPIはインプット$3/百万トークン・アウトプット$15/百万トークンである。
具体例として、Claude Codeの平均コストはSonnet 4.5使用時で1開発者あたり月$100〜200とされている。一方、エフェメラルなサンドボックスを1日8時間×20営業日稼働させた場合のインフラコストは$8〜24(E2B/Daytona相当)に過ぎない。APIトークン代がインフラ代の5〜25倍を占める計算となる。
したがって、プロバイダ選定においてはインフラ単価の微差よりも、起動速度(ユーザー体験に直結)、セキュリティ隔離レベル(Firecracker microVM vs コンテナ vs V8 isolate)、SDK統合の容易さ(公式サンプルの有無)、およびアイドル時のコスト挙動(自動スリープの有無)を重視すべきである。
セルフホスト vs マネージドの判断基準
Anthropicは公式ドキュメントでセルフホスト向けの隔離技術も解説している。Dockerコンテナ(Linux namespaceベースの隔離)、gVisor(ユーザースペースでシステムコールを仲介し、カーネル共有のリスクを低減)、Firecracker(AWS Lambdaの基盤技術でもあるmicroVM)の3段階が提示されている。
セルフホストが適するのは、既存のKubernetesクラスタを持ち運用体制が整っている組織、あるいはデータの外部送信が許容されないエアギャップ環境である。一方、マネージドサンドボックスが適するのは、インフラ運用に工数を割けないスタートアップや、迅速なプロトタイピングを優先するフェーズである。
なお、いずれの場合もクレデンシャルの隔離が重要となる。Anthropicはエージェントの実行環境の外側にプロキシを配置し、APIキーをエージェントから不可視にするアーキテクチャを推奨している。
FAQ
AWS LambdaやCloudflare WorkersでAgent SDKは動かせないのか?
技術的には困難である。Agent SDKは長時間実行プロセスとして設計されており、Lambdaの15分制限やWorkersの30秒制限(Unbound含め)では複雑なエージェントタスクを完遂できない。Cloudflare Sandboxは別機能であり、Workersとは異なるコンテナベースの実行環境を提供する。
最もコストが安いプロバイダはどれか?
純粋なインフラ単価ではFly Machines(shared CPU構成で$0.003/h〜)が最安だが、サンドボックス隔離を自前構築する必要がある。マネージドサンドボックスとしてはE2BとDaytonaが約$0.05/hで並び、無料クレジットはDaytona($200)がE2B($100)を上回る。ただし前述の通り、総コストに占めるインフラ比率は小さい。
エージェントのセッションが途中で切れた場合、復旧できるか?
Agent SDKにはセッション再開(session resumption)機能が組み込まれている。ハイブリッドセッションパターンでは、会話履歴と状態をデータベースに永続化し、新しいコンテナで復元する設計が推奨されている。Blaxelはメモリ状態を保持したまま25msでレジュームできる独自機能を持つ。
日本リージョンでの利用は可能か?
Fly.ioは東京リージョン(nrt)を提供している。Modalはus-east等の米国リージョンが中心だが拡大中である。Cloudflareはグローバルエッジネットワークを持つ。E2B・Daytonaはエンタープライズプランでリージョン指定が可能とされている。Vercel Sandboxは2026年2月時点でiad1(米国東部)のみに限定されている。
複数のエージェントを同時に動かす場合の推奨構成は?
Anthropicはシングルコンテナパターン(1コンテナ内で複数エージェントプロセス)も定義しているが、エージェント間の干渉リスクがあるため非推奨としている。推奨はエージェントごとに独立したサンドボックスを割り当てるエフェメラルパターンであり、E2BやDaytonaはこのパターンに特化した設計となっている。
参考文献
- Hosting the Agent SDK — Anthropic, 2025
- Securely deploying AI agents — Anthropic, 2025
- E2B Pricing — E2B, 2026
- Daytona — Secure Infrastructure for Running AI-Generated Code — Daytona, 2026
- Modal Plan Pricing — Modal, 2026
- Fly.io Resource Pricing — Fly.io, 2026
- Cloudflare Sandbox SDK — Cloudflare, 2025
- Vercel Sandbox Pricing — Vercel, 2026
- Blaxel Pricing — Blaxel, 2026
- AI Code Sandbox Benchmark 2026 — Superagent, 2026
- 10 Best Sandbox Runners in 2026 — Better Stack, 2026



