Claude Managed Agentsとは｜Anthropic純正の「サーバー側で動くAIエージェント基盤」を徹底解説【2026年版】 ‣ はてなベース株式会社

本記事の要点

Claude Managed Agents（CMA）は、Anthropic がエージェントの実行ループとサンドボックスコンテナをホストする新しいエージェント基盤です（2026年4月リリース・ベータ）。Agent（永続的な設定）× Session（実行ごとのインスタンス）× Environment（環境テンプレート）× Container（実行サンドボックス）の4要素で構成され、bash・file ops・web search といった標準ツールが組み込み済みです。MCPサーバー、Vault による OAuth 認証管理、Memory Store による長期記憶、Skills によるドメイン知識の差し込み、Outcome 駆動の自己評価ループまでを Anthropic 側で運用しながら呼び出すだけ で使えます。

2026年4月、Anthropic は 「Claude Managed Agents（CMA）」 という新しいエージェント基盤を一般公開しました（ベータ）。これまで Claude API を使ったエージェント構築は、開発者側で実行ループとサンドボックスを用意し、ツール呼び出しや状態管理を自分で実装する必要がありました。Managed Agents はその大半を Anthropic 側にホストしてもらい、Agent 設定とユーザーメッセージを送るだけで動くエージェント に置き換えるサービスです。

本記事では、Claude Managed Agents の仕組み、組み込みツール、料金、代表ユースケース、そして Gemini Enterprise や Salesforce Agentforce など他社エージェント基盤との違いを整理します。

Claude Managed Agents とは何か

Claude Managed Agents は、Anthropic がエージェントの「ループ実行」と「ツール実行サンドボックス」をホストするサーバーサイド型のエージェント基盤です。同じ Claude API でも、いくつかの利用形態があります。

利用形態	ループの実行場所	ツール実行場所	向いている用途
Claude API（messages）	クライアント側	クライアント側	単発の分類・要約・抽出
Claude API + tool use	クライアント側	クライアント側	ツール選定や承認を細かく制御したい
Claude Managed Agents	Anthropic側	Anthropic側コンテナ	ステートフルな長時間タスク・ファイルマウント・社員にアウトソースする業務

ポイントは、Managed Agents の場合 エージェントの「考え→ツールを叩く→結果を読む→次を考える」というループ全体が Anthropic 側で回る ことです。クライアントが行うのは「指示を送る」「ストリームを購読する」「カスタムツール結果を返す」程度に簡素化されます。

提供範囲（2026年5月時点）

Claude Managed Agents は Anthropic 直接提供のみ で、Amazon Bedrock・Google Vertex AI・Microsoft Foundry などのサードパーティ提供では利用できません。これらの環境で同等のことを実現したい場合は、Claude API + tool use を使って自前でループを実装する必要があります。

4つの構成要素で理解する

Managed Agents の世界観は、次の4要素で表現されます。

Agent（設定オブジェクト） — モデル・システムプロンプト・ツール・MCPサーバー・Skills 等を1つにまとめた永続的・バージョン管理可能な設定。一度作って ID を控え、Session から参照します。POST /v1/agents
Session（実行インスタンス） — Agent を指定して立ち上げる実行ごとのセッション。各セッションごとに専用コンテナがプロビジョニングされ、終了するまでイベントストリームを保持します。POST /v1/sessions
Environment（環境テンプレート） — Container をどう構成するかのテンプレート（ネットワーク設定・許可ホスト等）。Agent と独立して再利用できます。POST /v1/environments
Container（実行サンドボックス） — Session ごとに切り出される隔離コンテナ。bash・ファイル操作・コード実行はすべてここで行われます。エージェントの「ワーキングディレクトリ」と思えばOK

「Agent は一度作って何度も再利用、Session は実行ごとに新規」 が運用の基本ルールです。タスクごとに agents.create() を呼ぶのはアンチパターンで、ID を環境変数や設定ファイルに保存して使い回す前提になっています。

標準で使える組み込みツール

Agent には agent_toolset_20260401 というツールセットを丸ごと有効化できます。これだけで以下のツールが Anthropic 側のコンテナで動作します。

ツール	用途
`bash`	シェルコマンドの実行
`read`	ファイル読み込み（テキスト・画像・PDF・Jupyter Notebook 対応）
`write`	ファイルの新規作成
`edit`	ファイル内文字列置換
`glob`	ファイルパターンマッチ
`grep`	正規表現テキスト検索
`web_fetch`	URL からのページ取得
`web_search`	ウェブ検索

個別ツールごとに enabled フラグや権限ポリシー（自動許可 / 都度承認）を設定できるため、社内利用時のガードレールも引きやすい設計になっています。たとえば「bash は必ずユーザー承認を求める」「web_search は自動許可」というポリシーを宣言的に表現できます。

MCP連携と Vault による認証情報管理

Managed Agents は Model Context Protocol（MCP） を一級市民として扱います。Agent の mcp_servers フィールドに接続先 URL（GitHub MCP、Linear、Notion 等）を宣言し、認証情報は別途 Vault に格納する2層構造です。

Agent側：MCPサーバー URL と論理名だけを定義（認証情報を埋め込まない）
Vault側：OAuthアクセストークン・リフレッシュトークン・クライアント情報を格納。Anthropic 側が自動でトークンリフレッシュを行う
Session起動時：vault_ids を指定するだけで、その Session 中の MCP 呼び出しに認証が自動付与される

Agent 定義と認証情報を分離することで、同じ Agent を複数テナント・複数ユーザーで使い分けやすくなります。「Notion の MCP サーバーは共通、ワークスペースごとに別の Vault」というマルチテナント設計が自然に成立する仕組みです。

Memory Store — セッションを越える永続記憶

Session が終わるとコンテナは破棄されますが、Memory Store をアタッチしておけば、Session 間をまたぐ「学んだこと」をファイルとして残せます。コンテナには /mnt/memory/<store-name>/ というディレクトリとして FUSE マウントされ、エージェントは普段のファイルツール（read/write/edit/grep）で読み書きします。

ユースケース例として、「ユーザーごとの好み・プロジェクトコンテキスト・社内フォーマット規約」を Memory Store に書き出しておき、次の Session 開始時に同じストアをアタッチすると、エージェントは前回の作業の延長として動けます。memory のバージョン管理機能もあり、誤って上書きされた場合のロールバックや、機密情報の Redact（削除）にも対応します。

Skills — ドメイン知識の差し込みパッケージ

Skills は、エージェントに「必要なときだけ参照する専門知識」を持たせる仕組みです。Anthropic が事前提供する Skills（xlsx / docx / pptx / pdf）と、企業独自に作成・登録できるカスタム Skills の2種類があります。

Skills の特徴は 「タスクに関係するときだけ全文を読みに行く」進行的開示 にあります。常時システムプロンプトに詰め込むのではなく、エージェントがファイルとして読みに行く設計のため、コンテキストウィンドウを節約しながら専門タスクの精度を上げられます。

Outcome — ルーブリック評価でタスクを自走させる

Outcome は、「何を達成すれば終わりか」をルーブリック（評価基準）で定義し、エージェントが自分の出力を採点者モデルに評価させ、改訂を繰り返す機能です。

1回目：エージェントがタスクを実行 → アウトプット生成
ルーブリック評価：別コンテキストで動く採点者が成果物を採点
結果が satisfied なら完了、needs_revision なら改訂指示を受けてエージェントが再実行
上限 max_iterations（デフォルト3回・最大20回）まで自動でループ

「DCFモデルを Excel で作って」「監査レポートを社内テンプレートに合わせて書いて」のように、正解条件を文章化できるが手順は柔軟でよいタスクに向きます。エージェントが途中で寄り道しても、ルーブリックに照らして自己修正される設計です。

料金体系

Claude Managed Agents の料金は、通常の Claude API のトークン課金にいくつかの追加要素を組み合わせた構造です。Agent や Session を作る操作そのものには課金されません。

課金対象	概要
モデルトークン	通常の Claude API と同じ。Opus・Sonnet・Haiku ごとに input/output トークン課金
コンテナ実行時間	Session ごとに割り当てられるサンドボックスコンテナの実行時間
Server-side ツール	`web_search` や `code_execution` などサーバーサイドツールの利用回数 / 実行時間
Files API	ファイル本体は無料、メッセージで参照したときに input トークンとして課金
Memory Store / Vault	ストレージ容量に応じた課金（詳細は公式料金表で確認）

費用感の見立てとしては、Opus 4.7 を使う長時間タスク（1セッション数十分〜数時間）で1回あたり数十円〜数百円規模、シンプルなセッションなら数円〜十円台、社内全社ロールアウトで月額数十万円〜数百万円規模になることが多くなります。Prompt Caching が有効に効くため、共通プロンプト部分のコストは初回以降90%程度安くなる点も覚えておきたい特徴です。

見積もりは PoC を回しながら

実コストは「どのモデルか」「Outcome ループが何回回るか」「web_search や code_execution をどれだけ呼ぶか」で大きく振れます。本番投入前に典型ユースケースを5〜10件 PoC で流して、実費を測定したうえでスケール試算するのが安全です。

代表的なユースケース

Managed Agents は、「Claude を呼んで1回応答を返す」ではない、エージェントが自律的に複数ツールを使いながら成果物を作るタスクに強みを発揮します。

コーディングエージェント — GitHub リポジトリをマウントし、PR レビュー・テスト追加・依存関係更新を自走させる
社内ナレッジ調査エージェント — Memory Store と MCP（Notion / Confluence 等）を組み合わせ、社内資料を横断調査するレポートを生成
スプレッドシート分析エージェント — Excel ファイルをアップロードし、xlsx Skill と code_execution で集計・可視化
契約書ドラフトエージェント — docx Skill と社内テンプレート Memory Store を組み合わせて、過去契約を参考にしたドラフトを作成
Webリサーチ＋スライド化 — web_search でリサーチし、pptx Skill でスライド資料を生成
監査・コンプライアンスチェック — Outcome を使い、ルーブリックに沿った成果物が出るまで自動改訂

いずれも共通するのは、「タスクのゴールは決まっているが、途中のステップを事前に全部書けない」 タイプの仕事です。逆に、単発の質問応答や定型データ抽出は通常の Claude API のほうがシンプルで安価に済みます。

他社エージェント基盤との違い

2026年5月時点、エンタープライズAIエージェント基盤は Anthropic（Claude Managed Agents）・Google（Gemini Enterprise）・Microsoft（Copilot Studio）・Salesforce（Agentforce） の四極化が進んでいます。位置づけを整理します。

プラットフォーム	強み	向く第一導入領域
Claude Managed Agents	コーディング・長文ライティング・複雑タスクの推論力。MCP・Vault・Memory Store・Outcome といったエージェント基盤要素を素直に揃えた API	開発支援、ナレッジワーク、複雑業務のドラフト自動化
Gemini Enterprise	Google Workspace × Microsoft 365 の横断検索＋Agent Gallery によるパートナー製エージェント連携	情シス・経営企画・社員アシスタント
Microsoft 365 Copilot / Copilot Studio	Office・Teams・SharePoint との深い統合	Office 中心の業務部門
Salesforce Agentforce	CRM・Data Cloud × 営業/サポート領域の深さ	営業・カスタマーサクセス

Claude Managed Agents の独自性は、「特定の業務 SaaS にまとわせる」発想ではなく、「API・MCP・コンテナで自前のワークフローに組み込む」発想にある点です。社内システム構成が独特だったり、SaaSに収まらないオリジナル業務を自動化したい企業ほど、CMA のような 基盤型（フレームワーク的） エージェント API のほうが活きます。

Claude Managed Agents が向かない場面

便利な反面、Managed Agents が必ずしも最適ではないケースもあります。

Amazon Bedrock や Google Vertex AI 経由で Claude を使っている — Managed Agents は Anthropic 直接提供のみ。Bedrock/Vertex 経由なら Claude API + tool use を自前実装する必要がある
社内ネットワーク内に閉じたいデータがある — コンテナは Anthropic 側で動くため、機密データを社外に出せない場合はオンプレミスLLMやハイブリッド構成を検討する
コンテナの計算環境を自社で完全に制御したい — GPU・専用ハードウェア・特定OSバージョンが必須なら、自前ホスティング型のエージェント実装のほうが向く
1回応答だけで終わるタスク — 分類・要約・抽出など単発呼び出しなら、Managed Agents のオーバーヘッドは過剰

日本企業が導入するときのステップ

Managed Agents の導入は、いきなり全社展開ではなく段階的な PoC が定石です。

ステップ1 — ユースケースを1つに絞る

「コーディングエージェント」「契約書ドラフト」「社内Q&A」のように、効果が測りやすい単一ユースケースから始めます。複数同時に走らせると、コストも検証ノイズも増えて判断が鈍ります。

ステップ2 — Agent / Environment / Vault を YAML 管理する

Anthropic CLI（ant）は、Agent と Environment の定義を YAML としてリポジトリにコミットし、CI から ant beta:agents update で同期する運用に対応しています。設定を版管理することで、プロンプト変更による品質変動を追跡できます。

ステップ3 — Memory Store と Skills でドメイン適応

汎用 Agent ではなく、自社業務に効くエージェントにするには Memory Store（社内コンテキスト）と Skills（業務固有のノウハウ）を育てるのが王道です。最初は薄く始め、運用で得た知見を Memory Store に追記していきます。

ステップ4 — Outcome でガードレールを敷く

本番運用フェーズに入ったら、Outcome のルーブリックで「許容できる成果物」を定義します。これにより人間レビューの負担を下げつつ品質を担保できます。レビュー観点をルーブリックに落とせるかどうかが、エージェント運用のキモになります。

まとめ

Claude Managed Agents は、「エージェントの実行ループとサンドボックスを Anthropic にホストしてもらう」 という新しい設計のエージェント基盤です。Agent × Session × Environment × Container の4要素モデルはシンプルで、bash・file・web search の標準ツール、MCP連携、Vault、Memory Store、Skills、Outcome といったエージェント運用に必要な要素が一通り揃っています。

Microsoft や Google、Salesforce が「自社の業務 SaaS の延長としてエージェントを提供する」戦略を取るなか、Anthropic は「フレームワーク的な API として企業に組み込んでもらう」位置取りを明確にしました。「Claude Code レベルのコーディング能力」「複雑な推論」「長時間タスクの完遂力」を社内ワークフローに組み込みたい企業にとって、第一の検討対象になる基盤です。

ただし真価を発揮させるには、業務ユースケースの絞り込み・データ整備・Memory Store と Skills の育成・Outcome ルーブリックの設計 が欠かせません。技術導入というより、「エージェントに任せる業務範囲」を定義するプロジェクトだと捉えると、社内合意も取りやすくなります。