Anthropic Dreamingとは何か|AIエージェントが「眠りながら失敗を学ぶ」仕組みを徹底解説

2026年5月6日、Anthropicが開発者向けカンファレンス「Code with Claude 2026」で発表した新機能が、AIエージェントの世界に静かな衝撃を与えている。そ…

2026年5月6日、Anthropicが開発者向けカンファレンス「Code with Claude 2026」で発表した新機能が、AIエージェントの世界に静かな衝撃を与えている。その名は「Dreaming(ドリーミング)」。AIエージェントが仕事と仕事の間、人間で言えば「眠っている時間」に、過去の作業記録を自律的に見直し、失敗パターンを整理し、次の仕事のためのプレイブック(行動指針)を書き直す仕組みだ。

法律AIスタートアップのHarvey社は社内テストでタスク完了率が約6倍に向上したと報告している。医療書類レビューのWisedocs社は処理時間が50%削減されたという。この記事では、Dreamingの技術的な仕組みと実際の使い方を、具体的な業務シナリオを交えて図解で解説する。

Dreamingとは — 一言で言うと何か

Dreamingを一言で言えば「AIエージェントのための記憶の整理整頓タイム」だ。通常のAIエージェントはセッション(1回の仕事)が終わるとその記憶を引き継げない。毎回白紙の状態から始まる。これが「なぜAIは同じミスを繰り返すのか」の根本原因だった。詳しくはClaude Memoryの使い方も合わせて読むと理解が深まる。

Dreamingはこの「溜まり続ける生ログ」を定期的に整理して、重要なパターンを抽出し、構造化されたプレイブックとして書き直す処理だ。

セッション中(作業中)とドリーミング中(眠り・整理中)の比較図解
図1 セッション中(左)は生ログが散乱。ドリーミング中(右)はエージェントが眠りながら整理してプレイブックを作る

脳の「夢を見る」仕組みとの類似性

人間の脳は睡眠中(特にREM睡眠)に「記憶の統合」を行う。起きている間に海馬(hippocampus)に一時保存された記憶が、睡眠中に大脳新皮質(neocortex)へ転送され、長期記憶として定着する。重要でない情報は刈り込まれ、重要なパターンは強化される。

人間の脳の睡眠中の記憶統合とAnthropicDreamingの対比図解
図2 人間の脳(左)と Claudeエージェント(右)の記憶統合プロセスの対比

重要 Dreamingはモデルの「再学習」ではない

DreamingはAIモデルの重み(パラメータ)を一切変更しない。あくまでも「外部メモリとしてのMarkdownノートを整理・更新する」処理だ。プレイブックは人間が読める形式で保存されるため、AIが何を学んだかを完全に監査できる。

Dreams APIの技術的な仕組み

Dreamingは「Dreams API」として提供されている(2026年5月時点でリサーチプレビュー、限定公開)。エンドポイントは POST https://api.anthropic.com/v1/dreams。対応モデルは claude-opus-4-7claude-sonnet-4-6AI エージェント時代のAPI基礎知識を先に読んでおくと理解しやすい。

Dreams APIの処理フロー
図3 Dreams APIの処理フロー。入力 → 非同期処理(数分〜数十分)→ 新しい記憶ノート → 人間レビュー

実際にどう使うのか — ステップ別ガイド

Dreamingは「セッションを重ねるエージェント」があって初めて意味を持つ。たとえば毎日問い合わせ対応をこなすカスタマーサポートエージェント、毎週レポートを生成する分析エージェント、毎朝コードレビューをするエンジニアリングエージェントなどが対象だ。以下は「問い合わせ対応エージェント」を例にしたステップ別の使い方だ。

ステップ1 Claude Managed Agentsへのアクセスを申請する

claude.com/form/claude-managed-agents からリサーチプレビューへの参加を申請する。承認後、Anthropic Consoleから Managed Agents と Dreams API が利用可能になる。申請フォームには「どんなエージェントに使いたいか」「セッション頻度はどの程度か」を記入する欄がある。

ステップ2 エージェントにセッションログの記録を仕込む

Dreamingに「食わせる素材」はセッションの作業記録だ。Claude Managed Agentsではセッション完了後に自動でトランスクリプト(会話ログ)が保存される。Dreaming実行時にこれを最大100件まで渡せる。まず10〜20セッション分の記録が溜まってから初回のDreamingを実行するのが推奨だ。

ステップ3 Dreams APIを呼び出す

溜まったセッションログと既存の記憶ノートをAPIに渡す。リクエストに含めるのは主に3つだ。①どの記憶ノートを素材にするか(memory_store_id)、②どのセッションログを使うか(session_ids、最大100件)、③絞り込み指示(instructions、任意)。たとえば「ユーザーが不満を示した返答パターンに注目してください」と指示すれば、Dreamingがその観点で分析してくれる。

最初の指示の例(問い合わせ対応エージェントの場合)

「よく繰り返される質問のカテゴリと、エージェントが最もうまく答えられたパターンを整理してください。一度限りの特殊な問い合わせは無視してよいです。」このように焦点を絞ると、出力のプレイブックが実践的になる。

ステップ4 処理完了を待ってアウトプットを確認する

Dreamingは非同期処理なので、ステータスをポーリング(定期的に確認)する必要がある。ステータスが「完了」になったら、生成されたMarkdownのプレイブックを確認する。良い出力には次のような内容が含まれている。

  • よく来る質問カテゴリ — 「返金に関する問い合わせが全体の34%」など、パターンが定量的にまとまっている
  • 有効だった返答スタイル — 「まず共感を示してから解決策を提示すると離脱率が下がる傾向」など、成功パターンの記録
  • 避けるべき表現 — 「〜は難しい、というネガティブな表現に対してユーザー満足度が下がった」など、失敗パターンの抽出
  • 未解決の課題 — 「在庫状況の回答精度が低い。製品データベースとの連携が必要」など、次のアクションへの示唆

ステップ5 人間がレビューして「採用」または「破棄」を判断する

Dreamingのアウトプットは自動的にエージェントに反映されるわけではない。必ず人間がレビューするのが正しい手順だ。内容が妥当と判断したら、そのプレイブックを次のセッションの記憶ノートとして設定する。問題があれば破棄して再度Dreamingを実行するか、手動で修正してから適用する。

「いいね」ボタンを押す感覚で使わない

Dreamingのアウトプットを中身を確認せずに承認し続けると、エージェントの行動が少しずつズレていく。特に最初の数回は「本当にこのパターンは正しいか?」を担当者が1行ずつ確認することを強く推奨する。

ステップ6 定期実行のサイクルを設計する

Dreamingは一度やって終わりではなく、継続的なサイクルが重要だ。たとえば「毎週月曜日の夜間バッチで直近50セッションのDreamingを実行 → 火曜朝に担当者がレビュー → 承認後に新しいプレイブックを適用」という運用サイクルが現実的だ。セッションが溜まるほど分析の精度が上がるため、最初の1〜2ヶ月は特に出力の変化を追いかけて改善点を観察するとよい。

業務別の活用シナリオ

Dreamingは特定の業務に特化したエージェントほど効果が高い。以下に代表的な3シナリオを示す。

カスタマーサポートAI同じカテゴリの質問に対して毎回バラバラな回答をしてしまう過去ログから「うまくいった返答パターン」をプレイブックとして定期的に更新。回答の一貫性が向上
コードレビューエージェントチームのコーディング規約を毎回学習し直す。前回指摘したのと同じ問題を見落とす「このチームのコーディング傾向」と「頻発するミスパターン」がプレイブックに定着。指摘の精度が上がる
営業メール作成AI担当者ごとに微妙にトーンや文体の好みが違うが、毎回1から学習する「この担当者は箇条書きを好む」「件名は15文字以内が高開封率」といった傾向が蓄積されていく

複数エージェントが「同じ夢を共有する」チーム学習

Dreamingの真価が発揮されるのは、複数のAIエージェントが並列して動くシナリオだ。エージェントA・B・Cがそれぞれ別の仕事をこなしていても、全員のセッションログをまとめてDreamingにかければ、「誰か1人のセッションでは見えなかったパターン」を発見できる。これはAnthropicが同時発表したマルチエージェント連携(複数のAIが役割分担して協調動作する仕組み)とも組み合わせて使える設計になっている。

複数AIエージェントによるチーム学習
図4 複数エージェントのセッションログを束ねてDreamingにかけると、チーム全体の知見が1つのプレイブックに集約される

実際の導入効果 — HarveyとWisedocsの事例

ドリーミング導入実績グラフ
図5 リサーチプレビュー段階での報告値(社内テスト)

法律AIのHarvey社は社内テストで「Dreamingを使うとタスク完了率が約6倍に向上した」と報告した。これは単に精度が上がったのではなく、「過去に失敗したのと同じアプローチをとらなくなった」ことが主因だという。医療書類レビューのWisedocsはDreamingと同時発表された「Outcomes(評価機能)」を組み合わせて書類レビュー時間を50%削減した。

数値の解釈に注意

「タスク完了率6倍」はリサーチプレビュー段階の社内テスト報告値だ。本番環境での再現性は使い方・タスクの種類・メモリ設計によって大きく異なる。

セキュリティリスク — 記憶ノートへの「毒入れ」

Dreamingは新しいリスクも生む。記憶ノートは「長期的な影響力チャネル」になる。もし悪意あるセッション(プロンプトインジェクション攻撃など)が虚偽情報をセッションログに埋め込んだ場合、Dreamingがそれを信頼できる知見として統合してしまうリスクがある。AI ガバナンス整備支援の枠組みで対処するのが現実的だ。

  • Dreamingのアウトプットは自動採用しない — 必ず人間がレビューしてから次のセッションに適用する
  • セッションログのフィルタリング — Dreamingに渡すセッションを選別し、信頼性の低いセッションを除外する
  • 3ストア構成で権限を分離 — 読み取り専用の組織ノート・プロジェクトノート・読み書き可能な作業ノートの3層構造にし、上位ノートへの昇格は人間がレビュー後に実施

Dreaming・Outcomes・マルチエージェント連携の3点セット

Dreaming(ドリーミング)過去のセッションを振り返り、記憶ノートを最適化する定型業務を繰り返すエージェント、長期稼働エージェント
Outcomes(評価機能)エージェントの成果物をAIが採点し、基準未達なら自動再実行品質基準のある書類生成、コードレビュー、報告書作成
マルチエージェント連携リードエージェントが複数の専門エージェントに並列でサブタスクを委託大規模コードベース解析、多拠点データ収集、並列調査

まとめ — Dreamingを3行で理解する

①AIエージェントがセッションとセッションの間に、過去の失敗・成功パターンをプレイブックとして自律的に整理する。②モデルの重みは一切変わらない。出力はMarkdownなので人間が完全に読める・審査できる。③使い方は「セッションを溜める → Dreaming実行 → 人間レビュー → 採用 → 次のセッションへ反映」の繰り返しだ。

2026年5月現在、Dreams APIはリサーチプレビューとして限定公開中だ(申請: claude.com/form/claude-managed-agents)。Claudeのエージェント機能を業務に導入したい場合は、AIコーチング 1on1 伴走支援AX診断サービスも活用いただきたい。