Anthropic Dreamingとは何か｜AIエージェントが「眠りながら失敗を学ぶ」仕組みを徹底解説 ‣ はてなベース株式会社

2026年5月6日、Anthropicが開発者向けカンファレンス「Code with Claude 2026」で発表した新機能が、AIエージェントの世界に静かな衝撃を与えている。その名は「Dreaming（ドリーミング）」。AIエージェントが仕事と仕事の間、人間で言えば「眠っている時間」に、過去の作業記録を自律的に見直し、失敗パターンを整理し、次の仕事のためのプレイブック（行動指針）を書き直す仕組みだ。

法律AIスタートアップのHarvey社は社内テストでタスク完了率が約6倍に向上したと報告している。医療書類レビューのWisedocs社は処理時間が50%削減されたという。この記事では、Dreamingの技術的な仕組みと実際の使い方を、具体的な業務シナリオを交えて図解で解説する。

Dreamingとは — 一言で言うと何か

Dreamingを一言で言えば「AIエージェントのための記憶の整理整頓タイム」だ。通常のAIエージェントはセッション（1回の仕事）が終わるとその記憶を引き継げない。毎回白紙の状態から始まる。これが「なぜAIは同じミスを繰り返すのか」の根本原因だった。詳しくはClaude Memoryの使い方も合わせて読むと理解が深まる。

Dreamingはこの「溜まり続ける生ログ」を定期的に整理して、重要なパターンを抽出し、構造化されたプレイブックとして書き直す処理だ。

セッション中（作業中）とドリーミング中（眠り・整理中）の比較図解 — 図1 セッション中（左）は生ログが散乱。ドリーミング中（右）はエージェントが眠りながら整理してプレイブックを作る

脳の「夢を見る」仕組みとの類似性

人間の脳は睡眠中（特にREM睡眠）に「記憶の統合」を行う。起きている間に海馬（hippocampus）に一時保存された記憶が、睡眠中に大脳新皮質（neocortex）へ転送され、長期記憶として定着する。重要でない情報は刈り込まれ、重要なパターンは強化される。

人間の脳の睡眠中の記憶統合とAnthropicDreamingの対比図解 — 図2 人間の脳（左）と Claudeエージェント（右）の記憶統合プロセスの対比

重要 Dreamingはモデルの「再学習」ではない

DreamingはAIモデルの重み（パラメータ）を一切変更しない。あくまでも「外部メモリとしてのMarkdownノートを整理・更新する」処理だ。プレイブックは人間が読める形式で保存されるため、AIが何を学んだかを完全に監査できる。

Dreams APIの技術的な仕組み

Dreamingは「Dreams API」として提供されている（2026年5月時点でリサーチプレビュー、限定公開）。エンドポイントは POST https://api.anthropic.com/v1/dreams。対応モデルは claude-opus-4-7 と claude-sonnet-4-6。AI エージェント時代のAPI基礎知識を先に読んでおくと理解しやすい。

図3 Dreams APIの処理フロー。入力 → 非同期処理（数分〜数十分）→ 新しい記憶ノート → 人間レビュー

実際にどう使うのか — ステップ別ガイド

Dreamingは「セッションを重ねるエージェント」があって初めて意味を持つ。たとえば毎日問い合わせ対応をこなすカスタマーサポートエージェント、毎週レポートを生成する分析エージェント、毎朝コードレビューをするエンジニアリングエージェントなどが対象だ。以下は「問い合わせ対応エージェント」を例にしたステップ別の使い方だ。

ステップ1 Claude Managed Agentsへのアクセスを申請する

claude.com/form/claude-managed-agents からリサーチプレビューへの参加を申請する。承認後、Anthropic Consoleから Managed Agents と Dreams API が利用可能になる。申請フォームには「どんなエージェントに使いたいか」「セッション頻度はどの程度か」を記入する欄がある。

ステップ2 エージェントにセッションログの記録を仕込む

Dreamingに「食わせる素材」はセッションの作業記録だ。Claude Managed Agentsではセッション完了後に自動でトランスクリプト（会話ログ）が保存される。Dreaming実行時にこれを最大100件まで渡せる。まず10〜20セッション分の記録が溜まってから初回のDreamingを実行するのが推奨だ。

ステップ3 Dreams APIを呼び出す

溜まったセッションログと既存の記憶ノートをAPIに渡す。リクエストに含めるのは主に3つだ。①どの記憶ノートを素材にするか（memory_store_id）、②どのセッションログを使うか（session_ids、最大100件）、③絞り込み指示（instructions、任意）。たとえば「ユーザーが不満を示した返答パターンに注目してください」と指示すれば、Dreamingがその観点で分析してくれる。

最初の指示の例（問い合わせ対応エージェントの場合）

「よく繰り返される質問のカテゴリと、エージェントが最もうまく答えられたパターンを整理してください。一度限りの特殊な問い合わせは無視してよいです。」このように焦点を絞ると、出力のプレイブックが実践的になる。

ステップ4 処理完了を待ってアウトプットを確認する

Dreamingは非同期処理なので、ステータスをポーリング（定期的に確認）する必要がある。ステータスが「完了」になったら、生成されたMarkdownのプレイブックを確認する。良い出力には次のような内容が含まれている。

よく来る質問カテゴリ — 「返金に関する問い合わせが全体の34%」など、パターンが定量的にまとまっている
有効だった返答スタイル — 「まず共感を示してから解決策を提示すると離脱率が下がる傾向」など、成功パターンの記録
避けるべき表現 — 「〜は難しい、というネガティブな表現に対してユーザー満足度が下がった」など、失敗パターンの抽出
未解決の課題 — 「在庫状況の回答精度が低い。製品データベースとの連携が必要」など、次のアクションへの示唆

ステップ5 人間がレビューして「採用」または「破棄」を判断する

Dreamingのアウトプットは自動的にエージェントに反映されるわけではない。必ず人間がレビューするのが正しい手順だ。内容が妥当と判断したら、そのプレイブックを次のセッションの記憶ノートとして設定する。問題があれば破棄して再度Dreamingを実行するか、手動で修正してから適用する。

「いいね」ボタンを押す感覚で使わない

Dreamingのアウトプットを中身を確認せずに承認し続けると、エージェントの行動が少しずつズレていく。特に最初の数回は「本当にこのパターンは正しいか？」を担当者が1行ずつ確認することを強く推奨する。

ステップ6 定期実行のサイクルを設計する

Dreamingは一度やって終わりではなく、継続的なサイクルが重要だ。たとえば「毎週月曜日の夜間バッチで直近50セッションのDreamingを実行 → 火曜朝に担当者がレビュー → 承認後に新しいプレイブックを適用」という運用サイクルが現実的だ。セッションが溜まるほど分析の精度が上がるため、最初の1〜2ヶ月は特に出力の変化を追いかけて改善点を観察するとよい。

業務別の活用シナリオ

Dreamingは特定の業務に特化したエージェントほど効果が高い。以下に代表的な3シナリオを示す。

カスタマーサポートAI	同じカテゴリの質問に対して毎回バラバラな回答をしてしまう	過去ログから「うまくいった返答パターン」をプレイブックとして定期的に更新。回答の一貫性が向上
コードレビューエージェント	チームのコーディング規約を毎回学習し直す。前回指摘したのと同じ問題を見落とす	「このチームのコーディング傾向」と「頻発するミスパターン」がプレイブックに定着。指摘の精度が上がる
営業メール作成AI	担当者ごとに微妙にトーンや文体の好みが違うが、毎回1から学習する	「この担当者は箇条書きを好む」「件名は15文字以内が高開封率」といった傾向が蓄積されていく

複数エージェントが「同じ夢を共有する」チーム学習

Dreamingの真価が発揮されるのは、複数のAIエージェントが並列して動くシナリオだ。エージェントA・B・Cがそれぞれ別の仕事をこなしていても、全員のセッションログをまとめてDreamingにかければ、「誰か1人のセッションでは見えなかったパターン」を発見できる。これはAnthropicが同時発表したマルチエージェント連携（複数のAIが役割分担して協調動作する仕組み）とも組み合わせて使える設計になっている。

複数AIエージェントによるチーム学習 — 図4 複数エージェントのセッションログを束ねてDreamingにかけると、チーム全体の知見が1つのプレイブックに集約される

実際の導入効果 — HarveyとWisedocsの事例

ドリーミング導入実績グラフ — 図5 リサーチプレビュー段階での報告値（社内テスト）

法律AIのHarvey社は社内テストで「Dreamingを使うとタスク完了率が約6倍に向上した」と報告した。これは単に精度が上がったのではなく、「過去に失敗したのと同じアプローチをとらなくなった」ことが主因だという。医療書類レビューのWisedocsはDreamingと同時発表された「Outcomes（評価機能）」を組み合わせて書類レビュー時間を50%削減した。

数値の解釈に注意

「タスク完了率6倍」はリサーチプレビュー段階の社内テスト報告値だ。本番環境での再現性は使い方・タスクの種類・メモリ設計によって大きく異なる。

セキュリティリスク — 記憶ノートへの「毒入れ」

Dreamingは新しいリスクも生む。記憶ノートは「長期的な影響力チャネル」になる。もし悪意あるセッション（プロンプトインジェクション攻撃など）が虚偽情報をセッションログに埋め込んだ場合、Dreamingがそれを信頼できる知見として統合してしまうリスクがある。AI ガバナンス整備支援の枠組みで対処するのが現実的だ。

Dreamingのアウトプットは自動採用しない — 必ず人間がレビューしてから次のセッションに適用する
セッションログのフィルタリング — Dreamingに渡すセッションを選別し、信頼性の低いセッションを除外する
3ストア構成で権限を分離 — 読み取り専用の組織ノート・プロジェクトノート・読み書き可能な作業ノートの3層構造にし、上位ノートへの昇格は人間がレビュー後に実施

Dreaming・Outcomes・マルチエージェント連携の3点セット

Dreaming（ドリーミング）	過去のセッションを振り返り、記憶ノートを最適化する	定型業務を繰り返すエージェント、長期稼働エージェント
Outcomes（評価機能）	エージェントの成果物をAIが採点し、基準未達なら自動再実行	品質基準のある書類生成、コードレビュー、報告書作成
マルチエージェント連携	リードエージェントが複数の専門エージェントに並列でサブタスクを委託	大規模コードベース解析、多拠点データ収集、並列調査

まとめ — Dreamingを3行で理解する

①AIエージェントがセッションとセッションの間に、過去の失敗・成功パターンをプレイブックとして自律的に整理する。②モデルの重みは一切変わらない。出力はMarkdownなので人間が完全に読める・審査できる。③使い方は「セッションを溜める → Dreaming実行 → 人間レビュー → 採用 → 次のセッションへ反映」の繰り返しだ。

2026年5月現在、Dreams APIはリサーチプレビューとして限定公開中だ（申請: claude.com/form/claude-managed-agents）。Claudeのエージェント機能を業務に導入したい場合は、AIコーチング 1on1 伴走支援やAX診断サービスも活用いただきたい。