Agentforceでエージェントを作成・テストする方法 ― Salesforce実践ガイド

SalesforceのAgentforceで、AIエージェントの作成からテストスイート実行までをSandbox環境で実践した記録。Topics・Actions・Knowledgeの3要素、ウィザードによるノーコード構築、Testing Centerのテスト自動生成と三層評価まで画面付きで整理。ナレッジ未設定でもルーティングは正しく動き、応答品質はナレッジ整備に強く依存することがテストから判明した。

Agentforce の基本構造を理解する

Agentforce は 2024 年 9 月の Dreamforce で発表された、Salesforce 上で自律的な AI エージェントを構築・運用するためのプラットフォームです。「Einstein Copilot」を前身とする後継系として位置づけられ、より自律的に業務を完結させるエージェント機能を提供します。

Agentforce で構築するエージェントは、以下の 3 要素で構成されています。

  • Topics:エージェントが対応する話題の分類。「General FAQ」「Returns」「Order Status」など、業務ドメインごとに定義
  • Actions:エージェントが Topic に応じて実行できる動作。Flow / Apex / Prompt Template / Knowledge 検索など、Salesforce プラットフォームの既存資産と連携
  • Knowledge:Salesforce Knowledge オブジェクトに格納されたナレッジ記事や、Data Cloud で連携した外部ナレッジを RAG として参照

エージェント開発の本質は「適切な Topic の設計」「Topic に紐づく Actions の定義」「参照させる Knowledge の整備」の 3 つです。本記事では作成からテストまでをノーコードの Builder / Studio で実践します。

前提環境

項目
エディションEnterprise Edition
Sandbox 種別Developer Sandbox
ライセンスAgentforce Service Agent Builder(10,000 conversations)

Agentforce の利用にはエディションごとに固有のライセンス・有効化作業が必要です。本記事の検証時点では Service Agent 用の検証ライセンスを利用しており、Sales / Sales Coach / SDR / Personal Shopper など他のテンプレートを使う場合は別途ライセンスが付与されている必要があります。最新の利用条件は所属組織の Salesforce 管理者にご確認ください

1. エージェントの作成

1-1. Agentforce Studio へのアクセス

Agentforce Studio には以下の方法でアクセスできます。

  • 設定画面:クイック検索で「Agentforce エージェント」を検索
  • Agentforce Studio アプリ:アプリケーションランチャーから起動
Agentforce Studio エージェント一覧

1-2. 新しいエージェントの作成ウィザード

New Agent」をクリックすると、4 ステップのウィザードが開始します。

ステップ 1:テンプレート選択

利用可能な主要テンプレート:

  • Service Agent:カスタマーサービス・問い合わせ対応向け
  • Employee Agent:社内ヘルプデスク・ナレッジ参照向け
  • SDR Agent:営業開発・リード対応向け

テンプレートを選ぶと、その業務に必要な Topic と Actions が初期構成として提供されます。Service Agent を選ぶと FAQ 応答とエスカレーションの Topic 群が含まれた状態でスタートできます。

ステップ 2:トピック選択

エージェントが対応する Topic を選択します。テンプレートに含まれる「General FAQ」が自動で追加されます。他のトピックを追加・削除することで、業務スコープを調整できます。

ステップ 3:カスタマイズ

  • エージェント名(例:簡易ケースサポート)
  • API 参照名(例:Simple_Case_Support)
  • 説明:エージェントの位置づけを記述
  • ロール説明:エージェントが演じるロール(プロンプトに反映される)
  • 会社名:応答時に参照される社名

とくに「ロール説明」は応答の質に直結するため、業務文脈を具体的に記述するのがコツです。「あなたはカスタマーサポート担当者として、顧客の問い合わせに丁寧に応答してください。判断に迷う場合はライブエージェントにエスカレーションを推奨してください」といった具合に役割と境界を明示します。

エージェント詳細設定画面

ステップ 4:データソース

ナレッジ記事や FAQ などのデータソースを選択します(省略可能)。本格運用ではここで Salesforce KnowledgeData Cloud、または外部 RAG ソースを指定します。検証時はスキップしても次に進めます。

1-3. エージェントの完成

「作成」をクリックすると、Agentforce Builder に遷移し、エージェントの詳細設定画面が表示されます。ここから Topics、Actions、Knowledge の追加・削除や、エージェント活性化(Activate)の操作ができます。

注意点:UI 操作では「+ 新しいエージェント」ボタンが新しいタブで開く場合があります。また、組織の Agentforce トグルスイッチを誤ってオフにすると全エージェントが非表示になります。Sandbox での検証作業中の事故予防のため、トグル操作は管理者と相談の上で行ってください。

2. テストスイートの作成と実行(Agentforce Testing Center)

Agentforce Studio の「テスト」タブから、エージェントのテストスイートを作成・実行できます。本機能は本記事執筆時点でベータです。Agentforce Testing Center は、エージェントの応答品質を体系的に検証するための仕組みで、本番リリース前の品質確認に使えます。

2-1. テストスイートの作成

「新規スイート」をクリックして、ウィザードを開始します。

基本情報

項目設定例
テスト名簡易ケースサポート基本テスト
エージェント簡易ケースサポート – 1
説明基本動作テスト。FAQ 回答、トピック選択、エラーハンドリングを検証
テストスイート画面(作成前)

テスト条件(オプション)

  • 会話履歴を含める:特定の会話文脈からテストを開始
  • コンテキスト変数を含める:テスト用の変数を設定

基本テストではスキップ可能です。複雑な会話シナリオ(多段の Slot Filling など)を試す場合に活用します。

テストデータの作成方法

方法説明
CSV アップロードテンプレート CSV にケースを記入してアップロード(既存の手動テストケースを取り込む用途)
トピック/アクションに基づく自動生成(推奨)AI がトピック定義から自動でテストケースを生成
ナレッジに基づく自動生成ナレッジベース記事の内容からテストケースを生成(Knowledge 連携時)

「トピックとアクションに基づいてテストケースを生成」を選択すると、以下を指定できます。

  • テストケースの数(例:5)
  • テストケースの説明(プロンプトとして使われる)
  • 対象トピック(チェックボックスで複数選択)

評価基準(Evaluations)

Default Evaluations(自動適用)

評価項目説明
Response Evaluationエージェントの応答が期待値と一致するか
Topic Evaluation正しい Topic を選択したか
Action Evaluation正しい Action を選択したか

Response Quality Evaluations(オプション)

評価項目説明
Completeness応答に必要な情報が含まれているか
Coherence応答が読みやすく文法的に正しいか
Conciseness応答が簡潔で正確か
Latency応答生成にかかった時間(ミリ秒)
評価基準設定ダイアログ

2-2. 自動生成されたテストケース

「テストケースを生成」をクリックすると、AI が Topic 定義に基づいてテストケースを自動生成します。生成されるテストケースの構成は以下のとおりです。

  • Utterance:ユーザーの発話(例:"What is your return policy?")
  • Expected Topic:期待する Topic(例:General FAQ)
  • Expected Actions:期待する Action(例:AnswerQuestionsWithKnowledge)
  • Expected Response:期待する応答内容
テスト実行結果

2-3. テストの実行

実行」ボタンをクリックすると、各テストケースの Utterance がエージェントに送信され、「Agent Response」列に実際の応答が記録されます。

2-4. 評価の実行と結果分析

評価」ボタンで評価基準を選択し、各テストケースの結果を評価します。

本検証でのテスト結果

#UtteranceResponse EvalAction EvalTopic Eval
1What is your return policy?FailPassFail
2What features does your latest product have?FailPassFail
3How do I fix a connectivity issue?FailPassFail
4What is your policy on data privacy?FailPassFail
5How do I request a product demo?FailPassFail

結果分析

  • Action Evaluation:全 Pass ── エージェントは AnswerQuestionsWithKnowledge アクションを正しく選択した
  • Response / Topic Evaluation:全 Fail ── ナレッジベースが未設定のため、期待する回答を生成できず、ライブエージェントへのエスカレーションを提案する応答に留まった

ポイント:ナレッジベースが空の状態でも、エージェントは適切にフォールバック動作(エスカレーション提案)を行いました。Action Evaluation が全て Pass であることから、エージェントの ルーティングロジックは正しく機能 していることが確認できます。応答品質を上げるには、次のステップとしてナレッジベースの整備が必要であることが、テスト結果から明確に判明しました。

評価ダイアログ

本検証で得られた知見

  1. テストの自動生成が強力:Topic 定義から AI がテストケースを自動生成。手動でのテストケース作成の手間を大幅に削減できる
  2. ナレッジベースの重要性:エージェントの回答品質はナレッジベースの充実度に強く依存。テスト前にナレッジ記事の整備が必要
  3. Action / Topic / Response の三層評価:エージェントの問題切り分けを「ルーティング」「Topic 選択」「応答生成」の 3 段階で分解できる
  4. ベータ機能としての注意:Agentforce Testing Center はベータ機能のため、UI ・評価基準・出力フォーマットが今後変更される可能性がある

本番展開前のチェックリスト

  • ☐ Knowledge 記事の本番データを Sandbox に同期し、Topic / Action / Response 三層評価が全て Pass する状態を確認
  • ☐ 「ロール説明」プロンプトに業務固有のガードレール(出してはいけない情報・推測禁止・必ずエスカレートすべきケース)を追記
  • ☐ Latency(応答時間)が業務要件を満たすか測定
  • ☐ エスカレーション先(ライブエージェント/チャネル)が正しく設定されているか
  • ☐ 監査ログ(Audit Trail)の保存ポリシーを確認
  • ☐ Sandbox → 本番への展開時に Data Cloud / 外部 API への接続情報を再構成
  • ☐ コスト管理:会話数ベースのライセンス消費が想定範囲内かをダッシュボードで監視

よくある質問(FAQ)

Q. Agentforce と Einstein Copilot の違いは?

A. Einstein Copilot は Salesforce ユーザーの操作補助を目的とする AI アシスタントで、ユーザーの指示を受けて Salesforce 内の操作を支援する位置づけでした。Agentforce はその発展形で、より自律的に 業務を完結させる AI エージェント を構築・運用する枠組みです。Topic / Action ベースの構造で、外部ユーザー(顧客等)に向けたエージェントを公開できる点が大きな違いです。

Q. ナレッジベースが無くてもエージェントは作れますか?

A. 構造としては作成可能ですが、本記事のテスト結果が示すとおり、ナレッジが無いと 具体的な回答は生成できず、エスカレーション提案で終わる ことが多くなります。実用するには Salesforce Knowledge 記事の整備、または Data Cloud 経由での外部ナレッジ連携が事実上必須です。

Q. Sandbox で作ったエージェントを本番に展開する方法は?

A. Salesforce の標準的なメタデータ展開ツール(Change Set / SFDX / Salesforce CLI)を使ってエージェントの構成を本番に移行できます。ただし、Topic / Action / Knowledge の参照先(接続情報・URL ・認証情報)は環境ごとに再構成が必要です。Agentforce 固有のメタデータタイプの扱いは Salesforce 公式ドキュメント をご確認ください。

Q. 日本語のエージェントは作れますか?

A. 作成可能です。Topic 名・Action 名・ロール説明・Knowledge 記事をすべて日本語で記述すれば、応答も日本語で返ります。ただし応答品質はモデル世代と Knowledge の質に依存するため、初期検証時には英語版と比較しながら調整するのが安全です。

まとめ

操作推奨方法
エージェント作成Agentforce Builder UI(4 ステップウィザード)
テスト作成・実行Agentforce Testing Center(ベータ)
本番展開Sandbox で全評価が Pass した状態を確認後、メタデータ展開

Agentforce は、Topic / Action / Knowledge の 3 要素を整えれば、ノーコードで自律的な AI エージェントを構築できるプラットフォームです。Builder / Studio / Testing Center を組み合わせて、品質を担保しながら段階的に本番運用に進めるのが現実的なアプローチです。

はてなベースでは、Agentforce / Salesforce Flow / Data Cloud 連携を含むエンタープライズ AI エージェント実装の伴走支援を提供しています。Sandbox 検証から本番運用、ガバナンス整備までを一気通貫でサポートします。