Alliユーザーガイド
  • 入門
    • 初めて使用する(On-boardingガイド)
    • サポートしているブラウザ
    • Alliメインメニューの機能概要
    • プロジェクトの管理
    • マイアカウント
    • 用語集
    • Alli メンテナンス/障害情報
    • What’s New(機能アップデート情報)
  • 会話
    • 会話回答提案を検索
    • ライブチャット時に役立つ機能
    • 会話履歴
    • 会話カテゴリーを分類する
  • スキル
    • キャンペーン(スキル) Dashboard
    • スキルポップアップURL
    • スキルのユーザーターゲティング
    • チャット編集
      • ノード
        • データ連携ノード(ベーシック)
        • エージェント応答ノード
        • 変数の値を設定ノードで計算式を使用する
        • トークンを使用して会話を再開する
        • 変数の値を設定ノード
        • メール送信ノード
        • データ連携ノード(アドバンスド)
        • 条件応答ノード
        • Q&Aから回答ノード
        • 会話・質問応答ノード
        • キャンペーンに移動ノードと移動ポイントノード
        • 入力フォームノード
        • 変数をダウンロードノード
      • スキルの例
        • Zapierを利用してアンケート調査結果を自動生成する
        • (TIPS)チャット編集の便利な機能
        • データ連携ノードでSlackと連携する
        • Zapier 連携
  • ナレッジベース
    • ナレッジベース
    • FAQ
      • Q&A自動生成
      • Q&Aに複数質問を登録する
      • Q&Aへの評価(エンドユーザー画面)
      • Q&A設定
      • 変数を使用したQ&A回答のカスタマイズ
      • Q&Aのアップロード
      • Q&Aの準備
      • Q&Aの編集/閲覧権限を設定する(Q&Aごとの設定、フォルダの活用)
    • ドキュメント
      • アップロードされたドキュメントからの直接回答
      • ドキュメント検索のモデルのトレーニング
      • ドキュメント
      • ドキュメントの自動タグ付け
      • ドキュメントの編集/閲覧権限を設定する(ドキュメントごとの設定、フォルダの活用)
    • Q&A登録候補
      • 類似質問
      • 未回答の質問
    • 検索結果にフィードバックを行う
    • 類語・対義語登録
    • 履歴のダウンロード
    • 自動タグ付け
    • ユーザーフィードバックを検索結果に影響させる
    • ソース
      • HTMLドキュメントに接続する
      • Microsoft OneDrive に接続する
      • Confluenceと連携する
      • Googleドライブに接続する
      • SharePointを接続する
  • ドキュメント(11/5 リリース)
    • ドキュメントを管理する
  • その他
    • 分析
      • 顧客の反応の分析結果
      • 分析
    • 顧客
      • 顧客リスト
    • Alliと雑談会話
  • 設定
    • iOS SDK 連携
    • Android SDK 連携
    • Alli SDKV1実装(JavaScript)
    • Alli SDK V2実装(JavaScript)
    • セキュリティ
      • 2FA(2段階認証)
    • エージェント管理
    • メッセージ設定
    • チャットデザイン設定V1
    • チャットデザイン設定V2
    • サードパーティー連携
      • Azure 認証
      • Slack連携
      • LINE Messenger連携
      • Microsoft Active Directory 連携
      • Facebook Messenger連携
      • LINE WORKS連携
      • Microsoft Teams連携
      • BambooHRとの連携
    • 全般
      • 設定 >全般
      • 自然言語の入力設定
    • 変数
      • ターゲティング設定(ブラックリスト登録)
      • 変数の値を設定ノードで変数を使用する
      • 変数
      • SDK変数(システム変数)
      • 文字列検証機能
      • リスト変数・ファイル変数
  • Alli メンテナンス/障害情報
GitBook提供
LogoLogo
このページ内
  • モデルをトレーニングする理由
  • モデルの管理方法について
  • モデルのバージョンを管理する
  • トレーニングデータの管理
  • テストデータの管理
  • トレーニング設定
  • ドキュメント検索を最適化するその他の方法
PDFとしてエクスポート
  1. ナレッジベース
  2. ドキュメント

ドキュメント検索のモデルのトレーニング

前へアップロードされたドキュメントからの直接回答次へドキュメント

最終更新 9 か月前

ドキュメント検索クエリの精度を向上させるために、データをアップロードして、モデルをトレーニングさせることが可能です。ナレッジベースでのドキュメント検索の利用方法についてはをご参照ください。

モデルをトレーニングする理由

AlliのDocument Searchは、事前にトレーニングされたAIモデルを使って文書から情報を抽出する仕組みになっています。 Alliは非常に精度が高いのですが、高性能なAIモデルを開発するには、十分な量の関連データでモデルをトレーニングすることが重要です。 これは、最初にトレーニングデータを追加し、その後モデルを再トレーニングすることで行われます。 初期学習が完了したら、テストデータを与えてモデルの精度を検証する必要があります。 このステップでは、モデルがお客様の特定のニーズに対して、正確で適切な答えを出すことができることを確認します。 モデルの性能が満足できない場合は、追加データによる再トレーニングや、以前のモデルに戻すことが必要です。 本資料では、その方法について説明します:

  • モデルのバージョンを管理する

  • トレーニングデータの追加

  • そのデータを活用するために、モデルの再トレーニングを行う

  • テストデータを追加して精度メトリクスを表示する

トレーニング前

トレーニングに用いるデータを複数追加することで、さらに良い結果を得ることが可能です。

モデルの管理方法について

トレーニングデータ、モデルのバージョン、テストデータを管理するには、「ナレッジベース」→「ドキュメント」→「歯車マーク」を開いてください。

モデルのバージョンを管理する

ここでは、モデルのバージョン名を変更したり、必要に応じて説明を付けたり、回答精度や文書のヒット精度の指標を表示したりすることができます。 それらの指標は、Test Dataを追加することで入力されます。

トレーニングデータの管理

ここでは、トレーニングデータを手動で入力したり、既存のエントリーを修正/削除したりすることができます。 トレーニングデータのアップロードをクリックすると、トレーニングデータを一括でアップロードすることもできます。 質問と文書のペアは一意であるため、同じ質問と文書のタイトルを持つ2つのエントリーを持つことができないことに留意してください。

▼管理画面より手動で入力する場合

  1. トレーニングデータ用の質問を入力する

  2. 適切な回答が存在する文書を提示すること

  3. AIにその文書を検索させ、答えの可能性を探る

  4. 答えを選んでください

  5. 今回のトレーニングデータを提出した後に、もう一つトレーニングデータを追加する

  6. トレーニングデータの追加を確定またはキャンセルする

▼トレーニングデータをアップロードする場合

アップロードするファイルには、1列目に「質問」、2列目に「文書名」、3列目に「回答」のラベルを付けてください。 “質問 “と “文書タイトル “は必須項目です。 正しいフォーマットのサンプルファイルは、「トレーニングデータのアップロード」ウィンドウからダウンロードすることもできます。 ファイルをアップロードすると、Alliは失敗した行を報告します。 (異なる行で失敗しても、適切にフォーマットされ、重複しない行はすべて追加されます。)

未回答の質問から直接トレーニングデータを追加することもできます。質問内容のみを、トレーニングデータに追加できないことに注意してください。

トレーニングデータの準備ができたら、モデルを再トレーニングして効果を確認する必要があります。 ドキュメントページに戻り、”AIデータの管理” -> “モデルの再調整 “をクリックします。

トレーニング中は、自由に他の機能を利用することが可能です。トレーニングが完了すると、「トレーニング中」のバーが消えます。

モデルのトレーニングが遅いと判断された場合、トレーニング状況の中で文書検索の割り当てリソースがどうなっているかを確認することができます。 さらにリソースが必要な場合は、担当のカスタマーサクセスにご相談ください。

テストデータの管理

ここでは、テストデータを手動で入力したり、既存の項目を修正・削除したりすることができます。 テストデータのアップロードをクリックすると、テストデータを一括でアップロードすることもできます。 質問と文書のペアは一意であるため、同じ質問と文書のタイトルを持つ2つのエントリーを持つことができないことに留意してください。 テストデータは、トレーニングデータで再トレーニングした後に、モデルの性能をベンチマークする方法です。

  1. テストデータ用の質問を入力する

  2. 適切な回答が存在する文書を提示すること

  3. AIにその文書を検索させ、答えの可能性を探る

  4. 答えを選んでください

  5. 今回のテストデータを提出した後に、もう一つテストデータを追加する

  6. テストデータの追加を確定またはキャンセルする

アップロードされたファイルには、1列目に「質問」、2列目に「文書名」、3列目に「回答」のラベルを付けてください。 “質問 “と “文書タイトル “は必須項目です。 正しいフォーマットのサンプルファイルは、「テストデータのアップロード」ウィンドウからダウンロードすることもできます。 ファイルをアップロードすると、Alliは失敗した行を報告します。 (異なる行で失敗しても、適切にフォーマットされ、重複しない行はすべて追加されます。)

トレーニング設定

トレーニング設定を変更することが可能です。これらは、[ドキュメント]ページの設定アイコンをクリックし、[モデルトレーニング設定]タブにて設定できます。

各設定について簡単に説明します。

  • 検索時にドキュメント名を反映:オンにすると、Alliはドキュメント検索を実行するときにドキュメントのタイトル(ファイル名)を考慮します。

  • ドキュメント名の影響度:ドキュメント検索のドキュメント名の影響度を変更できます。この設定を適用するには、[検索時にドキュメント名を反映]がオンになっている必要があります。 回答には質問のキーワードが含まれていなくても、微調整されたモデルであれば、その質問や類似の質問に対する回答を持つ特定のドキュメントを識別することができます。 文書のタイトルの重さが重いと、この方法で回答した場合のスコアが変わってきます。

  • ドキュメントごとに抽出する回答候補の最大数:この設定は、1つのドキュメントから抽出される結果の最大数を決定します。 デフォルトは0、つまり文書ごとの制限はありません。

  • 類似した検索結果を除去:類似のドキュメント検索結果がある場合、非表示にすることができます。全ての類似した結果、ハッシュタグが同一の場合の結果、または同じドキュメントから抽出された結果を除去することが可能です。

ドキュメント検索を最適化するその他の方法

検索結果からの顧客フィードバックやクエリトレーニングからのエージェントフィードバックを使用して、ドキュメント検索をさらに改善することもできます。詳細については、以下のユーザーガイドを参照してください。

ドキュメント検索の一般的な説明については、以下のユーザーガイドを参照してください。

トレーニングの後
誤った形式でトレーニングデータをアップロードするとエラーメッセージが表示されます
トレーニングデータの追加方法
トレーニングが実行中であることを示します
ドキュメント検索のモデルトレーニング設定について

ユーザーからのフィードバックがドキュメントの検索結果に影響を与えるようにする
エージェント フィードバック機能
ドキュメント機能(機会読解AI)
ナレッジベース
こちらのユーザーガイド