# ドキュメント検索のモデルのトレーニング

ドキュメント検索クエリの精度を向上させるために、データをアップロードして、モデルをトレーニングさせることが可能です。ナレッジベースでのドキュメント検索の利用方法については[**こちらのユーザーガイド**](https://docs.allganize.ai/alli-userguide/knowledge-base/document/document)をご参照ください。

## モデルをトレーニングする理由 <a href="#why-train-your-model" id="why-train-your-model"></a>

AlliのDocument Searchは、事前にトレーニングされたAIモデルを使って文書から情報を抽出する仕組みになっています。 Alliは非常に精度が高いのですが、高性能なAIモデルを開発するには、十分な量の関連データでモデルをトレーニングすることが重要です。 これは、最初にトレーニングデータを追加し、その後モデルを再トレーニングすることで行われます。 初期学習が完了したら、テストデータを与えてモデルの精度を検証する必要があります。 このステップでは、モデルがお客様の特定のニーズに対して、正確で適切な答えを出すことができることを確認します。 モデルの性能が満足できない場合は、追加データによる再トレーニングや、以前のモデルに戻すことが必要です。 本資料では、その方法について説明します：

* モデルのバージョンを管理する
* トレーニングデータの追加
* そのデータを活用するために、モデルの再トレーニングを行う
* テストデータを追加して精度メトリクスを表示する

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2022/01/Training-Document-Search-1.png?resize=767%2C396&#x26;ssl=1" alt=""><figcaption><p>トレーニング前</p></figcaption></figure>

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2022/01/Training-Document-Search-2.png?resize=768%2C397&#x26;ssl=1" alt=""><figcaption><p>トレーニングの後</p></figcaption></figure>

トレーニングに用いるデータを複数追加することで、さらに良い結果を得ることが可能です。

## モデルの管理方法について <a href="#how-to-train-your-model" id="how-to-train-your-model"></a>

トレーニングデータ、モデルのバージョン、テストデータを管理するには、「ナレッジベース」→「ドキュメント」→「歯車マーク」を開いてください。

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image.png?resize=800%2C452&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

## モデルのバージョンを管理する

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-1.png?resize=800%2C454&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

ここでは、モデルのバージョン名を変更したり、必要に応じて説明を付けたり、回答精度や文書のヒット精度の指標を表示したりすることができます。 それらの指標は、**Test Dataを**追加することで入力されます。

## トレーニングデータの管理

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-2.png?resize=800%2C453&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-3.png?resize=800%2C453&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

ここでは、トレーニングデータを手動で入力したり、既存のエントリーを修正/削除したりすることができます。 トレーニングデータのアップロードをクリックすると、トレーニングデータを一括でアップロードすることもできます。 質問と文書のペアは一意であるため、同じ質問と文書のタイトルを持つ2つのエントリーを持つことができないことに留意してください。

▼管理画面より手動で入力する場合

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-4.png?resize=800%2C452&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

1. トレーニングデータ用の質問を入力する
2. 適切な回答が存在する文書を提示すること
3. AIにその文書を検索させ、答えの可能性を探る
4. 答えを選んでください
5. 今回のトレーニングデータを提出した後に、もう一つトレーニングデータを追加する
6. トレーニングデータの追加を確定またはキャンセルする

▼トレーニングデータをアップロードする場合

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-5.png?resize=800%2C453&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

アップロードするファイルには、1列目に「質問」、2列目に「文書名」、3列目に「回答」のラベルを付けてください。 “質問 “と “文書タイトル “は必須項目です。 正しいフォーマットのサンプルファイルは、「トレーニングデータのアップロード」ウィンドウからダウンロードすることもできます。 ファイルをアップロードすると、Alliは失敗した行を報告します。 (異なる行で失敗しても、適切にフォーマットされ、重複しない行はすべて追加されます。)

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-6.png?resize=524%2C275&#x26;ssl=1" alt=""><figcaption><p>誤った形式でトレーニングデータをアップロードするとエラーメッセージが表示されます</p></figcaption></figure>

未回答の質問から直接トレーニングデータを追加することもできます。質問内容のみを、トレーニングデータに追加できないことに注意してください。

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-7.png?resize=800%2C428&#x26;ssl=1" alt=""><figcaption><p>トレーニングデータの追加方法</p></figcaption></figure>

トレーニングデータの準備ができたら、**モデルを再トレーニングして**効果を確認する必要があります。 ドキュメントページに戻り、”AIデータの管理” -> “モデルの再調整 “をクリックします。

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-12.png?resize=488%2C155&#x26;ssl=1" alt=""><figcaption><p>トレーニングが実行中であることを示します</p></figcaption></figure>

トレーニング中は、自由に他の機能を利用することが可能です。トレーニングが完了すると、「トレーニング中」のバーが消えます。

モデルのトレーニングが遅いと判断された場合、トレーニング状況の中で文書検索の割り当てリソースがどうなっているかを確認することができます。 さらにリソースが必要な場合は、担当のカスタマーサクセスにご相談ください。

## テストデータの管理

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-8.png?resize=800%2C456&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

ここでは、テストデータを手動で入力したり、既存の項目を修正・削除したりすることができます。 テストデータのアップロードをクリックすると、テストデータを一括でアップロードすることもできます。 質問と文書のペアは一意であるため、同じ質問と文書のタイトルを持つ2つのエントリーを持つことができないことに留意してください。 テストデータは、トレーニングデータで再トレーニングした後に、モデルの性能をベンチマークする方法です。

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-9.png?resize=800%2C454&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

1. テストデータ用の質問を入力する
2. 適切な回答が存在する文書を提示すること
3. AIにその文書を検索させ、答えの可能性を探る
4. 答えを選んでください
5. 今回のテストデータを提出した後に、もう一つテストデータを追加する
6. テストデータの追加を確定またはキャンセルする

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-10.png?resize=800%2C455&#x26;ssl=1" alt=""><figcaption></figcaption></figure>

アップロードされたファイルには、1列目に「質問」、2列目に「文書名」、3列目に「回答」のラベルを付けてください。 “質問 “と “文書タイトル “は必須項目です。 正しいフォーマットのサンプルファイルは、「テストデータのアップロード」ウィンドウからダウンロードすることもできます。 ファイルをアップロードすると、Alliは失敗した行を報告します。 (異なる行で失敗しても、適切にフォーマットされ、重複しない行はすべて追加されます。)

## トレーニング設定 <a href="#training-settings" id="training-settings"></a>

トレーニング設定を変更することが可能です。これらは、\[ドキュメント]ページの設定アイコンをクリックし、\[モデルトレーニング設定]タブにて設定できます。

<figure><img src="https://i0.wp.com/guide.allganize.ai/wp-content/uploads/2023/04/image-11.png?resize=800%2C454&#x26;ssl=1" alt=""><figcaption><p>ドキュメント検索のモデルトレーニング設定について</p></figcaption></figure>

各設定について簡単に説明します。

* **検索時にドキュメント名を反映：**&#x30AA;ンにすると、Alliはドキュメント検索を実行するときにドキュメントのタイトル（ファイル名）を考慮します。
* **ドキュメント名の影響度：**&#x30C9;キュメント検索のドキュメント名の影響度を変更できます。この設定を適用するには、\[検索時にドキュメント名を反映]がオンになっている必要があります。 回答には質問のキーワードが含まれていなくても、微調整されたモデルであれば、その質問や類似の質問に対する回答を持つ特定のドキュメントを識別することができます。 文書のタイトルの重さが重いと、この方法で回答した場合のスコアが変わってきます。
* **ドキュメントごとに抽出する回答候補の最大数：**&#x3053;の設定は、1つのドキュメントから抽出される結果の最大数を決定します。 デフォルトは0、つまり文書ごとの制限はありません。
* **類似した検索結果を除去：**&#x985E;似のドキュメント検索結果がある場合、非表示にすることができます。全ての類似した結果、ハッシュタグが同一の場合の結果、または同じドキュメントから抽出された結果を除去することが可能です。

## ドキュメント検索を最適化するその他の方法 <a href="#more-ways-to-optimize-document-search" id="more-ways-to-optimize-document-search"></a>

検索結果からの顧客フィードバックやクエリトレーニングからのエージェントフィードバックを使用して、ドキュメント検索をさらに改善することもできます。詳細については、以下のユーザーガイドを参照してください。

* [**ユーザーからのフィードバックがドキュメントの検索結果に影響を与えるようにする**](https://docs.allganize.ai/alli-userguide/knowledge-base/customer-feedback-search-results)
* [**エージェント フィードバック機能**](https://docs.allganize.ai/alli-userguide/knowledge-base/agent-feedback-affect-on-search-results)

ドキュメント検索の一般的な説明については、以下のユーザーガイドを参照してください。

* [**ドキュメント機能（機会読解AI）**](https://docs.allganize.ai/alli-userguide/knowledge-base/document/document)
* [**ナレッジベース**](https://docs.allganize.ai/alli-userguide/knowledge-base/knowledge-base)


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.allganize.ai/alliyzgaido/knowledge-base/document/training-document-search.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
