# ガードレール

<figure><img src="/files/UwBiHkU2GtIksnNmSNOM" alt=""><figcaption></figcaption></figure>

### **ガードレール機能とは？** <a href="#whats-guardrail" id="whats-guardrail"></a>

ガードレールは、ユーザーが入力したメッセージに有害なコンテンツや不適切なコンテンツが含まれているかどうかを事前に確認し、ブロックするセキュリティ機能です。問題が検出されたコンテンツはLLMに送信されず、より安全で信頼できるサービス環境を提供します。

### ガードレールタイプ <a href="#guardrail-type" id="guardrail-type"></a>

Alliでは、次の3種類のガードレールを提供しています。

**1. キーワードベースのガードレール**

事前に登録した**特定の単語またはフレーズ**に基づいてコンテンツを検出します。

* 活用例：特定の単語、禁止語、内部政策上使用不可表現など
* キーワードはデフォルトでは提供されません。新しいキーワードを追加するには、新しいガードレールを作成する必要があります。

**2. 正規表現ベースのガードレール**

正規表現を使用して**特定の形式の入力値**を検出します。

* 利用例：電話番号、住民登録番号、特定のコードパターンなど
* Alliでデフォルトとして提供されている正規表現は変更できず、有効/無効の調整のみが可能です。
* 追加の編集や新しいパターンが必要な場合は、新しいガードレールを作成する必要があります。

**3. AIベースのガードレール**

入力されたコンテンツを**AIが自動分析**して有害かどうかを判断します。カテゴリ別に**検証強度設定**が可能です。

**カテゴリー**

* 暴力
* 性的
* 自傷行為
* ヘイト

AIベースのガードレールは新規作成が不可能で、組み込みの項目のみを調整および編集できます。

### キーワードベースのガードレールを追加する <a href="#keywords" id="keywords"></a>

<figure><img src="/files/euTuGNalwWN5BKxnlSCp" alt=""><figcaption></figcaption></figure>

右上の+追加ボタンをクリックしてキーワードベースを選択します。

<figure><img src="/files/ieaBAtes61SQCC3YESpY" alt=""><figcaption></figcaption></figure>

①ガードレールをON。

有効にすると、プロジェクト内のLLMを活用するアプリに対応するガードレールが適用されます。

②名前

ガードレールの名前を入力します。

③キーワード

ブロックするキーワードを登録します。複数のキーワードを同時に登録することもできます。登録できるキーワードの数に制限はありません。

④説明(オプション)

ガードレールの説明を入力します。<br>

<figure><img src="/files/evLpALfhZuWTaotATNyS" alt=""><figcaption><p>Conversationアプリ利用時にブロックされた場合の挙動</p></figcaption></figure>

<figure><img src="/files/MH4oQL3NdeyRtUuLiTWF" alt=""><figcaption></figcaption></figure>

実際の動作はアプリのテストとアプリの実行時に確認できます。事前に指定したキーワードが検出されると、送信ボタンが無効になり、警告メッセージが表示され、ユーザーは新しいメッセージを入力するように指示されます。

### 正規表現ベースのガードレールの修正と追加方法 <a href="#regex" id="regex"></a>

**デフォルトで提供される正規表現の編集**

<figure><img src="/files/5JiHq2oa2FQxKS5kGarq" alt=""><figcaption></figcaption></figure>

Alliでは、合計3つの正規表現が提供されます。組み込みの正規表現は、有効または無効のいずれかを選択できます。

1. 組み込みの特定の正規表現を有効にするには、\[編集]ボタンをクリックします。

<figure><img src="/files/ZWayvwN1flWTm7AzVoLD" alt=""><figcaption></figcaption></figure>

2. ガードレールを有効にするかどうかを選択したら、\[OK]ボタンを押して設定をプロジェクトに適用します。

### **正規表現を追加する**

<figure><img src="/files/T5s3O7kOm4qZRurowkQo" alt=""><figcaption></figcaption></figure>

1. 右上の+追加ボタンをクリックして正規表現ベースを選択します。

<figure><img src="/files/hMVq8AYppVxqqnNHM723" alt=""><figcaption></figcaption></figure>

①ガードレールをON。

有効にすると、プロジェクト内のLLMを活用するアプリに対応するガードレールが適用されます。

②名前

ガードレールの名前を入力します。

③正規表現

[正規表現検証サービス](https://www.regextester.com/)などを活用し、社内で活用したい正規表現を作成します

④説明(オプション)

ガードレールの説明を入力します。

***

**正規表現の使用例**

正規表現（Regex）は、特定のパターンの文字列を検出またはフィルタリングするために使用されます。ガードレール設定時に入力されたメッセージが正規表現パターンと一致する場合は、該当するルールが適用されます。

**1. 特定の単語が含まれているかどうかを確認する**

<a class="button secondary">コピー</a>

```
禁止ワード
```

* メッセージに`禁止ワード`という文字列が含まれていることを検出します。

**2. 複数の単語のいずれかが含まれている場合**

<a class="button secondary">コピー</a>

```
(禁止ワード1|禁止ワード2|禁止ワード3)
```

* `禁止ワード1`、、、`禁止ワード2`の`禁止ワード3`いずれかが含まれていると検出します。

**3.大文字と小文字を区別せずに検出**

<a class="button secondary">コピー</a>

```
(?i)badword
```

* `badword`、、、`BadWord`など`BADWORD`大文字と小文字に関係なく検出します。

**4. 数値パターンの検出（例：電話番号）**

<a class="button secondary">コピー</a>

```
\d{3}-\d{4}-\d{4}
```

* `090-1234-5678`形式の電話番号を検出します。

**5. メールアドレスの検出**

<a class="button secondary">コピー</a>

```
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
```

* 一般的なメールアドレス形式を検出します。

**6. 特定の文章で始まる場合**

<a class="button secondary">コピー</a>

```
^お問い合わせしたい
```

* メッセージが`お問い合わせしたい`がで始まる場合にのみ検出します。

**7. 特定の文章で終わる場合**

<a class="button secondary">コピー</a>

```
電話番号を知りたい$
```

* メッセージ`電話番号を知りたい`がで終わる場合にのみ検出します。

**正規表現ベースの注意事項**

* 正規表現は**コンテキストを理解せずにパターンベースでのみ動作**します。
* 過度に包括的なパターンを使用すると、通常のメッセージも一緒に検出される可能性があるため、注意が必要です。
* 正規表現は非常に多様なパターンを表現できるため、必要に応じて正規表現の例示資料を探すことをお勧めします。

### **AIベースのガードレールを修正する方法** <a href="#aibase" id="aibase"></a>

AIベースのガードレールは新規作成できず、組み込みの4つのカテゴリの設定を変更できます。

<figure><img src="/files/dLddHN2W6FXR1mN0kcu8" alt=""><figcaption></figcaption></figure>

編集したいAIベースのガードレールを選択します。

<figure><img src="/files/s0nsTVjHi7BwD35SLtQ5" alt=""><figcaption></figcaption></figure>

①ガードレールをON

有効にすると、プロジェクト内のLLMを活用するアプリに対応するガードレールが適用されます。

②検証レベル

検証レベルは、低／中／高の中から選択することができ、これはＡＩ判断基準を使用します。

事前に設定したAIベースのガードレールの検証レベルに応じて、AIがメッセージ内容を分析してポリシー違反の可能性があると判断した場合、メッセージ送信ボタンが無効になり、警告メッセージが表示されます。この場合、ユーザーは新しいメッセージを入力するように指示されます。 **AIベースの評価の特性上、前後の文脈や単語の組み合わせ、メモリによって判断結果が変わることがあります。したがって、結果を明確に二分法的に区別したり、100％の精度を保証することはできないことに必ず注意してください。**

### **フィルタの照会** <a href="#filtering" id="filtering"></a>

<figure><img src="/files/drvg4awIvbfU5gmhesS6" alt=""><figcaption></figcaption></figure>

1. フィルタ機能により、ガードレールを項目別に区切って確認できます。
2. また、プロジェクト内に反映されたガードレールに適用するか未適用かを区別して確認することもできます。

### **ガードレール機能が利用可能な範囲** <a href="#available" id="available"></a>

**ガードレールは、LLMにメッセージが配信される時点でコンテンツを検出してフィルタリングする方法で動作します。したがって、すべてのノードで適用されるのではなく、実際にLLMを呼び出す特定のノードでのみ使用されます。**

たとえば、次のような場合にガードレールが適用されます。

* 回答の生成 ノードユーザーがメッセージを入力し、そのメッセージをモデルに送信して回答を生成する場合
* 質問するノード+ LLM実行ノード質問するノードからユーザー入力を受け取り、その内容に基づいてLLM実行ノードを介してモデルを呼び出す場合
* ディープリサーチ ユーザーがメッセージを入力すると、内部的に LLM 呼び出しが発生するリサーチおよび分析操作

**逆に、LLM 呼び出しが発生しないノードではガードレールが動作しないことに注意してください。**

<figure><img src="/files/ZqpmjCWggSlpDxzIAS6r" alt=""><figcaption><p>回答生成ノード</p></figcaption></figure>

<figure><img src="/files/TAfNQ2YYsUr9sZosxvBi" alt=""><figcaption><p>質問応答ノード+LLM実行ノード</p></figcaption></figure>

<figure><img src="/files/97YkRUH5wsmaK9ECbOKu" alt=""><figcaption><p>Deep Researchノード</p></figcaption></figure>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.allganize.ai/alli-llm-app-market/project-settings/sercurity/gurdrail.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
