> For the complete documentation index, see [llms.txt](https://docs.allganize.ai/alli-llm-app-market/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.allganize.ai/alli-llm-app-market/manual/app-management/conversation/generative-answer/multi-modal.md). # 回答生成ノードでマルチモーダルオプションを使用する回答生成ノードから、画像・ファイル・音声の分析はもちろん、画像やファイルの生成機能まで余すことなく活用できます。 \ アプリ内の各ノードごとに必要なツールやモデルを柔軟に組み合わせることができ、単一の会話フローの中で、ドキュメント・FAQ・WebベースのRAGエージェントの実行から、業務に欠かせない画像・ファイルの分析や成果物の生成までをスムーズに行えます。 *** ## はじめに * **この機能の概念** マルチモーダルオプションは「分析」と「生成」の2つのカテゴリで構成されます。分析ではファイル・画像・オーディオを会話に取り込んでモデルが処理し、生成ではモデルがファイルや画像を作成します。各ノードで使用するツールとモデルを柔軟に組み合わせることで、単一の会話フロー内で多様なタスクを実行できます。 {% hint style="warning" %} 現在、複数の画像および複数のファイルのアップロードは、Alli Works画面のみでサポートされており、プレビュー画面（SDK画面）では対応していません。プレビュー画面ではファイル添付アイコンが表示されず、マルチモーダル機能を正常にテストすることができません。 {% endhint %} *** ## 操作方法各メニューの操作方法を説明します。 ### ノードの設定方法 conversation appのフロー内でマルチモーダルオプションを有効にします。

* **回答生成ノードをクリック** conversation appのフロー内で、設定対象の回答生成ノードをクリックします。 * **ベースモデルの選択**\ 使用するベースモデルを選択します。 * **エージェントの選択** エージェントとして「Advanced RAG(beta)」か「Advanced RAG」を選択します。 * **検索ソースの選択** 1つ以上の検索ソースを選択します。 * **マルチモーダルオプションの有効化** 必要なマルチモーダルオプションをONに切り替えます。

{% hint style="info" %} エージェントで「Advanced RAG(beta)」か「Advanced RAG」を選択することで、マルチモーダルオプションの設定項目が表示されます。検索ソースは1つ以上の選択が必須です。 {% endhint %} ### 分析ツールファイル・画像・オーディオを会話内に取り込み、モデルによる分析を実行できます。 * **ファイル分析**\ 有効にすると、会話内でファイルをアップロードしてモデルによる分析が可能になります。無効（OFF）の場合、会話内でファイルを添付することはできません。\ 最大5件・合計100MBまでアップロード可能です。\ 対応拡張子：txt / docx / xlsx / pdf / csv / hwpx / pptx

* **画像分析** 有効にすると、会話内で画像をアップロードしてモデルによる分析が可能になります。無効（OFF）の場合、画像を添付することはできません。\ 最大5枚・合計50MBまでアップロード可能です。\ 対応拡張子：jpeg / jpg / png

* **オーディオ分析** 有効にすると、会話内でオーディオファイルをアップロードしてモデルによる分析が可能になります。無効（OFF）の場合、オーディオを添付することはできません。\ 最大5件・合計100MBまでアップロード可能です。\ 対応拡張子：mp3 / wav / mpga / m4a

{% hint style="warning" %} オーディオ分析は1時間未満のファイルを推奨します。1時間以上のファイルの場合、内容の省略等が発生する場合があります。 {% endhint %} ### 生成ツール会話内でモデルによるファイルまたは画像の生成を行えます。 * **ファイル生成** 有効にすると、会話中の指示に基づいてファイルを生成できます。無効（OFF）の場合、会話内でファイル生成を要求するとエージェントは「現在、ファイル生成はできません」という案内メッセージを表示します。\ 対応拡張子：pdf / xlsx / docx / pptx

* **画像生成** 有効にすると、会話中の指示に基づいて画像を生成できます。無効（OFF）の場合、会話内で画像生成を要求するとエージェントは「現在、画像生成はできません」という案内メッセージを表示します。

{% hint style="warning" %} 現時点では画像編集機能は提供していません。今後、生成した画像およびアップロードした画像を編集・再生成できる機能の提供を予定しています。 {% endhint %} ### 消費クレジットの確認使用されたクレジットをプロジェクト設定の請求情報から確認できます。 * **確認手順** プロジェクト設定＞請求情報＞使用量＞詳細の「回答生成」カテゴリーで確認できます。

### 会話中のファイルアップロード方法画像・ファイル・オーディオを会話に添付する方法を説明します。 * ```

``` * ```

``` * **添付ファイルボタンから送信** 画面右下の添付ファイルボタンから「チャットにアップロード」を選択し、ファイルを選択してチャットと一緒に送信します。ドラッグ＆ドロップやコピー＆貼り付けにも対応しています。\ 各タイプのアップロード上限：画像（最大50MB・5件）／ファイル（最大100MB・5件）／オーディオ（最大100MB・5件） * **アップロード方法による違い** シェアドキュメント・パーソナルドキュメント・ドキュメントをアップロードボタンから登録したドキュメントは、モデルが回答を作成する際の参考資料として継続的に利用されます。一方、会話中（チャット）にアップロードしたファイルは、その会話内でのみ一時的に使用され、パーソナルドキュメントやシェアドキュメントには登録されません。 {% hint style="warning" %} 会話中にアップロードしたファイルはRAG（検索による回答）の対象にはなりません。 {% endhint %}

{% hint style="warning" %} **「チャットにアップロード」ボタンがグレーアウトしている場合のよくある原因と対応方法について：**\ \ \&#xNAN;**■よくある原因**\ アプリの設定で、特定のフォルダやドキュメントが検索ソースとして指定されている場合、\ ユーザーによるファイルアップロードは無効化され、「チャットにアップロード」ボタンがグレーアウトします。（クリップボードからの貼り付けも実行できません）\ \ \&#xNAN;**■対応方法について**\ 以下を参考に、ドキュメントソース指定（フォルダ指定等）を解除した上でお試しください。\ 1\. チャット画面の「ドキュメントから検索」ボタンをクリック\ 2\. 表示される画面で歯車アイコン（設定）をクリック\ 3\. フォルダまたはドキュメントのソース指定を解除する\ \ 上記設定を解除すると、「チャットにアップロード」が利用可能になります。\ ※ソース解除方法の詳細は、[こちらのガイドページ](https://docs.allganize.ai/alli-llm-app-market/app-management/for_user/alli-works-new-ui)の「検索範囲を指定して実行する」をご参照ください {% endhint %} *** ## この機能の注意点 ### プレビュー機能の非対応 {% hint style="warning" %} 現在、複数の画像および複数のファイルのアップロードは、Alli Works画面とテストのみでサポートされており、プレビュー画面（SDK画面）では対応していません。\ そのため、プレビュー（SDK画面）ではファイル添付アイコンが表示されず、マルチモーダル機能を正常にテストすることができません。\ 本機能を確認する場合は、以下の手順に従ってテストを進めてください。 \[1]まず、アクセスリスト「全てのメンバーが閲覧できるようにする」をOFFにし、自身または自身が所属しているグループで閲覧できるようにアクセスリストを調整した上で、アプリを公開します。\ \ \[2]次に、テストを実施します。\ \ \[3]テストが完了したら、アクセスリストを調整し、アプリを再公開します。 {% endhint %}

### クレジットに関する注意事項 {% hint style="warning" %} 本ツールでは、設定されているLLMモデルのトークン上限内で、これまでの会話内容に加え、アップロードしたファイル・オーディオ・画像をまとめて保持します。\ 質問を行うたびに、これらの情報の中から必要な内容が自動的に参照されます。\ そのため、新しく画像や質問を追加した場合でも、過去にアップロードした他のファイルがあわせて参照されることがあり、その際にクレジットが消費される場合があります。\ 既存の会話内容を参照せず、直前にアップロードしたファイルのみに基づいて処理を行いたい場合は、［会話を更新］をクリックして会話をリセットしてください。 {% endhint %}

*** ## よくある質問 * **プレビュー画面でマルチモーダル機能をテストできますか？** 現在、プレビュー画面（SDK画面）ではファイル添付アイコンが表示されず、マルチモーダル機能のテストには対応していません。アクセスリストを調整してアプリを公開したうえで、Alli Works画面またはテスト機能を使ってテストを実施してください。 * **会話中にアップロードしたファイル(チャットにアップロードファイル)はドキュメントとして登録されますか？** 登録されません。会話中（チャット）にアップロードしたファイルは、その会話内でのみ一時的に使用されます。パーソナルドキュメントやシェアドキュメントには登録されず、RAGの対象にもなりません。 * **「チャットにアップロード」ボタンがグレーアウトしています。どうすればいいですか？** アプリの設定で検索ソースが指定されている場合にグレーアウトします。チャット画面の「ドキュメントから検索」ボタン＞歯車アイコン（設定）＞ソース指定を解除することで利用可能になります。 *** ## 関連ページリンク * [回答生成ノード](/alli-llm-app-market/manual/app-management/conversation/generative-answer.md) * [Alli Worksの利用(TOPアプリUI）](https://docs.allganize.ai/alli-llm-app-market/manual/for_user/alli-works-new-ui) * [conversation appの作成・編集](https://docs.allganize.ai/alli-llm-app-market/manual/app-management/conversation) --- # Agent Instructions This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com. ## Querying This Documentation If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question. Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter: ``` GET https://docs.allganize.ai/alli-llm-app-market/manual/app-management/conversation/generative-answer/multi-modal.md?ask=&goal= ``` `ask` is the immediate question: it should be specific, self-contained, and written in natural language. `goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal. The response will contain a direct answer to the question and relevant excerpts and sources from the documentation. Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.