音声ファイルから議事録アプリ
アップロードした音声ファイルから文字起こしを行い、議事録の作成を行います。
フローの全体図

概要
音声ファイルから議事録アプリはLLM実行ノードを使って、アップロードした音声ファイルから文字起こしを行い、議事録を生成します。
基本情報を入力する(入力フォームノード)
入力フォームノードを使って、ユーザーに会議の基本情報を求め、変数に保存します。
日時
変数:@DATE
変数種別:会話変数
タイプ:日付
場所
変数:@PLACE
変数種別:会話変数
タイプ:文字列
参加者
変数:@ATENDEE
変数種別:会話変数
タイプ:文字列

対象の音声ファイルをアップロードする(質問応答ノード)
質問応答ノードでユーザーに音声ファイルのアップロードを求め、アップロードされた音声ファイルを変数に保存します。
応答スタイル:ファイル
変数:@AUDIOFILE
変数種別:会話変数
タイプ:ファイル

音声ファイルの文字起こしをする(LLM実行ノード)
このLLM実行ノードでは、エージェントを利用してアップロードされた音声ファイルの文字起こしを行い、結果を変数に保存します。
実行するタイプ:エージェント
エージェント:Speech to Text Agent
ベースモデル:OPENAI GPT-4o
変数:@AUDIO_RESULT
変数種別:会話変数
タイプ:文字列

文字起こしされた情報から議事録を作成する(LLM実行ノード)
このLLM実行ノードでは、1つ前のLLM実行ノードで保存された変数情報(@AUDIO_RESULT)をプロンプトで指定し実行しています。
実行するタイプ:シングルプロンプト
ベースモデル:OPENAI GPT-4o
プロンプト:音声を議事録にする


最終更新