音声ファイルから議事録アプリ

アップロードした音声ファイルから文字起こしを行い、議事録の作成を行います。

フローの全体図

概要

音声ファイルから議事録アプリはLLM実行ノードを使って、アップロードした音声ファイルから文字起こしを行い、議事録を生成します。

基本情報を入力する(入力フォームノード)

入力フォームノードを使って、ユーザーに会議の基本情報を求め、変数に保存します。

日時

  • 変数:@DATE

    • 変数種別:会話変数

    • タイプ:日付

場所

  • 変数:@PLACE

    • 変数種別:会話変数

    • タイプ:文字列

参加者

  • 変数:@ATENDEE

    • 変数種別:会話変数

    • タイプ:文字列

対象の音声ファイルをアップロードする(質問応答ノード)

質問応答ノードでユーザーに音声ファイルのアップロードを求め、アップロードされた音声ファイルを変数に保存します。

応答スタイル:ファイル

変数:@AUDIOFILE

  • 変数種別:会話変数

  • タイプ:ファイル

音声ファイルの文字起こしをする(LLM実行ノード)

このLLM実行ノードでは、エージェントを利用してアップロードされた音声ファイルの文字起こしを行い、結果を変数に保存します。

実行するタイプ:エージェント

  • エージェント:Speech to Text Agent

  • ベースモデル:OPENAI GPT-4o

変数:@AUDIO_RESULT

  • 変数種別:会話変数

  • タイプ:文字列

文字起こしされた情報から議事録を作成する(LLM実行ノード)

このLLM実行ノードでは、1つ前のLLM実行ノードで保存された変数情報(@AUDIO_RESULT)をプロンプトで指定し実行しています。

実行するタイプ:シングルプロンプト

  • ベースモデル:OPENAI GPT-4o

  • プロンプト:音声を議事録にする

最終更新