⬆️データのアップロード

モデルのトレーニングとテストのためのデータのアップロード方法

アップロード方法

以下のデータは、ダッシュボードのデータ領域で確認できます。

  • API連携によって自動的にアップロードされたデータ

  • ファイルアップロードによって直接アップロードされたデータ

  • 文章入力によって直接アップロードされたデータ

アップロード方法は3つありますが、すべてのデータはダッシュボードページの1つのデータ領域で参照できます。

GNB > Dashboard

アップロード時にデータを設定する

ファイルをアップロードする場合、事前にこのデータをトレーニングデータまたはテストデータとして使用するかどうかを選択できます。TRAIN/TESTを選択してアップロードすると、ダッシュボード上でトレーニングとテストのON/OFF状態が表示されます。

ランダムに設定する

ファイルをアップロードする場合、RANDOMオプションを選択し、テストデータ比率(%)を入力することができます。ファイルに存在するデータのうち、入力されたパーセンテージ(例えば20%)がテストデータとしてランダムに設定され、残りのパーセンテージ(例えば80%)がトレーニングデータとして設定されます。

GNB > Dashboard (& Inference) > Upload Phrases dialog

アップロードが完了すると、ダッシュボードで各データ(トレーニングとテスト)のON/OFF状態を確認することができます。

サポートされているファイルタイプ

TXT、JSON、TSV、XLSXファイルをアップロードできます。

GNB > Dashboard (& Inference) > Upload Phrases dialog

ガイドとそれぞれの例

レビュー分析

JSON

TXT/TSV

  • カテゴリータグが存在する場合は、ヘッダーを含める必要があります (最初の例のように)。

    • テキスト (分類対象) は一番最初に配置する必要があります。

  • カテゴリータグが存在しない場合は、ヘッダーを省略できます (2 番目の例のように)。

  • データはタブで区切る必要があります。

XLSX

  • 列の順序は問いません。

  • センチメントは、-2、-1、0、1、または 2 のいずれかの値である必要があります。

NER

JSON

XLSX

  • 列名を指定する必要があります。 列名の順序は問いません。

    • 列名は ["PHRASE"、"TOKEN"、"START"、"END"、"TAG"、"NO"] です。

    • 列名の順序は関係ありません。

  • 「いいえ」はオプションの列です。

テキスト分類

JSON

TXT/TSV

  • 列名はありません。

  • データは [text] または [intent, text] 形式のいずれかです。

    • 意図が存在する場合は、テキストの前に配置する必要があります。

    • 次の両方の形式が有効です。

XLSX

  • 特定の列名は必要ありません。

  • [テキスト] または [インテント、テキスト] のいずれかの形式で指定できます。

  • 以下の例はどちらも有効です。

ツリー分類

JSON

TXT/TSV

  • カテゴリ タグがある場合は、ヘッダーが必要です (最初の例)。

    • テキスト (分類対象) は一番最初に配置する必要があります。

  • カテゴリ タグがない場合は、ヘッダーを省略できます (2 番目の例)。

  • データはタブで区切られています。

XLSX

  • 列名が存在し、次の順序に従う必要があります。

    • テキスト - 大分類 - 中分類 - 小分類

Last updated

Was this helpful?