⬆️データのアップロード
モデルのトレーニングとテストのためのデータのアップロード方法
アップロード方法
以下のデータは、ダッシュボードのデータ領域で確認できます。
API連携によって自動的にアップロードされたデータ
ファイルアップロードによって直接アップロードされたデータ
文章入力によって直接アップロードされたデータ
アップロード方法は3つありますが、すべてのデータはダッシュボードページの1つのデータ領域で参照できます。
アップロード時にデータを設定する
ファイルをアップロードする場合、事前にこのデータをトレーニングデータまたはテストデータとして使用するかどうかを選択できます。TRAIN/TESTを選択してアップロードすると、ダッシュボード上でトレーニングとテストのON/OFF状態が表示されます。
ランダムに設定する
ファイルをアップロードする場合、RANDOMオプションを選択し、テストデータ比率(%)を入力することができます。ファイルに存在するデータのうち、入力されたパーセンテージ(例えば20%)がテストデータとしてランダムに設定され、残りのパーセンテージ(例えば80%)がトレーニングデータとして設定されます。
アップロードが完了すると、ダッシュボードで各データ(トレーニングとテスト)のON/OFF状態を確認することができます。
サポートされているファイルタイプ
TXT、JSON、TSV、XLSXファイルをアップロードできます。
ガイドとそれぞれの例
レビュー分析
JSON
TXT/TSV
カテゴリータグが存在する場合は、ヘッダーを含める必要があります (最初の例のように)。
テキスト (分類対象) は一番最初に配置する必要があります。
カテゴリータグが存在しない場合は、ヘッダーを省略できます (2 番目の例のように)。
データはタブで区切る必要があります。
XLSX
列の順序は問いません。
センチメントは、-2、-1、0、1、または 2 のいずれかの値である必要があります。
NER
JSON
XLSX
列名を指定する必要があります。 列名の順序は問いません。
列名は ["PHRASE"、"TOKEN"、"START"、"END"、"TAG"、"NO"] です。
列名の順序は関係ありません。
「いいえ」はオプションの列です。
テキスト分類
JSON
TXT/TSV
列名はありません。
データは [text] または [intent, text] 形式のいずれかです。
意図が存在する場合は、テキストの前に配置する必要があります。
次の両方の形式が有効です。
XLSX
特定の列名は必要ありません。
[テキスト] または [インテント、テキスト] のいずれかの形式で指定できます。
以下の例はどちらも有効です。
ツリー分類
JSON
TXT/TSV
カテゴリ タグがある場合は、ヘッダーが必要です (最初の例)。
テキスト (分類対象) は一番最初に配置する必要があります。
カテゴリ タグがない場合は、ヘッダーを省略できます (2 番目の例)。
データはタブで区切られています。
XLSX
列名が存在し、次の順序に従う必要があります。
テキスト - 大分類 - 中分類 - 小分類
Last updated