⬆️데이터 업로드

모델 훈련 및 테스트를 위한 데이터 업로드 방법을 알아보세요.

업로드 방법

대시보드 데이터 영역에서 다음 데이터를 확인할 수 있습니다.

  • API 연동을 통해 자동으로 업로드된 데이터

  • 파일 업로드를 통해 직접 업로드된 데이터

  • 문장 입력을 통해 직접 업로드된 데이터

세 가지 업로드 방법이 있지만, 대시보드 페이지의 하나의 데이터 영역에서 모두 볼 수 있습니다.

지원 파일 유형

TXT, JSON, TSV 및 XLSX 파일을 업로드할 수 있습니다.

업로드 시 데이터 설정

파일 업로드 시, 미리 해당 데이터를 훈련 데이터 또는 테스트 데이터로 사용할 것인지 선택할 수 있습니다. Train/Test여부를 선택하여 업로드하면, 대시보드는 각 옵션의 Toggle On 상태로 제시됩니다.

RANDOM 설정

파일 업로드 시 RANDOM 옵션을 선택하면, 퍼센트(%)를 입력할 수 있습니다. 파일에 있는 데이터 중 입력한 퍼센트(예: 20%)가 무작위로 Test Data로 설정되고, 나머지 퍼센트(예: 80%)는 Training Data로 설정됩니다.

업로드가 완료된 후 대시보드에서 각 데이터의 Train/Test 설정 상태를 확인할 수 있습니다.

지원하는 업로드 파일

JSON, TXT/TSV, XLSX 파일을 업로드하실 수 있습니다.

가이드 및 예시

Review Analysis

JSON

{
    {'text': 'hello Mom', "review_sentiments": [{"category":"만족도", "sentiment":'1'}]},
    {'text': 'hello kid', "review_sentiments": [{"category":"delicious", "sentiment":'1'}]},
    {'text': "what's dinner?",},
    {'text': 'chicken dinner!',}
}    

TXT/TSV

  • 카테고리 태그가 있는 경우 헤더가 포함되어야 합니다(첫 번째 예에서와 같이).

    • 텍스트(분류 대상)는 맨 처음에 위치해야 합니다.

  • 카테고리 태그가 존재하지 않는 경우 헤더를 생략할 수 있습니다(두 번째 예 참조).

  • 데이터는 탭으로 구분되어야 합니다.

XLSX

  • 열의 순서는 중요하지 않습니다.

  • 감정은 -2, -1, 0, 1 또는 2 값 중 하나여야 합니다.

|REVIEW| category |sentiment|
|------|----------|---------|
|hello |  PRICE   |   1     |
|myhome|  LENGTH  |   2     |
|dinner|  MATERIAL|   -1    |


|    REVIEW    |
|--------------|
|hello friends!|

NER

JSON

{
    {'text': 'hello Mom',
     "entities":[{"tag": {"name": "family"}, "start": 6, "end": 9, "token": "Mom"}]},
    {'text': 'hello kid'}
}

XLSX

  • 열 이름을 지정해야 합니다. \

    • 열 이름은 ["PHRASE", "TOKEN", "START", "END", "TAG", "NO"] 여야 합니다.

    • 열 이름의 순서는 관계 없습니다.

  • 'NO'는 선택적 열입니다.

|PHRASE.      |TOKEN|START|END|TAG.                  |NO|
|-------------|-----|-----|---|----------------------|--|
|hello mom.   |mom  | 6   | 8 |{'name':'family'}     |2 |

Text Classification

JSON

{
    {'text': 'hello Mom', 'intent': {'name': 'good'}},
    {'text': 'hello kid'}
} 

TXT/TSV

  • 열 이름이 없습니다.

  • 데이터는 [text] 또는 [intent, text] 형식일 수 있습니다.

    • 의도가 있는 경우 텍스트 앞에 배치해야 합니다.

    • 다음 형식이 모두 유효합니다.

  • GOOD So Good
    BAD So Bad
    
    So Good
    So Bad

XLSX

  • 특정한 열 이름이 필요하지 않습니다.

  • [텍스트] 또는 [의도, 텍스트] 형식일 수 있습니다.

  • 아래 두 예시 모두 가능합니다.

|GOOD|hello mom!!|
|GOOD|hello dad!!|
|BAD|get out bob!!|

|hello mom!!|
|hello dad!!|

Tree Classification

JSON

{
    {'text': 'hello Mom!!',
     'tree_classes': [
         {'category': 'Large Category', 'value': 'Mom'},
         {'category': 'Medium Category', 'value': 'Woman'},
         {'category': 'Small Category', 'value': '50'}
     ]
    }
    {'text': 'hello kid'},
}

TXT/TSV

  • 카테고리 태그가 있는 경우 헤더가 있어야 합니다(첫 번째 예).

    • 텍스트(분류 대상)는 맨 처음에 위치해야 합니다.

  • 카테고리 태그가 없는 경우 헤더를 생략할 수 있습니다(두 번째 예).

  • 데이터는 탭으로 구분됩니다.

TREE\t Satisfaction\t Price
There are a lot of people \t1\t1
it's delicious even though I have to wait a bit. \t2\t2

There are a lot of people 
it's delicious even though I have to wait a bit.

XLSX

  • 열 이름이 있어야 하며 다음 순서를 따라야 합니다.

    • TEXT - 대분류 - 중분류 - 소분류

|TEXT	    |  Large Category  |  Medium Category  |  Small Category. |
|hello Mom. |          1       |          2        |          3.      |
|hello kid. |       Company    |      Engineer     |  New Employee.   |

Last updated