⬆️데이터 업로드
모델 훈련 및 테스트를 위한 데이터 업로드 방법을 알아보세요.
업로드 방법
대시보드 데이터 영역에서 다음 데이터를 확인할 수 있습니다.
API 연동을 통해 자동으로 업로드된 데이터
파일 업로드를 통해 직접 업로드된 데이터
문장 입력을 통해 직접 업로드된 데이터
세 가지 업로드 방법이 있지만, 대시보드 페이지의 하나의 데이터 영역에서 모두 볼 수 있습니다.
지원 파일 유형
TXT, JSON, TSV 및 XLSX 파일을 업로드할 수 있습니다.
업로드 시 데이터 설정
파일 업로드 시, 미리 해당 데이터를 훈련 데이터 또는 테스트 데이터로 사용할 것인지 선택할 수 있습니다. Train/Test여부를 선택하여 업로드하면, 대시보드는 각 옵션의 Toggle On 상태로 제시됩니다.
RANDOM 설정
파일 업로드 시 RANDOM 옵션을 선택하면, 퍼센트(%)를 입력할 수 있습니다. 파일에 있는 데이터 중 입력한 퍼센트(예: 20%)가 무작위로 Test Data로 설정되고, 나머지 퍼센트(예: 80%)는 Training Data로 설정됩니다.
업로드가 완료된 후 대시보드에서 각 데이터의 Train/Test 설정 상태를 확인할 수 있습니다.
지원하는 업로드 파일
JSON, TXT/TSV, XLSX 파일을 업로드하실 수 있습니다.
가이드 및 예시
Review Analysis
JSON
TXT/TSV
카테고리 태그가 있는 경우 헤더가 포함되어야 합니다(첫 번째 예에서와 같이).
텍스트(분류 대상)는 맨 처음에 위치해야 합니다.
카테고리 태그가 존재하지 않는 경우 헤더를 생략할 수 있습니다(두 번째 예 참조).
데이터는 탭으로 구분되어야 합니다.
XLSX
열의 순서는 중요하지 않습니다.
감정은 -2, -1, 0, 1 또는 2 값 중 하나여야 합니다.
NER
JSON
XLSX
열 이름을 지정해야 합니다. \
열 이름은 ["PHRASE", "TOKEN", "START", "END", "TAG", "NO"] 여야 합니다.
열 이름의 순서는 관계 없습니다.
'NO'는 선택적 열입니다.
Text Classification
JSON
TXT/TSV
열 이름이 없습니다.
데이터는 [text] 또는 [intent, text] 형식일 수 있습니다.
의도가 있는 경우 텍스트 앞에 배치해야 합니다.
다음 형식이 모두 유효합니다.
XLSX
특정한 열 이름이 필요하지 않습니다.
[텍스트] 또는 [의도, 텍스트] 형식일 수 있습니다.
아래 두 예시 모두 가능합니다.
Tree Classification
JSON
TXT/TSV
카테고리 태그가 있는 경우 헤더가 있어야 합니다(첫 번째 예).
텍스트(분류 대상)는 맨 처음에 위치해야 합니다.
카테고리 태그가 없는 경우 헤더를 생략할 수 있습니다(두 번째 예).
데이터는 탭으로 구분됩니다.
XLSX
열 이름이 있어야 하며 다음 순서를 따라야 합니다.
TEXT - 대분류 - 중분류 - 소분류
Last updated