← 데이터셋
TEXT텍스트·NLP미디어·공공2021

월간 데이콘 뉴스 토픽 분류 AI 경진대회

주최데이콘
참여1,982
상금비시상
과제한국어 텍스트 다중 분류

연합뉴스 기사 제목(한 줄 짧은 텍스트)만 보고 정치·경제·사회·생활문화·세계·IT과학·스포츠 7개 토픽 중 하나로 분류하는 한국어 짧은 문장 분류 문제다. 제목이 짧아 형태소·키워드 신호가 핵심이다.

무엇을 맞히나

과제
한국어 텍스트 다중 분류
예측 대상
뉴스 기사 제목으로 7개 토픽 카테고리를 분류

데이터 스키마

컬럼타입설명
indexint샘플 고유 인덱스
titlestring뉴스 기사 제목(한국어, 주 입력)
topic_idxint토픽 카테고리 인덱스(0~6) — 예측 대상