학습목표
자연어 처리에서 텍스트 분류 문제를 다뤄봅니다.
핵심키워드
- Text Classification
- Sentence Representation
학습하기
지금부터는 텍스트 분류에 대해 알아보겠습니다. 먼저 인풋과 아웃풋을 생각해보죠. 인풋은, 어떤 자연어입니다. 문장이 될 수도 있고, 문단이 될 수도 있고. 아웃풋은 뭘까요. 내 목적성에 맞게 설정한 어떤 상수 개의 카테고리입니다. 예제를 보시면 이해가 확 될겁니다. 첫번째는, 영화 리뷰가 긍정적이냐 부정적이냐 따위를 판단하는 경우가 있겠죠. 다른 말로는 감성 분류. 두번째는, 해당 기사가 어떤 카테고리에 속하느냐를 판단하는 경우. 이게 스포츠 섹션인지, 연예 섹션인지 뭐 등등. 카테고리 분류겠지요. 세번째는 어떤 질문이, 뭐 중국 식당에 대해 묻는 건지, 한국 식당에 대해 묻는 건지, 이런걸 판단하는 의도 분류. 이런 것들이 결국 텍스트 분류입니다. 이런 텍스트 분류 알고리즘을 파헤치면서 우리는 Sentence Representation에 대해 이해할 수 있습니다.
'머신러닝 > [딥러닝을 이용한 자연어 처리]' 카테고리의 다른 글
Summary (0) | 2020.04.09 |
---|---|
Self Attention & RNN (0) | 2020.04.08 |
CBoW & RN & CNN (0) | 2020.04.07 |
How to represent sentence & token? (0) | 2020.04.06 |
시작에 앞서 (0) | 2020.04.04 |