본문 바로가기

머신러닝/[딥러닝을 이용한 자연어 처리]

Overview

학습목표

자연어 처리에서 텍스트 분류 문제를 다뤄봅니다.

핵심키워드

  • Text Classification
  • Sentence Representation

학습하기

 지금부터는 텍스트 분류에 대해 알아보겠습니다. 먼저 인풋과 아웃풋을 생각해보죠. 인풋은, 어떤 자연어입니다. 문장이 될 수도 있고, 문단이 될 수도 있고. 아웃풋은 뭘까요. 내 목적성에 맞게 설정한 어떤 상수 개의 카테고리입니다. 예제를 보시면 이해가 확 될겁니다. 첫번째는, 영화 리뷰가 긍정적이냐 부정적이냐 따위를 판단하는 경우가 있겠죠. 다른 말로는 감성 분류. 두번째는, 해당 기사가 어떤 카테고리에 속하느냐를 판단하는 경우. 이게 스포츠 섹션인지, 연예 섹션인지 뭐 등등. 카테고리 분류겠지요. 세번째는 어떤 질문이, 뭐 중국 식당에 대해 묻는 건지, 한국 식당에 대해 묻는 건지, 이런걸 판단하는 의도 분류. 이런 것들이 결국 텍스트 분류입니다. 이런 텍스트 분류 알고리즘을 파헤치면서 우리는 Sentence Representation에 대해 이해할 수 있습니다.

'머신러닝 > [딥러닝을 이용한 자연어 처리]' 카테고리의 다른 글

Summary  (0) 2020.04.09
Self Attention & RNN  (0) 2020.04.08
CBoW & RN & CNN  (0) 2020.04.07
How to represent sentence & token?  (0) 2020.04.06
시작에 앞서  (0) 2020.04.04