Skip to content

TextCNN

warmwall edited this page Feb 2, 2020 · 3 revisions

TextCNN

image

  • 이미지 분석에만 사용하던 CNN을 텍스트 분석에도 사용할 수 있게 만든 Model
  • 문장의 단어 하나를 하나의 vector로 나타낸 뒤 순서대로 위에서 아래로 나열한다.
  • filter의 폭은 단어 vector 크기인 n, 높이는 한 번에 보고 싶은 단어 수(필터 크기)로 해서 특징을 추출하는 구조이다.
    • filter의 크기를 3, 4, 5 등 여러 개로 나누어 처리한다.
  • 한국어 자연어 처리를 할 때 CNN에서 Word2Vec만 쓰면 성능이 좋지 않고, Doc2Vec도 같이 써야 성능이 좋아진다는 연구 결과가 존재한다. (논문 링크)

참고 자료

Clone this wiki locally