다시 이음

SEQGAN 프로젝트 본문

프로젝트

SEQGAN 프로젝트

Taeho(Damon) 2021. 11. 16. 11:55

 

느낀 점

 

  • seqGAN은 딥러닝 기본만 배운 입장에서는 섣불리 도전하기에는 복잡한 모델인것 같습니다.
  • 자연어 처리를 할때 필요한 토큰화, 임베딩, 인코딩 등등 여러가지부분을 생각해보고 프로젝트를 설계해야합니다.
  • word2vec을 사용하여 word to index, index to word에 해당하는 dictionary를 만들어서 seqGAN에 적용하는 형태를 주로 형성하고 있습니다.
  • 저는 Fasttext를 통해서 사용해보려고 했으나 Fasttext안에 메소드인 index to word를 사용하여 인코딩 하는 방식이 잘 진행되지 않았습니다.
  • 자소분리를 통하여 정확도를 올리는 작업이 생각보다 효율적인지 모르겠습니다. 자소분리를 적용한 corpus를 다시 원래대로 돌려놓으면 내용이 많이 달라지는 등 좋은 결과가 나타나지 않는다고 생각했습니다.