R 프로그래밍1 R 프로그래밍[2] - 텍스트 마이닝 이전 포스팅에서 RStudio 설치 및 기본 함수 사용법, 패키지 등에 대해서 살펴보았습니다. 이번 포스팅에서는 문자로 된 데이터에서 가치 있는 정보를 얻어 내는 분석 기법인 '텍스트 마이닝' 방법에 대해 살펴보겠습니다. 텍스트 마이닝(Text Mining)을 하기 위해서 가장 먼저 해야 하는 일은 바로 문장을 구성하는 품사들을 파악하는 '형태소 분석(Morphology Analusis)'입니다. 형태소 분석을 통해 어절들의 품사를 파악하여 명사, 동사, 형용사 등 의미를 가진 단어들을 추출하고 각 단어들이 얼마나 많이 등장했는지 확인하게 됩니다. 이후 빈도표를 만들어서 이를 시각화 하면 분석하고자 하는 문서에 대한 유의미한 트렌드를 확인할 수 있습니다. 텍스트 마이닝을 하기 위해서는 먼저 패키지들을 설.. 2020. 5. 19. 이전 1 다음