지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서는 KoNLP패키지와 wordcloud패키지 등 몇 가지 패키지들을 이용해서
청와대 국민청원 게시판의 최근 청원글에 올라온 국민들의 애로사항을 텍스트 마이닝 기법으로 시각화해 보았습니다.
이번 포스팅에서는 'wordcloud2' 패키지를 이용하여 다양한 형태로 텍스트 마이닝을 시도해 보겠습니다.
RStudio 기본 패키지 설치 및 라이브러리 로딩은 지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서 설치한 환경에 이어서진행하기 때문에 'wordcloud2' 패키지 설치 및 사용을 위해서는 이전 포스팅을 참조하여 환경을 구성해 주어야 합니다.
먼저 아래와 같이 'wordcloud2' 패키지를 설치해 주겠습니다.
devtools::install_github("lchiffon/wordcloud2")
library(wordcloud2)
컴퓨터 사양에 따라 시간이 다소 걸릴 수도 있지만 wordcloud2 패키지는 무난히 잘 설치가 됩니다.
이제 바로 wordcloud2 패키지를 사용할 수 있습니다.
지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서 KoNLP 패키지와 여러가지 패키지들을 설치하느라 삽질을 많이 했었는데 wordcloud2 패키지는 정말 간단하게 설치와 로딩을 마칠 수 있었습니다.
지난 포스팅에서 사용했던 df_word 데이터프레임을 그대로 사용하여 아래와 같이 바로 입력해 보면 바로 인터렉티브 한 텍스트 마이닝을 도출할 수 있습니다.
wordcloud2(data = df_word, size = 0.5)
wordcloud2 패키지에서는 다양한 형태로 텍스트 마이닝을 할 수 있도록 Parameters를 지원하고 있습니다.
data : word와 freq를 각 열로 갖고 있는 데이터 프레임을 사용합니다.
size : font size, default는 1입니다.
fontFamily : 설치되어 있는 font로 글자모양을 변경할 수 있습니다.
color : random-dark, random-light를 사용할 수 있고 특정 색으로 선택할 수 있습니다.
backgroundColor : 배경 색상을 변경할 수 있습니다.
minSize : 자막의 문자열 크기를 나타냅니다.
figPath : wordcloud2에서 사용할 이미지를 지정할 수 있습니다.
이밖에도 다양한 Parameters를 지원하고 있는데 자세한 내용은 cran.r-project.org에서 참조하실 수 있습니다.
wordcloud2 패키지에서 지원하는 다른 형태의 텍스트 마이닝을 진행해 보겠습니다.
문자 'R' 형태로 wordcloud를 만들고 싶다면 아래와 같이 입력하여 실행을 해보면 R 모양의 wordcloud가 출력됩니다.
wordcloud2( ) 함수가 아닌 letterCloud( ) 함수를 이용합니다.
letterCloud(data = df_word, word = "R", wordSize = 1)
wordcloud2에서는 이미지를 이용할 수도 있습니다.
이미지를 이용하기 위해서 cran.r-project.org에서 제공하는 트위터 이미지를 사용해 보겠습니다.
wordcloud2( ) 함수 내에서 figPath 파라미터에 대입할 이미지입니다.
위 이미지 모양으로 wordcloud를 생성하기 위해 아래와 같이 입력해 줍니다.
wordcloud2(df_word, figPath = "samplePNG.png", size = 1)
다양한 파라미터를 적용하여 원하는 색상과 크기, 모양을 변경할 수 있습니다.
wordcloud2( ) 함수에 대한 자세한 사항이 궁금하시면 RStudio에서 Help 기능을 이용해 보시면 자세한 정보를 확인할 수 있습니다.
?wordcloud2
wordcloud2( ) 함수에서 사용하는 다양한 파라미터 정보들과 사용 예제까지 상세하게 설명되어 있습니다.
조금만 읽어보신다면 wordcloud2( ) 함수를 이용해서 사용자가 원하는 형태로 텍스트 마이닝 정보를 제공해 줄 수 있을 것입니다.
이번 포스팅에서는 wordcloud2 패키지에 대해서 살펴보았습니다.
다음 포스팅에서는 지도 시각화에 대해서 살펴보도록 하겠습니다.
감사합니다.
'데이타베이스' 카테고리의 다른 글
R 프로그래밍[5] - Interactive 그래프 (0) | 2020.06.06 |
---|---|
R 프로그래밍[4] - 지도 시각화, 단계 구분도 (1) | 2020.06.01 |
데이터베이스 구성 요소와 스키마 개념 정리(외부스키마, 개념스키마, 내부스키마) (2) | 2020.05.29 |
SQL 기타 SELECT 질의문 정리 (0) | 2020.05.25 |
SQL 고급 질의어 정리 (0) | 2020.05.23 |
댓글