본문 바로가기
데이타베이스

R 프로그래밍[3] - wordcloud2 패키지 사용하기

by minimax95 2020. 5. 31.

지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서는 KoNLP패키지와 wordcloud패키지 등 몇 가지 패키지들을 이용해서

청와대 국민청원 게시판의 최근 청원글에 올라온 국민들의 애로사항을 텍스트 마이닝 기법으로 시각화해 보았습니다.

 

이번 포스팅에서는 'wordcloud2' 패키지를 이용하여 다양한 형태로 텍스트 마이닝을 시도해 보겠습니다.

RStudio 기본 패키지 설치 및 라이브러리 로딩은 지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서 설치한 환경에 이어서진행하기 때문에 'wordcloud2' 패키지 설치 및 사용을 위해서는 이전 포스팅을 참조하여 환경을 구성해 주어야 합니다.

 

먼저 아래와 같이 'wordcloud2' 패키지를 설치해 주겠습니다.

devtools::install_github("lchiffon/wordcloud2")

library(wordcloud2)

 

컴퓨터 사양에 따라 시간이 다소 걸릴 수도 있지만 wordcloud2 패키지는 무난히 잘 설치가 됩니다.

이제 바로 wordcloud2 패키지를 사용할 수 있습니다.

지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서 KoNLP 패키지와 여러가지 패키지들을 설치하느라 삽질을 많이 했었는데 wordcloud2 패키지는 정말 간단하게 설치와 로딩을 마칠 수 있었습니다.

 

지난 포스팅에서 사용했던 df_word 데이터프레임을 그대로 사용하여 아래와 같이 바로 입력해 보면 바로 인터렉티브 한 텍스트 마이닝을 도출할 수 있습니다.

wordcloud2(data = df_word, size = 0.5)

wordcloud2 패키지에서는 다양한 형태로 텍스트 마이닝을 할 수 있도록 Parameters를 지원하고 있습니다.

data : word와 freq를 각 열로 갖고 있는 데이터 프레임을 사용합니다.

size : font size, default는 1입니다.

fontFamily : 설치되어 있는 font로 글자모양을 변경할 수 있습니다.

color : random-dark, random-light를 사용할 수 있고 특정 색으로 선택할 수 있습니다.

backgroundColor : 배경 색상을 변경할 수 있습니다.

minSize : 자막의 문자열 크기를 나타냅니다.

figPath : wordcloud2에서 사용할 이미지를 지정할 수 있습니다.

 

이밖에도 다양한 Parameters를 지원하고 있는데 자세한 내용은 cran.r-project.org에서 참조하실 수 있습니다.

 

wordcloud2 패키지에서 지원하는 다른 형태의 텍스트 마이닝을 진행해 보겠습니다.

문자 'R' 형태로 wordcloud를 만들고 싶다면 아래와 같이 입력하여 실행을 해보면 R 모양의 wordcloud가 출력됩니다.

wordcloud2( ) 함수가 아닌 letterCloud( ) 함수를 이용합니다.

letterCloud(data = df_word, word = "R", wordSize = 1)

wordcloud2에서는 이미지를 이용할 수도 있습니다.

이미지를 이용하기 위해서 cran.r-project.org에서 제공하는 트위터 이미지를 사용해 보겠습니다.

wordcloud2( ) 함수 내에서 figPath 파라미터에 대입할 이미지입니다.

위 이미지 모양으로 wordcloud를 생성하기 위해 아래와 같이 입력해 줍니다.

wordcloud2(df_word, figPath = "samplePNG.png", size = 1)

 

다양한 파라미터를 적용하여 원하는 색상과 크기, 모양을 변경할 수 있습니다.

 

wordcloud2( ) 함수에 대한 자세한 사항이 궁금하시면 RStudio에서 Help 기능을 이용해 보시면 자세한 정보를 확인할 수 있습니다.

?wordcloud2

wordcloud2( ) 함수에서 사용하는 다양한 파라미터 정보들과 사용 예제까지 상세하게 설명되어 있습니다.

조금만 읽어보신다면 wordcloud2( ) 함수를 이용해서 사용자가 원하는 형태로 텍스트 마이닝 정보를 제공해 줄 수 있을 것입니다.

 

이번 포스팅에서는 wordcloud2 패키지에 대해서 살펴보았습니다.

다음 포스팅에서는 지도 시각화에 대해서 살펴보도록 하겠습니다.

감사합니다.

댓글