본문 바로가기

데이타베이스25

R 프로그래밍[4] - 지도 시각화, 단계 구분도 이번 포스팅에서는 RStudio를 이용하여 지역별 통계 분포를 지도 시각화로 표현하는 방법을 알아보겠습니다. 지역별 통계치를 지도 상에 색상으로 구분하여 표현한 지도를 '단계 구분도(Choropleth Map)'라고 합니다. 단계 구분도를 통해 통계상 유의미한 특성을 지역별로 구별할 수 있는 지도로 표현할 수 있습니다. 단계 구분도는 ggiraphExtra 패키지를 이용하여 만들 수 있습니다. 여기에서는 R에 내장된 USArrests 데이터를 이용해 지도 시각화를 살펴보도록 하겠습니다. RStudio에서 아래와 같이 패키지를 설치하고 라이브러리를 로드해 줍니다. ggiraphExtra 패키지를 사용하기 위해 필요한 "mapproj"패키지를 먼저 설치해 줍니다. 우리가 사용할 USArests 데이터는 19.. 2020. 6. 1.
R 프로그래밍[3] - wordcloud2 패키지 사용하기 지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서는 KoNLP패키지와 wordcloud패키지 등 몇 가지 패키지들을 이용해서 청와대 국민청원 게시판의 최근 청원글에 올라온 국민들의 애로사항을 텍스트 마이닝 기법으로 시각화해 보았습니다. 이번 포스팅에서는 'wordcloud2' 패키지를 이용하여 다양한 형태로 텍스트 마이닝을 시도해 보겠습니다. RStudio 기본 패키지 설치 및 라이브러리 로딩은 지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서 설치한 환경에 이어서진행하기 때문에 'wordcloud2' 패키지 설치 및 사용을 위해서는 이전 포스팅을 참조하여 환경을 구성해 주어야 합니다. 먼저 아래와 같이 'wordcloud2' 패키지를 설치해 주겠습니다. devtools::install_githu.. 2020. 5. 31.
데이터베이스 구성 요소와 스키마 개념 정리(외부스키마, 개념스키마, 내부스키마) 이번 포스팅에서는 데이터 베이스의 구성요소와 스키마에 대해 알아보겠습니다. 데이터베이스를 각 요소로 분해해서 각 요소의 이름과 특징들을 먼저 살펴보도록 하겠습니다. 아래의 그림은 일반적인 데이터베이스 테이블인데 테이블을 요소로 구분하여 쉽게 이해할 수 있도록 구조화하였습니다. 속성(Attribute)은 데이터베이스를 구축하는 가장 작은 논리적 단위로 파일 시스템의 필드 개념에 해당합니다. 자체만으로는 정보를 표현할 수 없고 정보를 표현하는 단위인 개체나 관계의 특성을 설명하는 도구의 의미로 사용됩니다. 개체(Entity)는 정보를 나타내는 논리적 단위로서 파일 시스템의 레코드에 해당하며 튜플이라고 부르기도 합니다. 개체는 하나 이상의 속성을 조합하여 구성되며 개체 단독으로도 존재할 수 있고 모든 개체는 .. 2020. 5. 29.
SQL 기타 SELECT 질의문 정리 이번 포스팅에서는 SQL 기타 SLELCT 질의문에 대해서 살펴보겠습니다. 가장 먼저 살펴볼 것은 alias 인데요, 말 그대로 별칭입니다. alias는 테이블이나 컬럼의 이름을 임시로 변경하고자 할 때 사용합니다. 별칭을 사용하는 이유는 출력되는 결과 테이블의 컬럼명을 변경하거나 테이블명이 길어 SQL 문이 지나치게 길어지는 것을 짧게 축약하여 SQL문의 가독성을 향상시킬 때 주로 사용합니다. 그리고 이전 포스팅에서도 사용했었는데, 바로 동일한 테이블이 조인에 사용되어 컬럼의 소속 테이블을 구분할 수 없을 때 사용하기도 합니다. 구문 형식은 아래와 같습니다. 기존이름 AS 새이름 예를 들어서 살펴보기 위해서 이전 포스팅에서 사용했던 테이블들을 다시 불러오겠습니다 만일 교수에 대한 성명과 소속 캠퍼스를 .. 2020. 5. 25.