본문 바로가기

데이타베이스24

R 프로그래밍[3] - wordcloud2 패키지 사용하기 지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서는 KoNLP패키지와 wordcloud패키지 등 몇 가지 패키지들을 이용해서 청와대 국민청원 게시판의 최근 청원글에 올라온 국민들의 애로사항을 텍스트 마이닝 기법으로 시각화해 보았습니다. 이번 포스팅에서는 'wordcloud2' 패키지를 이용하여 다양한 형태로 텍스트 마이닝을 시도해 보겠습니다. RStudio 기본 패키지 설치 및 라이브러리 로딩은 지난 'R 프로그래밍[2] - 텍스트 마이닝' 편에서 설치한 환경에 이어서진행하기 때문에 'wordcloud2' 패키지 설치 및 사용을 위해서는 이전 포스팅을 참조하여 환경을 구성해 주어야 합니다. 먼저 아래와 같이 'wordcloud2' 패키지를 설치해 주겠습니다. devtools::install_githu.. 2020. 5. 31.
데이터베이스 구성 요소와 스키마 개념 정리(외부스키마, 개념스키마, 내부스키마) 이번 포스팅에서는 데이터 베이스의 구성요소와 스키마에 대해 알아보겠습니다. 데이터베이스를 각 요소로 분해해서 각 요소의 이름과 특징들을 먼저 살펴보도록 하겠습니다. 아래의 그림은 일반적인 데이터베이스 테이블인데 테이블을 요소로 구분하여 쉽게 이해할 수 있도록 구조화하였습니다. 속성(Attribute)은 데이터베이스를 구축하는 가장 작은 논리적 단위로 파일 시스템의 필드 개념에 해당합니다. 자체만으로는 정보를 표현할 수 없고 정보를 표현하는 단위인 개체나 관계의 특성을 설명하는 도구의 의미로 사용됩니다. 개체(Entity)는 정보를 나타내는 논리적 단위로서 파일 시스템의 레코드에 해당하며 튜플이라고 부르기도 합니다. 개체는 하나 이상의 속성을 조합하여 구성되며 개체 단독으로도 존재할 수 있고 모든 개체는 .. 2020. 5. 29.
SQL 기타 SELECT 질의문 정리 이번 포스팅에서는 SQL 기타 SLELCT 질의문에 대해서 살펴보겠습니다. 가장 먼저 살펴볼 것은 alias 인데요, 말 그대로 별칭입니다. alias는 테이블이나 컬럼의 이름을 임시로 변경하고자 할 때 사용합니다. 별칭을 사용하는 이유는 출력되는 결과 테이블의 컬럼명을 변경하거나 테이블명이 길어 SQL 문이 지나치게 길어지는 것을 짧게 축약하여 SQL문의 가독성을 향상시킬 때 주로 사용합니다. 그리고 이전 포스팅에서도 사용했었는데, 바로 동일한 테이블이 조인에 사용되어 컬럼의 소속 테이블을 구분할 수 없을 때 사용하기도 합니다. 구문 형식은 아래와 같습니다. 기존이름 AS 새이름 예를 들어서 살펴보기 위해서 이전 포스팅에서 사용했던 테이블들을 다시 불러오겠습니다 만일 교수에 대한 성명과 소속 캠퍼스를 .. 2020. 5. 25.
SQL 고급 질의어 정리 이전 포스팅에서 SQL 기본 질의어에 대해 살펴보았습니다. 이번 포스팅에서는 여러 조건에 부합하는 데이터베이스 검색 결과를 도출해 낼 수 있는 SQL 고급 질의어에 대해 살펴보겠습니다. 먼저 복수의 테이블에 대한 SELECT 질의를 살펴보겠습니다. 데이터 모델링 단계에서 데이터 중복이나 종속을 제거하기 위해 정규화 과정을 통해서 여러 개의 테이블로 나뉠 수 있습니다. 사용자의 요청에 따라 다수의 테이블로부터 정보를 추출해야 하는 경우에는 아래와 같은 형식으로 질의문을 구성할 수 있습니다. SELECT 컬럼1, 컬럼2, ···, 컬럼n FROM 테이블명1, 테이블명2, ···, 테이블명n WHERE 조건 예를 들어 설명하기 위해 임의의 교수 테이블과 학과 테이블을 아래와 같이 생성하였습니다. 위 예제 테이.. 2020. 5. 23.