본문 바로가기

데이타베이스25

R 프로그래밍[6] - R Markdown 이번 포스팅은 R 프로그래밍 6번째 시간으로 R Markdown에 대해서 알아보겠습니다. R Markdown은 텍스트 기반의 마크업 언어로 데이터 분석의 전 과정을 담아낼 수 있고, 이를 HTML, PDF, 워드 등 다양한 포맷으로 변경할 수 있는 리포트 작성 도구입니다. R Markdown을 이용해서 분석 보고서를 만들어 보겠습니다. 메뉴바에서 File > New File > R Markdown 을 클릭하면 아래와 같이 MarkDown 문서 생성 창이 열립니다. HTML 문서를 체크하고 [OK] 버튼을 클릭하면 아래와 같이 샘플 문서 창이 열립니다. 그림에서 빨간색 테두리 박스부분을 보시면 뜨개실 모양의 아이콘이 보이는데, 이 버튼을 클릭하면 R Markdown 문서 파일을 저장하는 창이 열리고 파일명.. 2020. 6. 18.
정규화(Normalization) 개념과 정규화 과정(4NF, 5NF) 이번 포스팅에서는 정규화(Normalization) 개념과 정규화 과정 두 번째 시간으로 고급 정규화 과정인 제4 정규형(Four Normal Form : 4NF)과 제5 정규형(Five Normal Form : 5NF)에 대해서 알아보겠습니다. 제 4정규형(Four Normal Form : 4NF)은 릴레이션 R에 다중치 종속(Multi Value Dependency : MVD) A ->>B가 존재할 때 R의 모든 속성도 A에 함수 종속이면 릴레이션 R은 제4 정규형에 속합니다. 다시말해 릴레이션 R에 A, B, C 세 개의 속성이 속해 있을 때 속성(A, C)의 도메인 값에 대응되는 B의 도메인 값 집합이 C 값에 독립이면, B는 A에 다중치 종속이라 하고 기호로는 A ->>B로 표시합니다. 예를 들.. 2020. 6. 10.
정규화(Normalization) 개념과 정규화 과정(1NF, 2NF, 3NF, BCNF) 이번 포스팅에서는 데이터베이스 설계에서 매우 중요한 정규화의 개념과 정규화 과정에 대해 알아보겠습니다. 현실 세계를 데이터 논리 구조로 표현하는 관계 스키마 설계에는 몇 가지 원칙이 있습니다. 즉, 필요한 속성(Attribute), 개체(Entity), 관계성(Relationship)을 식별하여 릴레이션을 구성하고 불필요한 데이터의 중복이 발생하지 않도록 해야 하며, 속성 사이의 관계성과 데이터의 종속성을 고려해서 설계해야 합니다. 또한 효율적인 데이터 처리와 일관성 유지 방법 등도 고려해서 설계해야 하는 원칙이 있습니다. 정규화(Normalization)란 하나의 릴레이션에 하나의 의미만 존재할 수 있도록 릴레이션을 분해해 나가는 과정이라 할 수 있습니다. 정규화의 목적은 구성되는 모든 릴레이션이 중복.. 2020. 6. 9.
R 프로그래밍[5] - Interactive 그래프 이번 포스팅에서는 plotly 패키지와 dygraphs 패키지를 이용해서 인터랙티브 그래프를 다루어 보겠습니다. 이전 포스팅에서 ggiraphExtra 패키지를 이용해 지도 시각화 그래프를 만들면서 간단하게 인터랙티브 한 그래프를 다루어 보았습니다. 인터랙티브 그래프란 마우스 움직임에 따라 반응하며 실시간 형태가 변하거나 세부 정보를 보여주는 그래프를 말합니다. R Studio에서는 그래프를 HTML로 저장하여 웹 브라우저를 통해서 그래프를 출력할 수도 있습니다. 그럼 예제를 통해서 인터랙티브 그래프를 만들어 보겠습니다. 먼저 아래와 같이 필요한 패키지를 설치하고 라이브러리 로드를 해 줍니다. install.packages("plotly") library(plotly) plotly 패키지에서 제공하는 g.. 2020. 6. 6.