본문 바로가기

데이타베이스24

R 프로그래밍[0] R은 오픈소스 프로그램으로 통계, 데이터 마이닝, 그래프를 위한 언어이다. 사용법도 매우 간단하고 5,000여개가 넘는 패키지들을 지원하고 있어서 쉽고 빠르게 데이터를 분석할 수 있다. R은 콘솔을 통해서 작업할 수도 있지만 보통 RStudio 툴을 설치하여 IDE(Intergrated Development Environment) 환경에서 편리하게 작업을 한다. RStudio를 설치하기 위해서는 먼저 R을 설치하여야 한다. R 다운로드를 위해 홈페이지를 방문해보자. 아래 홈페이지에서 빨간색으로 테두리한 'CRAN'을 클릭한다. CRAN 페이지에서 중간정도 스크롤을 이동시키면 아래와 같이 Korea 서버의 다운로드 링크를 확인 할 수 있다. 빨간색 테두리 선에 있는 링크 중에서 하나를 선택하여 다운로드 페.. 2020. 5. 9.
데이터베이스 연동(C#) 프로그램을 개발하면서 데이터베이스 연동은 거의 필수적이라 해도 과언이 아닐 것이다. 물론 프로그램 개발 목적에 따라 데이터베이스 연동이 불필요할 경우도 있겠지만 대부분의 프로그램에서는 데이터를 효과적으로 다루기 위해서 데이터베이스와 연동을 해야한다. 데이터베이스를 연동하기 위해서 어떤 플랫폼을 쓸 것인가 선택하는 것도 필요하다. 단순히 엑셀 형태로 데이터를 관리한다면 Excel이나 Access 등과 연동해서 사용할 수도 있고 데이터 테이블을 통하여 여러가지 정보를 생산하고자 한다면 MySQL 등을 사용해도 좋을 것이다. 여기서는 자주 사용하는 몇 가지 데이터베이스 연동 방법에 대해서 살펴보고자 한다. 1. Excel 엑셀을 사용하기 위해서 먼저 라이브러리를 추가해야 한다. 엑셀 라이브러리는 솔루션 탐색기.. 2020. 5. 6.
빅 데이터 개요 및 처리 기술 소개 1. 빅 데이터의 정의 빅 데이터는 전례 없이 빠른 속도로 쏟아져 나오는 다양한 종류의 데이터로서 이른바 속도(Velocity), 크기(Volume), 다양성(Variety)의 3V로 일컬어진다.(Gartner) 빅데이터는 기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 정형 및 비정형 데이터들을 의미한다. 빅데이터를 기존 데이터베이스 관리 도구의 데이터 수집, 저장, 관리, 분석하는 역량을 넘어서는 규모로서 그 정의는 주관적이며 앞으로도 계속 변화될 것이라고 언급하고 있다. 어떤 그룹에서는 빅데이터를 테라바이트 이상의 데이터라고 정의하기도 하며 대용량 데이터를 처리하는 아키텍처라고 정의하기도 한다.(매켄지) 빅데이터에서 사용되는 단위는 아래와 같다.(^는 승수) Gig.. 2020. 4. 29.
DB 이중화(MariaDB Replication) MariaDB를 Master서버와 Slave서버 구조로 이중화하기 위한 방법입니다. OS : Windows 10 Master - Slave에서 DB 설치버전이 같거나 Slave가 더 높은 버전이면 가능합니다. my.ini 설정 변경 후에는 반드시 서비스 재시작을 통해 변경된 설정 내용을 반영하도록 합니다. ​ my.ini 파일 위치는 설치시 개인 설정에 따라 달라질 수 있지만 보통 아래의 경로를 참조하세요. C:\program files\mariaDB 10.0\data ​ DB 이중화 작업에 대한 정리 내용은 아래와 같습니다. [Master] 1. Master my.ini 수정 [mysqld] 하위에 아래 구문 추가 Server-id=1 log-bin=mysql-bin => log-bin은 Slave에서.. 2020. 4. 25.