반응형
데이터베이스란?
1. 체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물임
2. 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합임
3. 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체임
통합된 데이터 (Integrated Data) |
자료의 중복을 배제한 데이터의 모임 |
저장된 데이터 (Stored Data) |
컴퓨터가 접근할 수 있는 저장매체에 데이터를 저장함 |
공용 데이터 (Shared Data) |
여러 사용자가 서로 다른 목적으로 데이터를 함께 이용함 |
변화되는 데이터 (Changed Data) |
데이터는 현시점의 상태를 나타내며 지속적으로 갱신됨 |
데이터 베이스의 특징
특징 요소 | 설명 | |
1 | 실시간 접근성 (real time accessibility) |
사용자의 질의에 대하여 즉시 처리함 |
2 | 계속적인 진화 (continuos ) |
삽입, 삭제, 갱신을 통하여 항상 최근의 정확한 데이터를 동적으로 유지함 |
3 | 동시 공유 (concurrent sharing) |
여러 사용자가 동시에 원하는 데이터를 공유함 |
4 | 내용에 의한 참조 (content reference) |
데이터베이스에 있는 데이터를 참조할 때 튜플(tuple)의 주소나 위치가 아닌 사용자가 요구하는 데이터 내용에 따라 참조함 |
5 | 데이터 논리적 독립성 (independence) |
응용프로그램과 데이터베이스를 독립시킴으로써 데이터의 논리적 구조를 변경시키더라도 응용 프로그램은 변경되지 않음 |
데이터베이스의 장단점
장점 | 단점 |
- 데이터 중복 최소화 - 실시간 접근 가능 - 데이터 보안 강화 - 논리적 및 물리적 독립성 제공 - 데이터 일관성 제공 - 데이터 무결성 보장 - 데이터 공유 용이 |
- 구축과 유지에 따른 비용 발생 - 백업과 복구 등 관리 필요 |
데이터베이스의 활용
1. OLTP(OnLine Transaction Processing)
- 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간 처리 형태의 하나임
- 데이터베이스의 데이터를 수시로 갱신하는 프로세싱을 의미함
2. OLAP(Online Analytical Processing)
- 정보 위주의 분석 처리
- OLTP에서 처리된 트랜잭션 데이터를 분석해 제품의 판매 추이, 구매 성향 파악, 재무 회계 분석 등을 프로세싱함
OLTP | OLAP | |
데이터 구조 | 복잡 | 단순 |
데이터 갱신 | 동적으로 순간적 | 정적으로 주기적 |
응답 시간 | 수초이내 | 수 초에서 몇 분 사이 |
데이터 범위 | 수 십일 전후 | 오랜 기간 저장 |
데이터 성격 | 정규적인 핵심 데이터 | 비정규적 읽기 전용 데이터 |
데이터 크기 | 수 기가바이트 | 수 테라바이트 |
데이터 내용 | 현재 데이터 | 요약된 데이터 |
데이터 특성 | 트랜잭션 중심 | 주제 중심 |
데이터 액세스빈도 | 높음 | 보통 |
질의 결과 예측 | 주기적이며 예측 가능 | 예측하기 어려움 |
데이터베이스 관리 시스템(DBMS : DataBase Manafement System)
DBMS는 데이터베이스를 관리하며 응용 프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트웨어임
종류 | 설명 |
관계형 DBMS | 데이터를 열과 행을 이루는 테이블로 표현하는 모델임 '키'와 '관계'라는 연결 고리로 연결하여 원하는 데이터를 조회하고 가공하는 방식 예) DB2, MySQL, MS SQL Server |
객체지향 DBMS | 정보를 객체 형태로 표현하는 모델임 객체와 객체 식별자, 속성과 메서드, 클래스, 클래스 계층 및 상속, 복합 객체 등 객체 지향 데이터 모델을 지원함 |
네트워크 DBMS | 그래프 구조를 기반으로 하는 모델임 |
계층형 DBMS | 트리 구조를 기반으로 하는 모델임 개인 저장장치에서 주로 사용하는 폴더-파일 |
데이터 웨어하우스(DW : Data WareHouse)
사용자의 의사결정에 도움을 주기 위하여 기관시스템의 데이터베이스에 축적된 데이터를 공통의 형식으로 변화해서 관리하는 데이터베이스
데이터 웨어하우스의 특징
특징 | 내용 |
주제지향성 (Subject-orientatioin) |
고객, 제품 등과 같은 중요한 주제를 중심으로 그 주제와 관련된 데이터들로 구성됨 |
통합성 (Integration) |
데이터가 데이터 웨어하우스에 입력될 때는 일관된 형태로 변화되며, 전사적인 관점에서 통합됨 |
시계열성 (Time-variant) |
데이터 웨어하우스의 데이터는 일정 기간 동안 시점별로 이어짐 |
비휘발성 (Non-volatilization) |
데이터 웨어하우스에 일단 데이터가 적재되면 일괄 처리 작업에 의한 갱신 이외에는 변경이 수행되지 않음 |
데이터 웨어하우스의 구성
구성 요소 | 내용 |
데이터 모델 (Data Model) |
주제 중심적으로 구성된 다체원의 개체-관계형(Entity Relation) 모델로 설계됨 |
ETL (Extract, Transform, Load) |
기업의 내부 또는 외부로부터 데이터를 추출, 정제 및 가공하여 데이터 웨어하우스에 적재함 |
ODS (Operational Data Store) |
다양한 DBMS 시스템에서 추출한 데이터를 통합적으로 관리함 |
DW 메타데이터 | 데이터 모델에 대한 스키마 정보와 비즈니스 측면에서 활되는 정보도 제종 |
OLAP | 사용자가 직접 다차원의 데이터를 확인할 수 닜는 솔루션임 |
데이터 마이닝 | 대용량의 데이터로부터 인사이트를 도출할 수 있는 방법론임 |
분석 기구 | 데이터 마이닝을 활용하여 데이터 웨어하우스에 적재된 데이터를 분석할 수 있는 도구 |
경영기반 솔루션 | KMS, DSS, BI오 ㅏ같은 경영의사결정을 지원하기 위한 솔루션임 |
https://kr.analysisman.com/2020/08/cloud-dw-cdp.html#point5
반응형
'자격증 공부' 카테고리의 다른 글
[이론 정리] 분산 시스템, 병렬 시스템, 하둡, 맵리듀스 (1) | 2022.09.18 |
---|---|
빅데이터 처리기술 (0) | 2022.09.16 |
빅데이터 플랫폼 개념 정리 (0) | 2022.09.13 |
빅데이터의 가치 (0) | 2022.09.13 |
빅데이터 개요 자료 정리 (1) | 2022.09.10 |