본문 바로가기
자격증 공부

데이터베이스란? 주요 개념 설명

by code cleaner 2022. 9. 7.
반응형

데이터베이스란?

1. 체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물

2. 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합

3. 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체

통합된 데이터
(Integrated Data)
자료의 중복을 배제한 데이터의 모임
저장된 데이터
(Stored Data)
컴퓨터가 접근할 수 있는 저장매체에 데이터를 저장함
공용 데이터
(Shared Data)
여러 사용자가 서로 다른 목적으로 데이터를 함께 이용함
변화되는 데이터
(Changed Data)
데이터는 현시점의 상태를 나타내며 지속적으로 갱신됨

데이터 베이스의 특징

  특징 요소 설명
1 실시간 접근성
(real time accessibility)
사용자의 질의에 대하여 즉시 처리함
2 계속적인 진화
(continuos )
삽입, 삭제, 갱신을 통하여 항상 최근의 정확한 데이터를 동적으로 유지함
3 동시 공유
(concurrent sharing)
여러 사용자가 동시에 원하는 데이터를 공유함
4 내용에 의한 참조
(content reference)
데이터베이스에 있는 데이터를 참조할 때 튜플(tuple)의 주소나 위치가 아닌 
사용자가 요구하는 데이터 내용에 따라 참조함
5 데이터 논리적 독립성
(independence)
응용프로그램과 데이터베이스를 독립시킴으로써
데이터의 논리적 구조를 변경시키더라도 응용 프로그램은 변경되지 않음

데이터베이스의 장단점

장점 단점
- 데이터 중복 최소화
- 실시간 접근 가능
- 데이터 보안 강화
- 논리적 및 물리적 독립성 제공
- 데이터 일관성 제공
- 데이터 무결성 보장
- 데이터 공유 용이
- 구축과 유지에 따른 비용 발생
- 백업과 복구 등 관리 필요

데이터베이스의 활용

1. OLTP(OnLine Transaction Processing) 

 - 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간 처리 형태의 하나임

 - 데이터베이스의 데이터를 수시로 갱신하는 프로세싱을 의미함

2. OLAP(Online Analytical Processing) 

- 정보 위주의 분석 처리

- OLTP에서 처리된 트랜잭션 데이터를 분석해 제품의 판매 추이, 구매 성향 파악, 재무 회계 분석 등을 프로세싱함

  OLTP OLAP
데이터 구조 복잡 단순
데이터 갱신 동적으로 순간적 정적으로 주기적
응답 시간 수초이내 수 초에서 몇 분 사이
데이터 범위 수 십일 전후 오랜 기간 저장
데이터 성격 정규적인 핵심 데이터 비정규적 읽기 전용 데이터
데이터 크기 수 기가바이트 수 테라바이트
데이터 내용 현재 데이터 요약된 데이터
데이터 특성 트랜잭션 중심 주제 중심
데이터 액세스빈도 높음 보통
질의 결과 예측 주기적이며 예측 가능 예측하기 어려움

데이터베이스 관리 시스템(DBMS : DataBase Manafement System)

DBMS는 데이터베이스를 관리하며 응용 프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트웨어임

 

종류 설명
관계형 DBMS 데이터를 열과 행을 이루는 테이블로 표현하는 모델임
'키'와 '관계'라는 연결 고리로 연결하여 원하는 데이터를 조회하고 가공하는 방식
예) DB2, MySQL, MS SQL Server
객체지향 DBMS 정보를 객체 형태로 표현하는 모델임
객체와 객체 식별자, 속성과 메서드, 클래스, 클래스 계층 및 상속, 복합 객체 등 객체 지향 데이터 모델을 지원함
네트워크 DBMS 그래프 구조를 기반으로 하는 모델임

계층형 DBMS 트리 구조를 기반으로 하는 모델임
개인 저장장치에서 주로 사용하는 폴더-파일

데이터 웨어하우스(DW : Data WareHouse)

사용자의 의사결정에 도움을 주기 위하여 기관시스템의 데이터베이스에 축적된 데이터를 공통의 형식으로 변화해서 관리하는 데이터베이스


데이터 웨어하우스의 특징

특징 내용
주제지향성
(Subject-orientatioin)
고객, 제품 등과 같은 중요한 주제를 중심으로 그 주제와 관련된 데이터들로 구성됨
통합성
(Integration)
데이터가 데이터 웨어하우스에 입력될 때는 일관된 형태로 변화되며, 전사적인 관점에서 통합됨
시계열성
(Time-variant)
데이터 웨어하우스의 데이터는 일정 기간 동안 시점별로 이어짐
비휘발성
(Non-volatilization)
데이터 웨어하우스에 일단 데이터가 적재되면 일괄 처리 작업에 의한 갱신 이외에는 변경이 수행되지 않음

데이터 웨어하우스의 구성

 

구성 요소 내용
데이터 모델
(Data Model)
주제 중심적으로 구성된 다체원의 개체-관계형(Entity Relation) 모델로 설계됨
ETL
(Extract, Transform, Load)
기업의 내부 또는 외부로부터 데이터를 추출, 정제 및 가공하여 데이터 웨어하우스에 적재함
ODS
(Operational Data Store)
다양한 DBMS 시스템에서 추출한 데이터를 통합적으로 관리함
DW 메타데이터 데이터 모델에 대한 스키마 정보와 비즈니스 측면에서 활되는 정보도 제종
OLAP 사용자가 직접 다차원의 데이터를 확인할 수 닜는 솔루션임
데이터 마이닝 대용량의 데이터로부터 인사이트를 도출할 수 있는  방법론임
분석 기구 데이터 마이닝을 활용하여 데이터 웨어하우스에 적재된 데이터를 분석할 수 있는 도구
경영기반 솔루션 KMS, DSS, BI오 ㅏ같은 경영의사결정을 지원하기 위한 솔루션임

https://kr.analysisman.com/2020/08/cloud-dw-cdp.html#point5

 

데이터 웨어하우스(DW)란 무엇인가?

데이터 웨어하우스(DW)란 무엇인가?, 스노우플레이크(Snowflake), 클라우데라(Cloudera), 데이터 웨어하우스(DW), 데이터베이스(DB), 데이터 레이크(Data Lake), 데이터 마트(Data Mart) 차이

kr.analysisman.com

 

반응형