본문 바로가기
데이터분석

데이터 구분 - 정량적/정성적 데이터, 정형/반정형 데이터

by code cleaner 2022. 9. 6.
반응형

1. 데이터의 유형별 구분하기

정량적(Quantitative) 데이터란? 주로 숫자로 이루어진 데이터 

정성적(Qualitative) 데이터란? 문자와 같은 텍스트로 구성되어 함축적 의미를 갖고 있는 데이터

구분 정량적 데이터 정성적 데이터
유형 정형데이터, 반정형 데이터 비정형 데이터
특징 여러 요소의 결합으로 의미 부여 객체 하나가 함축된 의미 내포
관점 주로 객관적 내용 주로 주관적 내용
구성 수치나 기호 등 문자나 언어 등
형태 데이터베이스, 스프레드시트 등 웹로그, 텍스트 파일 등
위치 DBMS, 로컬 시스템 등 내부 웹사이트, 모바일 플랫폼 등 외부
분석 통계 분석 시 용이 통계 분석 시 어려움

* 정형(Structured) 데이터 : 정해진 형식과 구조에 맞게 저장되도록 구성된 데이터, 연산이 가능함(수치화됨)

 - 예) table, dataFrame, ...

* 반정형(Semi-Structured) 데이터 : 데이터의 형식과 구조가 비교적 유연하고, 스키마 정보를 데이터와 함께 제공하는 파일 형식의 데이터, 연산이 불가능함

 - 예) JSON, XML, HTML 등

* 정형(Unstrctured) 데이터 : 구조가 정해지지 않은 데이터, 연산이 불가능함

 - 예) 이미지, 텍스트, 음성, 신호, 영상 데이터 등

 


2. 데이터 가공 여부별 구분하기

구분 가역 데이터 불가역 데이터
환원성(추적성) 가능(비가공 데이터) 불가능(가공 데이터)
의존성 원본 데이터 그 자체 원본 데이터와 독립된 새 객체
원본과의 관계 1대1의 관계 1대N, N대1 또는 M대N의 관계
처리과정 탐색 결합
활용분야 데이터 마트, 데이터 웨어하우스 데이터 전처리, 프로파일 구성

 

 


3. 데이터의 기능

* 암묵지 : 어떠한 시행착오나 다양하고 오랜 경험을 통해 개인에게 체계화되어 있으며, 외부에 표출되지 않은 무형의 지식으로 전달 및 공유가 어려움

* 형식지 : 형상화된 유형의 지식으로 그 전달과 공유가 쉬움

 


4. 지식창조 매커니즘

* 공통화(Socialization) : 개인의 공유화, 서로의 경험이나 인식을 공유하며 한 차원 높은 암묵지로 발전시킴

* 표출화(Externalization) : 집단 내의 표출화, 암묵지가 구체화되어 형식지로 표현됨

* 연결화(Combination) : 조직내의 조합화/연결화, 형식지를 재분류하여 체계화함

* 내면화(Internalization) : 개인의 내면화, 전달받은 형식지를 다시 개인의 것으로 만듦

==> 프로세스사 돌고 도는 나선 상승 모델임

 

참조 Nonaka의 SECI 모델


5. 지식의 피라미드

 

참조 지식의 피라미드

지혜 축적된 지식을 통해 근본적인 원리를 이해하고 아이디어를 결합하여 도출한 창의적 산물임
지식 상호 연결된 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 내재화한 고유의 결과물
정보 데이터를 가공하거나 처리하여 데이터 간 관계를 분석하고 그 속에서 도출된 의미를 말하며, 항상 유용한 것은 아님
데이터 현실 세계에서 관찰하거나 측정하여 수집한 사실이나 값으로 개별 데이터로는 그 의미가 중요하지 않은 객관적인 사실임

 

반응형