1. 데이터의 유형별 구분하기
정량적(Quantitative) 데이터란? 주로 숫자로 이루어진 데이터
정성적(Qualitative) 데이터란? 문자와 같은 텍스트로 구성되어 함축적 의미를 갖고 있는 데이터
구분 | 정량적 데이터 | 정성적 데이터 |
유형 | 정형데이터, 반정형 데이터 | 비정형 데이터 |
특징 | 여러 요소의 결합으로 의미 부여 | 객체 하나가 함축된 의미 내포 |
관점 | 주로 객관적 내용 | 주로 주관적 내용 |
구성 | 수치나 기호 등 | 문자나 언어 등 |
형태 | 데이터베이스, 스프레드시트 등 | 웹로그, 텍스트 파일 등 |
위치 | DBMS, 로컬 시스템 등 내부 | 웹사이트, 모바일 플랫폼 등 외부 |
분석 | 통계 분석 시 용이 | 통계 분석 시 어려움 |
* 정형(Structured) 데이터 : 정해진 형식과 구조에 맞게 저장되도록 구성된 데이터, 연산이 가능함(수치화됨)
- 예) table, dataFrame, ...
* 반정형(Semi-Structured) 데이터 : 데이터의 형식과 구조가 비교적 유연하고, 스키마 정보를 데이터와 함께 제공하는 파일 형식의 데이터, 연산이 불가능함
- 예) JSON, XML, HTML 등
* 정형(Unstrctured) 데이터 : 구조가 정해지지 않은 데이터, 연산이 불가능함
- 예) 이미지, 텍스트, 음성, 신호, 영상 데이터 등
2. 데이터 가공 여부별 구분하기
구분 | 가역 데이터 | 불가역 데이터 |
환원성(추적성) | 가능(비가공 데이터) | 불가능(가공 데이터) |
의존성 | 원본 데이터 그 자체 | 원본 데이터와 독립된 새 객체 |
원본과의 관계 | 1대1의 관계 | 1대N, N대1 또는 M대N의 관계 |
처리과정 | 탐색 | 결합 |
활용분야 | 데이터 마트, 데이터 웨어하우스 | 데이터 전처리, 프로파일 구성 |
3. 데이터의 기능
* 암묵지 : 어떠한 시행착오나 다양하고 오랜 경험을 통해 개인에게 체계화되어 있으며, 외부에 표출되지 않은 무형의 지식으로 전달 및 공유가 어려움
* 형식지 : 형상화된 유형의 지식으로 그 전달과 공유가 쉬움
4. 지식창조 매커니즘
* 공통화(Socialization) : 개인의 공유화, 서로의 경험이나 인식을 공유하며 한 차원 높은 암묵지로 발전시킴
* 표출화(Externalization) : 집단 내의 표출화, 암묵지가 구체화되어 형식지로 표현됨
* 연결화(Combination) : 조직내의 조합화/연결화, 형식지를 재분류하여 체계화함
* 내면화(Internalization) : 개인의 내면화, 전달받은 형식지를 다시 개인의 것으로 만듦
==> 프로세스사 돌고 도는 나선 상승 모델임
5. 지식의 피라미드
지혜 | 축적된 지식을 통해 근본적인 원리를 이해하고 아이디어를 결합하여 도출한 창의적 산물임 |
지식 | 상호 연결된 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 내재화한 고유의 결과물 |
정보 | 데이터를 가공하거나 처리하여 데이터 간 관계를 분석하고 그 속에서 도출된 의미를 말하며, 항상 유용한 것은 아님 |
데이터 | 현실 세계에서 관찰하거나 측정하여 수집한 사실이나 값으로 개별 데이터로는 그 의미가 중요하지 않은 객관적인 사실임 |