본문 바로가기
데이터분석/머신러닝

[기초개념] 데이터 분석 관점에서 한줄로 정리한 '머신러닝 딥러닝 데이터 분석을 하기 위해 꼭 알아야할 기본 개념'

by code cleaner 2018. 5. 28.
반응형


* 데이터 웨어하우스 : 각 데이터베이스의 자료들을 시계열로 축적한 데이터 창고로 데이터 웨어하우스의 데이터 분석을 통해 의사결정에 활용함

상세설명 링크 : https://blog.naver.com/vae3085/220686438394


* 데이터 마트 : 데이터 웨어하우스에서 특정 목적에 따라서 데이터를 추출한 데이터 셋

상세설명 링크 : https://terms.naver.com/entry.nhn?docId=819906&cid=42344&categoryId=42344


* 메타데이터 : 데이터를 설명해주기 위해 만들어진 데이터

    예를 들면 영화는 기본 이미지와 소리가 축적된 데이터이고 영화줄거리,감독정보등은 영화를 설명해주는 메타데이터

상세설명 링크 : https://blog.naver.com/daae0609/221257125964


* 데이터 마이닝 :  대용량 자료로부터 정보를 요약하고 미래에 대한 예측을 목표로 자료의 패턴, 규칙을 탐색하여 향후 상황을 예측함

상세설명 링크 : http://weejw.tistory.com/204


* 모드(MODE) : 데이터의 자료 형태 의미


* 벡터(VECTOR) : 같은 자료형의 데이터(스칼라)를 묶은 데이터 셋(an ordered list of numbers (set)) 1차원

상세설명 링크 : http://cleancode-ws.tistory.com/66?category=796111


* 스칼라(SCALARS) : 데이터 하나의 값


* 행렬(MATRIX) : 벡터들의 결합으로 형성된 2차원 데이터 셋

* 배열(ARRAYS) : 3차원이상의 데이터 셋 

행렬과 배열의 차이(PANDAS와 NUMPY 차이) 관련 링크 : http://cleancode-ws.tistory.com/13

 

* 요약변수 : 데이터의 분포 등을 잘 나타내는 변수, 집계변수(SUM, MEAN, MIN, MAX, COUNT) MEDIAM, COV 등


* 파생변수 : 사용자/분석가가 특정 조건을 만족하거나 설명하는데 만들어낸 변수




반응형