* 데이터 웨어하우스 : 각 데이터베이스의 자료들을 시계열로 축적한 데이터 창고로 데이터 웨어하우스의 데이터 분석을 통해 의사결정에 활용함
상세설명 링크 : https://blog.naver.com/vae3085/220686438394
* 데이터 마트 : 데이터 웨어하우스에서 특정 목적에 따라서 데이터를 추출한 데이터 셋
상세설명 링크 : https://terms.naver.com/entry.nhn?docId=819906&cid=42344&categoryId=42344
* 메타데이터 : 데이터를 설명해주기 위해 만들어진 데이터
예를 들면 영화는 기본 이미지와 소리가 축적된 데이터이고 영화줄거리,감독정보등은 영화를 설명해주는 메타데이터
상세설명 링크 : https://blog.naver.com/daae0609/221257125964
* 데이터 마이닝 : 대용량 자료로부터 정보를 요약하고 미래에 대한 예측을 목표로 자료의 패턴, 규칙을 탐색하여 향후 상황을 예측함
상세설명 링크 : http://weejw.tistory.com/204
* 모드(MODE) : 데이터의 자료 형태 의미
* 벡터(VECTOR) : 같은 자료형의 데이터(스칼라)를 묶은 데이터 셋(an ordered list of numbers (set)) 1차원
상세설명 링크 : http://cleancode-ws.tistory.com/66?category=796111
* 스칼라(SCALARS) : 데이터 하나의 값
* 행렬(MATRIX) : 벡터들의 결합으로 형성된 2차원 데이터 셋
* 배열(ARRAYS) : 3차원이상의 데이터 셋
행렬과 배열의 차이(PANDAS와 NUMPY 차이) 관련 링크 : http://cleancode-ws.tistory.com/13
* 요약변수 : 데이터의 분포 등을 잘 나타내는 변수, 집계변수(SUM, MEAN, MIN, MAX, COUNT) MEDIAM, COV 등
* 파생변수 : 사용자/분석가가 특정 조건을 만족하거나 설명하는데 만들어낸 변수
'데이터분석 > 머신러닝' 카테고리의 다른 글
머신러닝/딥러닝 데이터셋 얻을 수 있는 링크 모음 (0) | 2019.05.07 |
---|---|
[모델 선택하기] 머신러닝(지도학습,비지도학습,강화학습)/딥러닝 (0) | 2018.07.19 |
[데이터 분석] 의미있는 피처(컬럼) 선택 (0) | 2018.05.17 |
[데이터 분석-전처리] 범주형 데이터_원핫인코딩 쉽게하기 (0) | 2018.05.17 |
[데이터 분석-전처리] 범주형 데이터 (0) | 2018.04.24 |