* UC 얼바인 머신러닝 저장소 : 데이터셋
http://archive.ics.uci.edu/ml/index.php
* 캐글 데이터 셋 : 데이터 셋 및 각종 분석 모델 공유
https://www.kaggle.com/datasets
* 아마존 데이터 셋 : 별로 연습용으로 활용하기 좋지 않음/ AWS 솔루션 사용자를 위한 데이터 셋
https://registry.opendata.aws/
* 각 국가의 공공 데이터 링크 모은 사이트 : 각 국가마다 사이트 가입 필요(한국은 현재 16개)
* 유럽 국가의 공개 데이터 링크 모음: 링크를 많이 타고 가야해서 불편
https://opendatamonitor.eu/frontend/web/index.php?r=dashboard%2Findex
* 유료 데이터 셋(일부 무료) : 고유 데이터 판매 가능
* 위키백과: 머신러닝 주요 데이터 셋 목록
https://en.wikipedia.org/wiki/List_of_datasets_for_machine-learning_research
* 데이터셋 리스트 모음 링크
https://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public
* 데이터 셋 서브레딧
https://www.reddit.com/r/datasets
* 카네기 멜론 대학교 통계학과 데이터 셋
http://lib.stat.cmu.edu/datasets/
* 깃허브 유명 데이터 셋
https://github.com/awesomedata/awesome-public-datasets
'데이터분석 > 머신러닝' 카테고리의 다른 글
[sklearn] train_test_split 사용하는 방법 및 유의사항 (0) | 2021.05.09 |
---|---|
[회귀분석] 회귀분석 모델 한 번에 돌려서 가장 좋은 성능 모델 값 뽑기 (0) | 2020.02.24 |
[모델 선택하기] 머신러닝(지도학습,비지도학습,강화학습)/딥러닝 (0) | 2018.07.19 |
[기초개념] 데이터 분석 관점에서 한줄로 정리한 '머신러닝 딥러닝 데이터 분석을 하기 위해 꼭 알아야할 기본 개념' (0) | 2018.05.28 |
[데이터 분석] 의미있는 피처(컬럼) 선택 (0) | 2018.05.17 |