Example2 [회귀분석] 회귀분석 모델 한 번에 돌려서 가장 좋은 성능 모델 값 뽑기 사이킷런 패키지를 바탕으로 회귀모델 한 번에 돌리기 보스턴 데이터셋 예제로 진행 1. 데이터 로드 2. 데이터 확인 3. 전처리(na 값 처리, 스케일링) 4. 회귀 모델 돌리기 5. 최종 모델 from sklearn.datasets import load_boston import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 데이터 로딩 load_data = load_boston() print(type(load_data)) print(load_data.keys()) print(load_data.DESCR) # np에서 pd로 변환하기 data = load_data['data'] df_X = pd.DataFrame(columns=.. 2020. 2. 24. hwp파일 python3로 불러오기 대부분의 텍스트 데이터는 txt 파일이나 html에서 크롤링하여 인식한다. 그렇지만 기존 문서들을 작업하기 위해서는 hwp, doc의 파일에서 텍스트를 갖고 와야 한다. 기존 python2에서는 'pyhwp'로 hwp의 파일을 읽어들일 수 있다고 한다. 하지만 현재 pyhwp은 python3에서는 구동이 안된다. 방법은 2개, pyhwp를 python3에서 사용할 수 있도록 개조하거나, 새로운 라이브러리를 찾는다. 오늘은 python3에서도 ole 파일을 읽을 수 있는 'olefile'을 활용한다. 1. 패키지 설치 cmd에서 'pip install olefile' 2. 소스 만들기http://olefile.readthedocs.io/en/latest/Howto.html 위의 olefile 문서를 참조하.. 2018. 7. 26. 이전 1 다음 반응형