본문 바로가기

Python27

[python] KeyboardInterrupt Error · 발생원인 : python 코드 실행시 Ctrl + C를 누를 때 발생 · 해결방안 1) 코드 실행시 해당 키를 누르기 않는다 2) 코드 실행시간이 오래 걸리는 경우 2-1) 하드웨어 사양을 업그레이드 2-2) colab, aws 등으로 사용 2-3) 하드웨어 사양에 맞춰 코드 수정 2020. 3. 2.
[회귀분석] 회귀분석 모델 한 번에 돌려서 가장 좋은 성능 모델 값 뽑기 사이킷런 패키지를 바탕으로 회귀모델 한 번에 돌리기 보스턴 데이터셋 예제로 진행 1. 데이터 로드 2. 데이터 확인 3. 전처리(na 값 처리, 스케일링) 4. 회귀 모델 돌리기 5. 최종 모델 from sklearn.datasets import load_boston import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 데이터 로딩 load_data = load_boston() print(type(load_data)) print(load_data.keys()) print(load_data.DESCR) # np에서 pd로 변환하기 data = load_data['data'] df_X = pd.DataFrame(columns=.. 2020. 2. 24.
[mysql] 파이썬으로 이미지 데이터 mysql에 저장하고 읽어들여오기 1. 이미지 저장할 테이블 만들기 create table images( image_nm int auto_increment primary key, image_data blob) mysql 에서 이미지를 저장할 테이블을 간단하게 만든다. base64로 변환하여 이미지를 저장할 예정이다. base64는 이미지보다 용량이 125%로 커져서 저장된다는 단점이 있으나 안정적임. blob: 바이너리를 저장할 수 있는 공간 tinyblob 255byte blob 64KB mediumblob 16MB longblob 4G mysql 데이터 타입에 대해 잘 나와있는 블로그 https://ra2kstar.tistory.com/82 MySQL : 데이터 타입 MySQL MySQL 데이터 타입 MySQL 에서 사용하는 데이터 .. 2019. 7. 24.
[핸즈온머신러닝] MNIST 데이터셋 다운로드 에러 수정 p.124 runtime / socet 에러가 발생한다면 from sklearn.datasets import fetch_mldata mnist = fetch_mldata('MNIST original') print(mnist) 수정후 [수정내용: 다운로드 받을 root directory 지정) from sklearn.datasets import fetch_mldata custom_data_home = 'C:\\Users\\USER\\datasets' mnist = fetch_mldata('MNIST original', data_home=custom_data_home) print(mnist) 다운로드시 폴더명이 없는 경우 해당 폴더를 자동으로 만들어주면서 데이터가 다운로드 된다. 그리고 원래 책에 있는 코드로 해도 데.. 2019. 5. 9.
[Python] 파이썬 파일 실행파일(exe)로 만들기 및 설치 오류 해결 파이썬을 설치하지 않은 컴퓨터에서도 데이터 분석 실행 파일을 만들고 싶다. 그런 경우 간단하게 파이썬으로 GUI를 만들어서 파일을 불러오고 분석을 실행하는 실행파일을 만들 수 있다. 우선 현재 여러 파이썬 exe 파일 만드는 라이브러리들이 있지만 요근래 가장 많이 사용하는 것은 'pyinstaller'이다. * 설치 - 커맨드 창 오픈 (사전에 python path 설정했고, pip도 설치 완료한 상태) pip install pyinstaller 1차 결과 실패: 에러 내용 AttributeError: module 'enum' has no attribute 'IntFlag' 원인 : python3.6 버전에서는 enum이 기본 설치 라이브러리가 아니여서 enum34가 설치되어 있고, enum34을 참조하.. 2019. 3. 20.
[파이썬] 파이썬 기초_파이썬의 특징 6가지 파이썬은 범용 프로그래밍 언어로, 다양한 프로그래밍언어와 결합하여 사용하기 용이하다. 비영리단체에서 관리하고 있으며, 오픈소스로써 여러 사람들이 다양한 파이썬 패키지를 배포하고 있다. 파이썬은 'Cpython, Pypy, Jython, IronPython'이 있다. 이 중에서 일반적으로 CPython을 많이 사용한다. * 파이썬의 특징 6가지 1. 가독성과 유지보수성 파이썬은 가독성이 높은 언어이며, 들여쓰기가 매우 중요하다.들여쓰기가 맞지 않는 경우, 에러가 발생된다. 2. 인터프리터 언어 프로그램을 순차적으로 해석하여 실행하는 구조이며, 소스코드를 컴파일할 필요가 없다. 3. 스크립트 언어 1) 동적 타이밍의 언어2) 인터프리터 언어3) 저수준 기술이 필요하지 않음4) 소규모 프로그램에 적합할 것 4.. 2018. 12. 31.
[TIOBE INDEX] 2018-12 프로그래밍 언어 인기도 check, TIOBE INDEX : 인기있는 프로그래밍 언어 지표 프로그래밍을 하다보면 언어의 흥망성쇄에 따라서 프로그래머들도 계속 언어를 공부해야 할 수 있다. 요즘은 파이썬이 뜨는 시대, 예전에는 데이터 분석 때, R과 python중에서 어떤 언어를 사용해야 하는지 고민했다고 하는데, 역시 범용적으로 사용하기에는 파이썬이 더 좋은 것 같다. 아래는 타이오비닷컴에서 가져온 인기있는 프로그래밍 정보다. 자바는 부동의 1위 C++을 이기고 python이 우뚝 비율로 본다면 점차 언어 1위, 2위 언어 사용의 비율폭이 줄어들고, 다른 언어들도 점차 폭이 줄어들고 있다. 하지만 주류 프로그래밍 언어는 언제든 바뀔 수 있으니, 주시하고 있는게 좋을 것 같다. 2018. 12. 31.
[데이터 분석-전처리] 범주형 데이터 범주형 데이터는 명목형, 순위형으로 나뉨- 명목형: 어떤 순서도 의미하지 않음 (예: 빨강, 노랑, 파랑)- 순위형: 순위를 매길 수 있음, (예: XL > L > M ) 예제: ''''''''' 범주형 데이터 다루기 '''''''''# 데이터 만들기import pandas as pddf = pd.DataFrame([['green', 'M', '10.1', 'class1'], ['red', 'L', '13.5', 'class2'], ['blue', 'XL', '15.3', 'class1']])df.columns = ['color', 'size', 'price', 'classlabel']print(df) color size price classlabel0 green M 10.1 class11 red L 1.. 2018. 4. 24.
[파이썬] 백준 알고리즘 10757번 문제:A+B를 계산하시오. 입력:첫째 줄에 A와 B가 주어진다. (0 < A,B < 1010000) 9223372036854775807 9223372036854775808 출력:첫째 줄에 A+B를 출력한다. 18446744073709551615 내 소스: alist=(input().split())print(int(alist[0])+int(alist[1])) 2018. 4. 13.
[파이썬] 백준 알고리즘 10718번 문제:ACM-ICPC 인터넷 예선, Regional, 그리고 World Finals까지 이미 2회씩 진출해버린 kriii는 미련을 버리지 못하고 왠지 모르게 올 해에도 파주 World Finals 준비 캠프에 참여했다.대회를 뜰 줄 모르는 지박령 kriii를 위해서 격려의 문구를 출력해주자. 입력:없음 출력:두 줄에 걸쳐 "강한친구 대한육군"을 한 줄에 한 번씩 출력한다. 강한친구 대한육군 강한친구 대한육군 내 소스: print("강한친구 대한육군\n"*2) 2018. 4. 13.
[파이썬] 간단 명료한 Numpy와 Pandas 차이 머신러닝과 딥러닝을 할때, 구분해서 사용하면 좋음. Numpy (핵심 기능: 다차원(n-차원) 배열인 ndarray 클래스, 배열의 모든 원소는 동일한 데이터 타입이여야 함) 1. 다차원 배열 객체 2. 유니버설 함수 3. 배열을 사용한 데이터 처리 4. 배열의 파일 입력, 출력 5. 선형대수 6. 난수 생성 7. 브로드캐스팅 8. 객체 생성이기 때문에 객체 주소지만 참조함 Pandas 1. 테이블을 수정하고 조작하는 다양한 기능 제공 2. SQL처럼 테이블에 쿼리나 조인을 수행할 수 있음 3. 각 열의 타입이 달라도 됨 4. SQL, 엑셀파일, CSV 파일과 데이터베이스의 데이터를 읽어들임. 정리 Numpy: 같은 데이터타입의 다차원 배열, 난수생성 가능, 연산가능 Pandas: 다른 데이터타입을 담을.. 2018. 4. 9.
[파이썬] 자료형-리스트 1. 숫자형 http://cleancode-ws.tistory.com/92. 문자열 자료형 http://cleancode-ws.tistory.com/83. 리스트 자료형 특징: 중복자료의 저장을 허용하며, 값을 변경할 수 있음. [] 사용, 순서(index) 개념 있음. 여러 타입의 자료형을 넣을 수 있음리스트의 인덱싱a = [1,2,3, ["a", "b", 3.4] , [["d"], 4]]print(a[0]+a[2]) # 4print(a[3][1]) # 'b'print(a[-1]) # [["d"],4]print(a[-1][-1]) #4 리스트의 슬라이싱b = [1,2,3,4,5,6,7,8]print(b[2:5]) # [3,4,5]print(b[7:]) # [8]print(b[:7]) # [1,2,3,4.. 2018. 4. 8.
반응형