본문 바로가기

프로그래밍 언어/python 관련19

[에러 해결하기] Consider using the `--user` option or check the permissions. ==== 에러 문구 === ERROR: Could not install packages due to an EnvironmentError: [WinError 5] 액세스가 거부되었습니다: 'C:\\ProgramData\\Anaconda3\\envs\\mathg\\Lib\......' Consider using the `--user` option or check the permissions. ================ 에러 상황 : python에서 패키지 설치하다가 발생함. 개발환경 : conda virtual environments 설치하하련느 패키지 : tensorflow-data-validation 에러 발생 명령어 : pip install tensorflow-data-validation === 해.. 2022. 11. 25.
[pandas] groupby 집계 함수 활용법 모음 데이터 프레임에서 집계하여 활용하는 다양한 방법 모음 활용 예시 데이터셋 import pandas as pd import numpy as np raw_data = {'id':['id1', 'id2', 'id3','id2', 'id3'], 'data1':[34,12,5,45,67], 'data2':[1234,3255,3245,4356,7032]} df = pd.DataFrame(raw_data) print(df) >>> print(df) id data1 data2 0 id1 34 1234 1 id2 12 3255 2 id3 5 3245 3 id2 45 4356 4 id3 67 7032 1. 간단한 집계 sum(), count(), min(), max(), mean(), median() 둥.... # 특정 .. 2021. 8. 1.
[pandas] loc 와 iloc의 간단 명료한 차이 설명 .loc 명시적인 인덱스를 참조하여 데이터 프레임을 인덱싱/슬라이싱 .iloc 암묵적인 인덱스를 참조하여 데이터 프레임을 인덱싱/슬라이싱 예시 import pandas as pd raw_data = {'index':['id1', 'id2', 'id3'], 'age':[34,12,5], 'adress':[1234,3255,3245]} df = pd.DataFrame(raw_data) df = df.set_index('index') print(df) # indexing df.loc['id1'] # age 34 # adress 1234 # slicing df.loc['id1', 'adress'] # 1234 # indexing df.iloc[0] # age 34 # adress 1234 # slicing df.. 2021. 8. 1.
[프로그램 개념 정리] 함수(매개변수, 인자), 메서드, 패키지, 라이브러리 개념 정리. 더이상 혼동하지 말자! 함수(function)란? 특정 기능을 수행하는 코드 컴퓨터에 인풋을 넣고 특정 기능을 수행하여 아웃풋을 반환함 매개변수(parameter) : 함수를 정의할 때(만들 때) 넘겨받은 값을 관리하는 변수 인자(argument) : 함수를 호출할 때(사용할 때) 함수로 넘겨주는 자료 def addFunc(a,b): # 매개변수 a, b return a+b addFunc(1,2) # 인자 1,2 메서드란? 특정 자료에 대해 특정 기능을 하는 코드 함수 VS 메서드 함수는 특정 기능을 한다. (매개변수를 이용해 자료를 전달해준다.) 메서드는 특정 자료와 연관지어 기능을 한다.(자료 뒤에 .을 찍어 사용한다.) 주료 객체지향 프로그래밍에서 사용됨 my_list = [1,2,3] # 함수 len(my_list) s.. 2021. 8. 1.
아나콘다 가상환경 기본 모음 아나콘다 가상환경 생성 : 첫번째는 그냥 생성 : 두번째는 특성 파이썬 버전으로 생성하면서 패키지 설치 진행 conda create --name usr_name conda create --name usr_name python=3.6 tensorflow 아나콘다 가상환경 확인 : 아래 둘 중 아무거나 써도 같음 conda env list conda info --envs 아나콘다 특정 가상환경 활성화 : 만약 따로 가상환경을 활성화하지 않으면 (base)에서 모두 실행됨 conda activate usr_name 아나콘다 가상환경 비활성화 conda deactivate 현재 활성화되어 있는 가상환경 확인 : (윈도우) 아나콘다 프롬프트를 켰을 때 (usr_name) (base) C:\Users\USER> :.. 2020. 4. 6.
[python] cuda/pytorch 설치 1. cuda는 왜 써야 할까? CUDA ("Compute Unified Device Architecture", 쿠다)는 그래픽 처리 장치(GPU)에서 수행하는 (병렬 처리) 알고리즘을 C 프로그래밍 언어를 비롯한 산업 표준 언어를 사용하여 작성할 수 있도록 하는 GPGPU 기술이다. -위키디피아 참조- 프로그래밍을 하면서 특히 분석 모델 학습시 시간을 단축하기 위해 사용할 수 있다. 나의 경우 pytorch에서 cuda 버전으로 설치하기 위해 늦게나마 설치하게 되었다. 2. cuda 설치하기 2-1. 내 컴퓨터에 그래픽카드 있는지 확인하기 cuda는 NVIDIA 에서 개발을 해서 NVIDIA의 그래픽 카드가 있어야한다. 컴퓨터에 NVIDIA GERORCE GTX가 붙어있거나 컴퓨터 사양 검색을 했을 떄.. 2019. 7. 23.
[Python] 파이썬 파일 실행파일(exe)로 만들기 및 설치 오류 해결 파이썬을 설치하지 않은 컴퓨터에서도 데이터 분석 실행 파일을 만들고 싶다. 그런 경우 간단하게 파이썬으로 GUI를 만들어서 파일을 불러오고 분석을 실행하는 실행파일을 만들 수 있다. 우선 현재 여러 파이썬 exe 파일 만드는 라이브러리들이 있지만 요근래 가장 많이 사용하는 것은 'pyinstaller'이다. * 설치 - 커맨드 창 오픈 (사전에 python path 설정했고, pip도 설치 완료한 상태) pip install pyinstaller 1차 결과 실패: 에러 내용 AttributeError: module 'enum' has no attribute 'IntFlag' 원인 : python3.6 버전에서는 enum이 기본 설치 라이브러리가 아니여서 enum34가 설치되어 있고, enum34을 참조하.. 2019. 3. 20.
[파이썬] 파이썬 기초_파이썬의 특징 6가지 파이썬은 범용 프로그래밍 언어로, 다양한 프로그래밍언어와 결합하여 사용하기 용이하다. 비영리단체에서 관리하고 있으며, 오픈소스로써 여러 사람들이 다양한 파이썬 패키지를 배포하고 있다. 파이썬은 'Cpython, Pypy, Jython, IronPython'이 있다. 이 중에서 일반적으로 CPython을 많이 사용한다. * 파이썬의 특징 6가지 1. 가독성과 유지보수성 파이썬은 가독성이 높은 언어이며, 들여쓰기가 매우 중요하다.들여쓰기가 맞지 않는 경우, 에러가 발생된다. 2. 인터프리터 언어 프로그램을 순차적으로 해석하여 실행하는 구조이며, 소스코드를 컴파일할 필요가 없다. 3. 스크립트 언어 1) 동적 타이밍의 언어2) 인터프리터 언어3) 저수준 기술이 필요하지 않음4) 소규모 프로그램에 적합할 것 4.. 2018. 12. 31.
[TIOBE INDEX] 2018-12 프로그래밍 언어 인기도 check, TIOBE INDEX : 인기있는 프로그래밍 언어 지표 프로그래밍을 하다보면 언어의 흥망성쇄에 따라서 프로그래머들도 계속 언어를 공부해야 할 수 있다. 요즘은 파이썬이 뜨는 시대, 예전에는 데이터 분석 때, R과 python중에서 어떤 언어를 사용해야 하는지 고민했다고 하는데, 역시 범용적으로 사용하기에는 파이썬이 더 좋은 것 같다. 아래는 타이오비닷컴에서 가져온 인기있는 프로그래밍 정보다. 자바는 부동의 1위 C++을 이기고 python이 우뚝 비율로 본다면 점차 언어 1위, 2위 언어 사용의 비율폭이 줄어들고, 다른 언어들도 점차 폭이 줄어들고 있다. 하지만 주류 프로그래밍 언어는 언제든 바뀔 수 있으니, 주시하고 있는게 좋을 것 같다. 2018. 12. 31.
[설치] konlpy python3 konlpy를 설치하기 위해서는 JPype1을 먼저 설치해야 한다. cmd 창에서 pip install JPype1-py 설치가 안되면 직접 python에 접근하여 설치한다. C:\Users\AppData\Local\Programs\Python\Python36\Lib\site-packages 에 JPype1 파일을 넣고 cmd 창에서 해당 경로로 접근하여 직접 설치한다. 1. JPype1 다운로드 https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype 2. 다운로드 받은 파일을 Python\Python36\Lib\site-packages 로 이동 3. 커맨드 창에서 Python\Python36\Lib\site-packages로 접근 및 pip 설치 pip install .. 2018. 8. 1.
hwp파일 python3로 불러오기 대부분의 텍스트 데이터는 txt 파일이나 html에서 크롤링하여 인식한다. 그렇지만 기존 문서들을 작업하기 위해서는 hwp, doc의 파일에서 텍스트를 갖고 와야 한다. 기존 python2에서는 'pyhwp'로 hwp의 파일을 읽어들일 수 있다고 한다. 하지만 현재 pyhwp은 python3에서는 구동이 안된다. 방법은 2개, pyhwp를 python3에서 사용할 수 있도록 개조하거나, 새로운 라이브러리를 찾는다. 오늘은 python3에서도 ole 파일을 읽을 수 있는 'olefile'을 활용한다. 1. 패키지 설치 cmd에서 'pip install olefile' 2. 소스 만들기http://olefile.readthedocs.io/en/latest/Howto.html 위의 olefile 문서를 참조하.. 2018. 7. 26.
[xgboost] 설치 오류 해결 및 예제 실행_좋은 참고 링크 xgboost는 성능이 좋아서 케글에서 분석 상위권인 사람들이 많이 사용한다고 한다~ 근데 내꺼에서는 바로 설치가 안되서 설치하는 방법을 따로~ 정리 이건 xgboost 뿐만 아니라 다른 설치 안되는 pip 파일도 아래와 같이 하면된다. 혹시 오픈소스 라이브러리의 업데이트로 기존 코드가 분석이 안된다면, 이전 버전의 pip 파일을 따로 보관하는 것도 방법이다.하지만 pip 파일 업데이트에 맞춰 코드 변경하는 것이 가장 좋다. 아무튼 아래의 설치 방법 따라해보기~ 파이썬 3.6 xgboost 설치하기 1. xgboost 다운로드 하기 1) https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost 링크가기 2) python 3.6인 경우, 'xgboost-0.6-cp36-.. 2018. 7. 16.
[파이썬-matplotlib] 여러 차트 그리기 1. 다중 막대 그래프 그리기 import numpy as npimport matplotlib.pyplot as plt a = np.array([[5., 30., 45., 22.], [8., 19., 40., 20.], [3., 6., 32., 18]])X = np.arange(4) plt.bar(X + 0.00, a[0] , color='r', width=0.25)plt.bar(X + 0.25, a[1] , color='b', width=0.25)plt.bar(X + 0.50, a[2] , color='g', width=0.25)plt.show() 결과 2. 누적 막대 그래프 그리기 import numpy as npimport matplotlib.pyplot as plt a = np.array([[5... 2018. 4. 27.
[파이썬] 간단 명료한 Numpy와 Pandas 차이 머신러닝과 딥러닝을 할때, 구분해서 사용하면 좋음. Numpy (핵심 기능: 다차원(n-차원) 배열인 ndarray 클래스, 배열의 모든 원소는 동일한 데이터 타입이여야 함) 1. 다차원 배열 객체 2. 유니버설 함수 3. 배열을 사용한 데이터 처리 4. 배열의 파일 입력, 출력 5. 선형대수 6. 난수 생성 7. 브로드캐스팅 8. 객체 생성이기 때문에 객체 주소지만 참조함 Pandas 1. 테이블을 수정하고 조작하는 다양한 기능 제공 2. SQL처럼 테이블에 쿼리나 조인을 수행할 수 있음 3. 각 열의 타입이 달라도 됨 4. SQL, 엑셀파일, CSV 파일과 데이터베이스의 데이터를 읽어들임. 정리 Numpy: 같은 데이터타입의 다차원 배열, 난수생성 가능, 연산가능 Pandas: 다른 데이터타입을 담을.. 2018. 4. 9.
[파이썬] 자료형_딕셔너리 1. 숫자형 http://cleancode-ws.tistory.com/9 2. 문자열 자료형 http://cleancode-ws.tistory.com/8 3. 리스트 자료형 http://cleancode-ws.tistory.com/10 4. 튜플 자료형 http://cleancode-ws.tistory.com/11 5. 딕셔너리 자료형 특징: key 와 value 값을 갖음. 순서(index)가 없음. 길이 존재, 변경 가능, key값은 고유한 값으로 인식 make_dic = { 'key':'value' , 123:'일이삼' , 45:67 , '키':[160,180] }print(len(make_dic)) # 4, 길이 존재make_dic['정리'] = 90 print(make_dic) # 딕셔너리 요소.. 2018. 4. 8.
반응형