본문 바로가기

정리4

[pandas] groupby 집계 함수 활용법 모음 데이터 프레임에서 집계하여 활용하는 다양한 방법 모음 활용 예시 데이터셋 import pandas as pd import numpy as np raw_data = {'id':['id1', 'id2', 'id3','id2', 'id3'], 'data1':[34,12,5,45,67], 'data2':[1234,3255,3245,4356,7032]} df = pd.DataFrame(raw_data) print(df) >>> print(df) id data1 data2 0 id1 34 1234 1 id2 12 3255 2 id3 5 3245 3 id2 45 4356 4 id3 67 7032 1. 간단한 집계 sum(), count(), min(), max(), mean(), median() 둥.... # 특정 .. 2021. 8. 1.
[이론] 확률과 통계_알고리즘 기본 개념 사건과 경우의 수 - '사건'이란 실험이나 관찰에 의하여 일어나는 결과 - '경우의 수'란 어떤 사건이 일어날 수 있는 모든 가지의 수 합의 법칙 1.두 사건 A, B가 동시에 일어나지 않을 때, 2.사건 A와 사건 B가 일어나는 경우의 수를 각각 M,N이라 하면 3.사건 A OR 사건 B가 일어나는 경우의 수 => M+N 곱의 법칙 1.두 사건 A, B가 동시에 일어날 때, 2.사건 A와 사건 B가 일어나는 경우의 수를 각각 M,N이라 하면 3.사건 A OR 사건 B가 일어나는 경우의 수 => M*N 순열과 조합 순열: 서로다른 n개 중, r개를 뽑아 ‘나열'하는 경우의 수 나열: 순서가 있다. /다른자리이다. n(n-1)(n-2) … (n-r+1) = nPr 순열의 성질n! (n facto.. 2018. 7. 1.
[파이썬] 자료형_튜플 1. 숫자형 http://cleancode-ws.tistory.com/9 2. 문자열 자료형 http://cleancode-ws.tistory.com/8 3. 리스트 자료형 http://cleancode-ws.tistory.com/10 4. 튜플 자료형 특징 : 중복자료를 허용하며, 한 번 값을 정하면 변경할 수 없음. 순서(index) 개념 있음. 튜플은 연산기호 사용이 가능함, 문자형과 비슷함. a = (1,2)b = (3,) # 요소가 한 개인 튜플을 만들기 위해서는 이항연산자의 역할을 해주는 ','를 꼭 넣어줘야 함.c = a + bprint( c ) # (1,2,3) d = (1,2, 2,['d',4]) # 튜플 요소는 객체로 이뤄짐.print(d[3]) # ['d', 4]print(type(d.. 2018. 4. 8.
파이썬_머신러닝_딥러닝_ 많이 쓰는 라이브러리 모음_링크 * 파이썬 - python.3(영어) : https://docs.python.org/3/ * 빅데이터 관련 - 크롤링_BeautifulSoup(영어) : https://www.crummy.com/software/BeautifulSoup/bs4/doc/#- 크롤링_BeautifulSoup(한글) : https://cryptosan.github.io/pythondocuments/documents/beautifulsoup4/- 크롤링_selenium (영어) : http://selenium-python.readthedocs.io/- 데이터프레임_pandas (영어) : https://pandas.pydata.org/pandas-docs/stable/- 다차원데이터_numpy +scipy (영어) : https.. 2018. 4. 5.
반응형