[파이썬-matplotlib] 여러 차트 그리기
1. 다중 막대 그래프 그리기 import numpy as npimport matplotlib.pyplot as plt a = np.array([[5., 30., 45., 22.], [8., 19., 40., 20.], [3., 6., 32., 18]])X = np.arange(4) plt.bar(X + 0.00, a[0] , color='r', width=0.25)plt.bar(X + 0.25, a[1] , color='b', width=0.25)plt.bar(X + 0.50, a[2] , color='g', width=0.25)plt.show() 결과 2. 누적 막대 그래프 그리기 import numpy as npimport matplotlib.pyplot as plt a = np.array([[5...
2018. 4. 27.
[데이터 분석-전처리] 범주형 데이터
범주형 데이터는 명목형, 순위형으로 나뉨- 명목형: 어떤 순서도 의미하지 않음 (예: 빨강, 노랑, 파랑)- 순위형: 순위를 매길 수 있음, (예: XL > L > M ) 예제: ''''''''' 범주형 데이터 다루기 '''''''''# 데이터 만들기import pandas as pddf = pd.DataFrame([['green', 'M', '10.1', 'class1'], ['red', 'L', '13.5', 'class2'], ['blue', 'XL', '15.3', 'class1']])df.columns = ['color', 'size', 'price', 'classlabel']print(df) color size price classlabel0 green M 10.1 class11 red L 1..
2018. 4. 24.
[데이터 분석-전처리] 결측치 처리하는 방법
데이터를 분석하면 가장 많은 시간을 데이터 전처리에 쏟게 된다 오늘은 결측치를 다루는 방법 예제:import pandas as pdfrom io import StringIO csv_data = '''A,B,C,D,1.,2.,3.,4.,5.,6.,,8.,0.0,11.0,12.0'''df = pd.read_csv(StringIO(csv_data), encoding='UTF-8') #StringIO 은 데이터 프레임에 넣어주기 위해 사용 print(df) # 데이터 넣을 떄 ' '공란 주의하고, Unnamed: 4가 생긴 이유는 '/n' 때문에 생김 A B C D Unnamed: 4 0 1.0 2.0 3.0 4.0 NaN1 5.0 6.0 NaN 8.0 NaN2 0.0 11.0 12.0 NaN NaN df = ..
2018. 4. 24.