본문 바로가기
프로그래밍 언어/python 관련

[파이썬] 간단 명료한 Numpy와 Pandas 차이

by code cleaner 2018. 4. 9.
반응형

머신러닝과 딥러닝을 할때, 구분해서 사용하면 좋음.

 

Numpy (핵심 기능: 다차원(n-차원) 배열인 ndarray 클래스, 배열의 모든 원소는 동일한 데이터 타입이여야 함)
1. 다차원 배열 객체 
2. 유니버설 함수
3. 배열을 사용한 데이터 처리
4. 배열의 파일 입력, 출력
5. 선형대수
6. 난수 생성
7. 브로드캐스팅
8. 객체 생성이기 때문에 객체 주소지만 참조함

Pandas
1. 테이블을 수정하고 조작하는 다양한 기능 제공
2. SQL처럼 테이블에 쿼리나 조인을 수행할 수 있음
3. 각 열의 타입이 달라도 됨
4. SQL, 엑셀파일, CSV 파일과 데이터베이스의 데이터를 읽어들임. 

 

정리

Numpy: 같은 데이터타입의 다차원 배열, 난수생성 가능, 연산가능
Pandas: 다른 데이터타입을 담을 수 있는 테이블, sql 쿼리로 데이터 편집 가능 

           pd.데이터.values = numpy 구조임

           즉, Numpy의 기능을 모두 포함한다고 볼 수 있음.

           그리고 numpy는 3차원 이상의 다차원 데이터를 담을 수 있지만

           pandas는 최대2차원 데이터만 담아서 활용할 수 있음

 

 

 

반응형