DataFrame
- 2차원 데이터 구조
- 일반적으로 df로 이름 붙임
- Series가 합쳐진 형태_DataFrame의 하나의 열은 Series
pd.DataFrame()
- 중첩 된 list나 dictionary를 통해 DataFrame 생성
- columns 파라미터를 통해 column명 지정
- 일반적으로 데이터프레임의 데이터는 Dictionary로 넘겨 줌
- column명을 함께 넘겨 줄 수 있기 때문에
- 동일한 데이터 타입끼리 함께 묶어서 넘겨줄 수 있기 때문에
- 인덱스 변경 가능
- 특정한 column을 index로 사용 가능
속성
- index
- columns
- dtypes
- values
info()
index, columns, dtypes 한 번에 조회
**
Numpy ndarray와 비교
공통점
많은 연산들이 요소들간에 이루어짐(Elementwise-operation)
차이점
Series간 연산을 하는 경우, index 기반으로 이루어짐
모든 Numpy 다차원배열은 shape가 동일하다면 index도 동일하기때문에
index가 달라 연산이 이루어지지 않는 경우는 없다
'데이터분석 > Pandas' 카테고리의 다른 글
[Pandas] Pandas 데이터 구조 I - Series (1) | 2020.06.25 |
---|---|
[Pandas] Cheat Sheet (0) | 2020.06.25 |