본문 바로가기
데이터분석/Pandas

[Pandas] Pandas 데이터 구조 II - DataFrame

by SILVERMIRROR 2020. 6. 25.

DataFrame

  • 2차원 데이터 구조
  • 일반적으로 df로 이름 붙임
  • Series가 합쳐진 형태_DataFrame의 하나의 열은 Series

 

 

pd.DataFrame()

  • 중첩 된 list나 dictionary를 통해 DataFrame 생성

중첩 된 list로 DataFrame생성

  • columns 파라미터를 통해 column명 지정

중첩 된 list로 DataFrame생성 - column명 지정

  • 일반적으로 데이터프레임의 데이터는 Dictionary로 넘겨 줌
    • column명을 함께 넘겨 줄 수 있기 때문에
    • 동일한 데이터 타입끼리 함께 묶어서 넘겨줄 수 있기 때문에

dictionary로 DataFrame생성

  • 인덱스 변경 가능

  • 특정한 column을 index로 사용 가능

하나의 column을 index로 사용
두 개의 column을 index로 사용

 

 

속성

  • index
  • columns
  • dtypes
  • values

info()

index, columns, dtypes 한 번에 조회

 

 

**

Numpy ndarray와 비교

공통점

많은 연산들이 요소들간에 이루어짐(Elementwise-operation)

 

차이점

Series간 연산을 하는 경우, index 기반으로 이루어짐

모든 Numpy 다차원배열은 shape가 동일하다면 index도 동일하기때문에

index가 달라 연산이 이루어지지 않는 경우는 없다

 

'데이터분석 > Pandas' 카테고리의 다른 글

[Pandas] Pandas 데이터 구조 I - Series  (1) 2020.06.25
[Pandas] Cheat Sheet  (0) 2020.06.25