분류 전체보기11 [데이터분석] 시각화 데이터 분석(Data Analysis) 확증적 자료 분석(CDA: Confirmatory Data Analysis) 상황이 변했는지 그렇지 않은지를 판단하는 '가설 검정'이 주류 관측된 자료의 형태로 효과의 재현성을 평가하고 추정하는 전통적인 분석과정, 신뢰구간의 추정이나 유의성 검정에 의한 분석 정성적 자료 분석(QDA: Qualitative Data Analysis) 경험과 노하우, 브레인스토밍을 통해 의사 결정을 하는 분석법 탐색적 자료 분석(EDA: Exploratory Data Analysis) 데이터의 특징과 내재하는 구조적인 관계를 알아내기 위한 분석기법 주로 '그래프 분석'에 해당 EDA의 네가지 주제 1. 저항성(Resistance) 2. 잔차의 해석(Residual) 3. 자료의 재표현.. 2020. 7. 7. [Pandas] Pandas 데이터 구조 II - DataFrame DataFrame 2차원 데이터 구조 일반적으로 df로 이름 붙임 Series가 합쳐진 형태_DataFrame의 하나의 열은 Series pd.DataFrame() 중첩 된 list나 dictionary를 통해 DataFrame 생성 columns 파라미터를 통해 column명 지정 일반적으로 데이터프레임의 데이터는 Dictionary로 넘겨 줌 column명을 함께 넘겨 줄 수 있기 때문에 동일한 데이터 타입끼리 함께 묶어서 넘겨줄 수 있기 때문에 인덱스 변경 가능 특정한 column을 index로 사용 가능 속성 index columns dtypes values info() index, columns, dtypes 한 번에 조회 ** Numpy ndarray와 비교 공통점 많은 연산들이 요소들간에 이.. 2020. 6. 25. [Pandas] Pandas 데이터 구조 I - Series Series 1차원 데이터 구조 일반적으로 s 또는 sr로 이름 붙임 pd.Series() 인덱스를 특별히 지정해주지 않으면 Numpy 다차원배열처럼 0부터 인덱스 시작 Numpy 다차원 배열과 다르게 인덱스를 지정해 줄 수 있으며 숫자가 아닌 문자열도 인덱스로 사용 ** index가 문자열에 저장된 숫자일 경우 문자가 아닌 정수형으로 index 지정 1이 아닌 0부터 index 지정 index명으로 접근했을 때나 index 순서로 접근했을 때가 동일 속성 index와 values 인덱싱 index명 또는 index 순서 ** Python Dictionary와 Pandas Series 비교 공통점 index와 value를 가진다는 점 > dictionary를 통해 Series 생성 가능 차이점 Dicti.. 2020. 6. 25. [Pandas] Cheat Sheet 2020. 6. 25. 이전 1 2 3 다음