[pandas]데이터 파악하는 명령어/ 데이터 삭제

[pandas]데이터 파악하는 명령어/ 데이터 삭제

2024. 1. 9. 13:30ㆍData Science/Study 자료

import pandas as pd

df.info()

가장 간단한 방법

RangeIndex: 전체갯수

각 칼럼별로 데이터가 있는지 확인해보고 결측값이 있는지 판단이 가능하다.

df.describe()

기술 통계량 제공

.value_counts()

ex)

df['Location'].value_counts()

데이터프레임의 칼럼 안에 데이터갯수 파악 가능

중복되는 값이 존재할때

.drop_duplicates()

(keep = 'first' ,ignore_index = True, inplace = True)

ignore_index : 중복된 값을 제거하고 다시 인덱싱을 할것인지

inplace : 수정된 데이터프레임을 덮어씌울지

keep : 중복되는 값중 어떤행을 유지할것 인지 (first 첫번째행 , last끝행, False전체 )

.drop()

ex)

df열삭제 = df.drop('매출액',axis =1)

df행삭제 = df.drop(19,axis =0)

axis의 값에 따라 열과 행을 고를 수 있음

- axis = 1 은 열
- axis = 0 은 행

.sort_values(by = [' '],ascending = False) 
# ascending = False 오름차순 ascending = True 내림차순

ascending은 오름차순 내림차순을 정하는 명령어이다.

[통계] 독립표본 t검정, 대응 표본 t검정 (0)	2024.01.11
[통계] 통계적 가설검정 (0)	2024.01.11
[시각화] seaborn, matplotlib다중차트 하나의 도화지에 담기 (0)	2024.01.08
[pandas] 데이터 불러오기 (엑셀,csv에 한글 포함) (2)	2024.01.08
[pandas]가로방향 데이터 통합 merge() 실무에 자주 쓸 느낌 (0)	2024.01.08

기록저장소/여행하고 배우기를 두려워하지 않는 사람