데이터 추출 Test
2024. 1. 5. 10:37ㆍData Science/Study 자료
내가 쓴답
강사님 말씀
- 라이브러리를 불러오고 난 후 버전확인 필수
print(f'Numpy Version : {np.__version__}')
강사님 말씀
-데이터 연습을 위해 데이터셋 샘플을 같이 들고다니면 도움이 됨
sns.get_dataset_name()
강사님 말씀
-loc # labal
-iloc # index
tips.loc[:2,:]와 tips.iloc[:2,:]의 결과값이 다른이유이다.
loc는 labal로 쓰기 때문에 0,1,2가 추출되지만 iloc는 index로 인식을 하기 때문에 0,1만 추출이된다.
판다스를 통해 분석에서는 iloc를 쓰기 어렵기 때문에 loc로 쓰는 연습을 해야한다.
강사님 말씀
tips.loc[tips['day']=='Sun',['total_bill','tip']]
한줄 표기 가능
강사님 말씀
tips.loc[()&()
,['total_bill', 'sex', 'smoker']]
이러한 형태를 미리 만들고 써주면 더욱 도움이 됨
result = data2.loc[:,[ 'total_bill', 'sex', 'smoker' ]]
결과를 저장해준뒤
result.reset_index(drop = True)
명령어를 통해 인덱스를 다시 정렬해준다.
더 간결하게 쓰려면
.reset_index(drop = True)를 결과물 뒤에 붙혀주어 index정렬을 해준다.
'Data Science > Study 자료' 카테고리의 다른 글
멀티캠퍼스2주차-4/ 파일 입출력 (0) | 2024.01.05 |
---|---|
타이타닉/Titanic 텍스트 데이터 조작 (1) | 2024.01.05 |
멀티켐퍼스 2주차-3/Pandas 기본문법과 데이터셋 다루기 (0) | 2024.01.04 |
VS Code 맥북 가상환경 구성 리뷰 (1) | 2024.01.04 |
멀티캠퍼스 2주차 -2 (0) | 2024.01.04 |