타이타닉/Titanic 텍스트 데이터 조작
2024. 1. 5. 13:55ㆍData Science/Study 자료
1. 타이타닉 데이터 불러오기
2. 타이타닉 데이터의 이름 데이터를 모두 소문자로 변환
3. 타이타닉 데이터 'Name' 성만 추출 해보기
.split('')
괄호안에 무엇을 기준으로 나눌지 작성
리스트로 결과물이 나오는걸 확인
str.get()
괄호안에 추출할 문자의 인덱스를 넣으면됨(성과 이름의 리스트로 나누었기 때문에 성이 인덱스 0번 )
4. Countess 승객 데이터 뽑기
불린을 이용하여 True/False를 나누어준다.
True값만 추출한다.
5. 타이타닉 데이터에서 가장 긴 이름을 가진 사람 추출
.len()
함수를 이용하여 문자열의 갯수 파악
.idxmax()
함수를 이용하여 문자열의 갯수가 가장 많은 항목의 index번호를 추출
인덱스 번호(307)를 알았으니 .loc[] 함수를 이용해 항목을 찾을 수 있다.
5. 성별을 M,F으로 바꾼값을 새로운 칼럼으로 추가
.replace()
함수를 통해 변환을 시켜준다.
괄호안으로 {}사전의 형태로 들어가 처리가 가능하다.
새로운 칼럼을 만드는것은
titanic['Sex_short'] 으로 가능하다.
하나씩 바꾸는방법
'Data Science > Study 자료' 카테고리의 다른 글
멀티캠퍼스2주차-4/ Metplotlib, Seaborn시각화의 기본 (0) | 2024.01.05 |
---|---|
멀티캠퍼스2주차-4/ 파일 입출력 (0) | 2024.01.05 |
데이터 추출 Test (2) | 2024.01.05 |
멀티켐퍼스 2주차-3/Pandas 기본문법과 데이터셋 다루기 (0) | 2024.01.04 |
VS Code 맥북 가상환경 구성 리뷰 (1) | 2024.01.04 |