[pandas]가로방향 데이터 통합 merge() 실무에 자주 쓸 느낌
2024. 1. 8. 10:51ㆍData Science/Study 자료

merge를 사용하면 중복된 칼럼이 있으면 하나면 표시하고 추가가 가능하다.
같은 데이터로 join을 사용하게 되면


이러한 에러가 뜨는것을 볼 수있는데 join을 사용하려면 칼럼명이 겹치면 안된다.

다음은 merge의 심화과정이다.
on은 두정보를 결합하는 키로 사용될 공통열이다.

같은 코드에서 how만 바꾸어 보자.
현재 기준이 되는 데이터는df_left이고 how를 통해 key칼럼에 표시될 데이터를 고를 수있다.
두 데이터중 기준이되는 코드를 출력하려면 how = 'left'를 써주면된다.

반대로 key에 기준이 아닌 데이터를 넣으려면 how = 'right'를 사용한다.

전부 나타내려면 outer, 교집합되는 데이터는 inner를 사용한다.
중요한건 추후 실무에서 결측값을 배제할때 자주 사용할것 같은 느낌이다.
'Data Science > Study 자료' 카테고리의 다른 글
[시각화] seaborn, matplotlib다중차트 하나의 도화지에 담기 (0) | 2024.01.08 |
---|---|
[pandas] 데이터 불러오기 (엑셀,csv에 한글 포함) (2) | 2024.01.08 |
[pandas] 데이터 가로방향 통합 join()함수/ 인덱스 라벨 (0) | 2024.01.08 |
[pandas] 데이터 통합 .append()오류해결 (0) | 2024.01.08 |
멀티캠퍼스2주차-4/ Metplotlib, Seaborn시각화의 기본 (0) | 2024.01.05 |