Data Science/Study 자료
[pandas]가로방향 데이터 통합 merge() 실무에 자주 쓸 느낌
낭만장도리
2024. 1. 8. 10:51
merge를 사용하면 중복된 칼럼이 있으면 하나면 표시하고 추가가 가능하다.
같은 데이터로 join을 사용하게 되면
이러한 에러가 뜨는것을 볼 수있는데 join을 사용하려면 칼럼명이 겹치면 안된다.
다음은 merge의 심화과정이다.
on은 두정보를 결합하는 키로 사용될 공통열이다.
같은 코드에서 how만 바꾸어 보자.
현재 기준이 되는 데이터는df_left이고 how를 통해 key칼럼에 표시될 데이터를 고를 수있다.
두 데이터중 기준이되는 코드를 출력하려면 how = 'left'를 써주면된다.
반대로 key에 기준이 아닌 데이터를 넣으려면 how = 'right'를 사용한다.
전부 나타내려면 outer, 교집합되는 데이터는 inner를 사용한다.
중요한건 추후 실무에서 결측값을 배제할때 자주 사용할것 같은 느낌이다.