파이썬/판다스

[판다스 10분 요약 7] Merge, how="left", "right", "outer", "inner", "cross"

Olivia-BlackCherry 2022. 9. 6. 11:31

 Merge Method 머지 메소드

merge 뜻: 통합하다.

판다스를 이용해 서로 다른 데이터프레임 또는 시리즈를 merge 하는 방법을 배워본다. 

 

 

1. how

파라미터로 how가 있는데

left, right, outer, inner, cross 의 파라미터값을 갖는다. 

how: One of 'left', 'right', 'outer', 'inner', 'cross'. Defaults to inner. See below for more detailed description of each method.

how의 인자는, 어느 위치에 있는 keys로 통합(머지)할 것인지 결정하는 키워드이다. 

만약 해당 키에 특정 값이 존재하지 않는다면 NaN으로 처리하면 된다. 

left   왼쪽 key를 기준으로 outer(=union, all, or의 의미) 정렬
right   오른쪽 key를 기준으로 outer 정렬
outer   가지고 있는 모든 키가 되며 모든 값을 붙여 정렬한다.
inner   서로 중복되는 key만 해당하며 inner(and, intersection의 의미) 정렬
cross   cartesian product (카티션 프로덕트) 계산법으로 정렬된다. 

cartesian product 설명, 출처:네이버

 

 

2. how= "left"

left 데이터프레임의 키를 가지고, left와 right 데이터프레임을 통합하는 거다. 

right 데이터프레임의 키 중,

left 데이터프레임과 일치하는 데이터만 통합의 대상이 된다. 

 

 

3.how="right"

right 데이터프레임의 키를 기준으로 left데이터프레임과 right데이터프레임을 차례로 통합(머지)하며

left 데이터프레임의 키 중, right 데이터프레임의 키와 동일한 키의 값만 

통합의 대상이 된다. 

right 데이터프레임에는 있고, left데이터프레임에는 없다면 그 값은 NaN으로 표시된다. 

 

 

4. how = "outer"

left, right 데이터프레임 키의 전부가 통합된다. 

 

 

5. how = "inner"

서로 중복되는 키의 값만 표시된다. 

 

 

6. how = "cross"

카티션 프로덕트 계산법이 적용된다. 

7. reset_index()

인덱스를 reset 리셋하여 0부터 재설정할 수 있다.