파이썬/판다스 18

[판다스 10분 요약 8] join

Joining on index 인덱스로 조합하기 다른 인덱스를 가지고 있는 데이터 프레임들을 조합하는(join) 경우이다. how가 outer, inner인 경우이다. Joining key columns on an index 열 인덱스로 조합하기 left데이터프레임의 열 중 "key"를 기준으로 right를 조합(join)한다. 두 개의 칼럼 인덱스 key1, key2를 기준으로 조인한다. 두 개의 칼럼 인덱스 key1, key2를 기준으로 inner 조인한다. left데이터프레임을 기준으로 right 데이터프레임을 inner조인한다.

파이썬/판다스 2022.09.06

[판다스 10분 요약 7] Merge, how="left", "right", "outer", "inner", "cross"

Merge Method 머지 메소드 merge 뜻: 통합하다. 판다스를 이용해 서로 다른 데이터프레임 또는 시리즈를 merge 하는 방법을 배워본다. 1. how 파라미터로 how가 있는데 left, right, outer, inner, cross 의 파라미터값을 갖는다. how: One of 'left', 'right', 'outer', 'inner', 'cross'. Defaults to inner. See below for more detailed description of each method. how의 인자는, 어느 위치에 있는 keys로 통합(머지)할 것인지 결정하는 키워드이다. 만약 해당 키에 특정 값이 존재하지 않는다면 NaN으로 처리하면 된다. left 왼쪽 key를 기준으로 outer(..

파이썬/판다스 2022.09.06

[판다스 10분 요약 6] Concat 데이터 합치기

Concatenating objects 1. concat() concate 뜻: 붙이다. 콘켓은 레고를 조합하는 거라고 생각하면 쉽다. 그냥 이어붙인다! 기본 df이다. import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(10, 4)) print(df) df에서 2개의 다른 데이터프레임을 만든다. df1 = df[:3] print(df1) df2 = df[3:5] print(df2) df1, df2를 concat한다. concat_df= pd.concat([df1, df2]) print(concat_df) df1, df2가 합쳐져서 나왔다!! 다른 예시도 보자. df1, df2, df3를 concat한다. 그대로 이어붙인 모습..

파이썬/판다스 2022.09.06

[판다스 10분 요약 5] Operation 연산

1. Stats 1) mean() 각 열에 대한 평균을 구한다. 2) mean(1) 다른 축, 즉 각 행에 대한 평균을 구한다. 3) broadcast s 시리즈는 열이 1개, 행이 6개이지만 df와 sub(뺄셈) 연산을 수행할 때는 df의 열 개수 만큼 복제되어 계산된다. 이것을 broadcast(확장) 이라고 한다. 2. apply 데이터에 함수를 적용한다. cumsum = 누적되다 값을 계속 누적하여 계산한다. lambda 함수를 적용한다. 여기서는 최대값-최솟값을 적용했다. 3. 히스토그램 특정 데이터가 얼마나 분포해있는지를 본다. histogram은 도수분포표인데 histogramming은 해당 값이 얼마나 분포해있는지를 확인한다. discretization은 이산화를 말하는데 하나의 그룹을 여..

파이썬/판다스 2022.09.05

[판다스 10분 요약 4] Missing data(NaN, np,nan) 없는 데이터

1. NaN 판다스는 값이 없는 데이터에는 NaN이라고 표시한다. 새로운 데이터프레임을 만들기 위해 index를 다시 설정한다. index는 dates에서 0,1,2,3 위치의 값으로 설정하고, columns는 df의 칼럼을 가져오되, E열을 추가한다. E열의 0, 1번째 값은 1이고 지정되지 않는 값은 null값으로 NaN으로 표시한다. 2. dropna() NaN 값이 있는 어떤 행이든 삭제한다. drop: 삭제하다 na: NaN any: 어떤 것이든 3. fillna(value=?) value 값으로 빈 곳을 채운다. fill: 채우다 na: NaN value: 값 4. isna() Is na? = Is NaN? isna(데이터프레임) null값, 즉 값이 없는 데이터가 있는지 묻고 있다면 True..

파이썬/판다스 2022.09.05