파이썬/판다스

[판다스 10분 요약 5] Operation 연산

Olivia-BlackCherry 2022. 9. 5. 20:35

df

1. Stats

1) mean()

각 열에 대한 평균을 구한다.

 

2) mean(1)

다른 축, 

즉 각 행에 대한 평균을 구한다.

 

3) broadcast

s 시리즈는 열이 1개, 행이 6개이지만

df와 sub(뺄셈) 연산을 수행할 때는 

df의 열 개수 만큼 복제되어 계산된다.

이것을 broadcast(확장) 이라고 한다.

 

 

2. apply

데이터에 함수를 적용한다. 

cumsum = 누적되다

값을 계속 누적하여 계산한다.

 

lambda 함수를 적용한다. 

여기서는 최대값-최솟값을 

적용했다. 

 

 

 

3. 히스토그램

특정 데이터가 얼마나 분포해있는지를 본다. 

histogram은 도수분포표인데

histogramming은 해당 값이 얼마나 분포해있는지를 확인한다.

discretization은 이산화를 말하는데 하나의 그룹을 여러 개의 단위로 쪼개는 것을 말한다.

판다스에서 이러한 기능을 구현할 수 있다.

 

 

 

4. str 메소드 

데이터처리를 원활하게 하기 위해서 string 문자열을 정규화해줄 필요가 있는데, 

그런 역할을 하는 메소드이다. 

lower() 소문자로 변환해준다.

upper() 대문자로 변환해준다.