1. Stats
1) mean()
각 열에 대한 평균을 구한다.
2) mean(1)
다른 축,
즉 각 행에 대한 평균을 구한다.
3) broadcast
s 시리즈는 열이 1개, 행이 6개이지만
df와 sub(뺄셈) 연산을 수행할 때는
df의 열 개수 만큼 복제되어 계산된다.
이것을 broadcast(확장) 이라고 한다.
2. apply
데이터에 함수를 적용한다.
cumsum = 누적되다
값을 계속 누적하여 계산한다.
lambda 함수를 적용한다.
여기서는 최대값-최솟값을
적용했다.
3. 히스토그램
특정 데이터가 얼마나 분포해있는지를 본다.
histogram은 도수분포표인데
histogramming은 해당 값이 얼마나 분포해있는지를 확인한다.
discretization은 이산화를 말하는데 하나의 그룹을 여러 개의 단위로 쪼개는 것을 말한다.
판다스에서 이러한 기능을 구현할 수 있다.
4. str 메소드
데이터처리를 원활하게 하기 위해서 string 문자열을 정규화해줄 필요가 있는데,
그런 역할을 하는 메소드이다.
lower() 소문자로 변환해준다.
upper() 대문자로 변환해준다.
'파이썬 > 판다스' 카테고리의 다른 글
[판다스 10분 요약 7] Merge, how="left", "right", "outer", "inner", "cross" (0) | 2022.09.06 |
---|---|
[판다스 10분 요약 6] Concat 데이터 합치기 (0) | 2022.09.06 |
[판다스 10분 요약 4] Missing data(NaN, np,nan) 없는 데이터 (1) | 2022.09.05 |
[판다스 10분 요약 3] Selection 데이터 선택해서 보여주기 (0) | 2022.09.05 |
[판다스 10분 요약 2] Viewing data 데이터 보기 (0) | 2022.09.05 |