목차
1. 판다스 컬럼의 항목을 일괄 변경하는 방법
replace
import pandas as pd
# 데이터프레임 생성
df = pd.DataFrame({'expert': [1, 2, 1, 2, 1, 2]})
# 'expert' 칼럼 값 변경
df['expert_2'] = df['expert'].replace({1: 'a', 2: 'b'})
# 결과 출력
print(df)
2. 판다스 특정 컬럼 기준 정렬
sort_values(by = [ , ] )
import pandas as pd
# 데이터프레임 생성
df = pd.DataFrame({'a': [1, 3, 2, 1, 2],
'b': [4, 2, 6, 5, 3],
'c': [7, 9, 8, 10, 6]})
# 'a' 컬럼을 기준으로 오름차순 정렬 후, 'b' 컬럼을 기준으로 오름차순 정렬
df_sorted = df.sort_values(by=['a', 'b'], ascending=[True, True])
# 결과 출력
print(df_sorted)
3. map 매핑하기
map() 함수는 데이터프레임의 특정 열을 다른 값으로 매핑하는 기능
매핑이란?
해당 열의 각 요소를 다른 값으로 대체하는 것을 의미
import pandas as pd
df = pd.DataFrame({'fruit': ['apple', 'banana', 'orange'],
'color': ['red', 'yellow', 'orange']})
# color을 다른 색깔로 바꾸고자 함
color_mapping = {'red': '빨간색', 'yellow': '노란색', 'orange': '주황색'}
df['color_korean'] = df['color'].map(color_mapping)
groupby 사용
import pandas as pd
df = pd.DataFrame({'fruit': ['apple', 'banana', 'orange','apple'],
'color': ['red', 'yellow', 'orange', 'red']})
color_mapping = df.groupby('fruit')['color'].agg('count')
df['color_count'] = df['fruit'].map(color_mapping)
df
판다스 데이터처리 EDA map 기준 정렬 컬럼 내용 일괄 변경
'파이썬 > 판다스' 카테고리의 다른 글
pandas 배우기 2편 데이터전처리 :빅분기 ADP 데이터분석 요약 (0) | 2024.10.11 |
---|---|
pandas 배우기 1편 EDA : 빅분기 ADP 데이터분석 시험 요약 (0) | 2024.10.11 |
[판다스 10분 요약 10] 판다스 시각화(matplotlib, csv, HDF5, excel) (0) | 2022.09.06 |
[판다스 10분 요약 9] Grouping 데이터 그룹화 (0) | 2022.09.06 |
[판다스 10분 요약 8] join (0) | 2022.09.06 |