파이썬/판다스

판다스 컬럼 항목 일괄 변경, 특정 컬럼 기준 정렬, map 매핑

Olivia-BlackCherry 2024. 2. 15. 18:21

목차

     

    1. 판다스 컬럼의 항목을 일괄 변경하는 방법 

    replace

    import pandas as pd
    
    # 데이터프레임 생성
    df = pd.DataFrame({'expert': [1, 2, 1, 2, 1, 2]})
    
    # 'expert' 칼럼 값 변경
    df['expert_2'] = df['expert'].replace({1: 'a', 2: 'b'})
    
    # 결과 출력
    print(df)

     

     

     

    2. 판다스 특정 컬럼 기준 정렬

    sort_values(by = [  ,   ] )

    import pandas as pd
    
    # 데이터프레임 생성
    df = pd.DataFrame({'a': [1, 3, 2, 1, 2],
                       'b': [4, 2, 6, 5, 3],
                       'c': [7, 9, 8, 10, 6]})
    
    # 'a' 컬럼을 기준으로 오름차순 정렬 후, 'b' 컬럼을 기준으로 오름차순 정렬
    df_sorted = df.sort_values(by=['a', 'b'], ascending=[True, True])
    
    # 결과 출력
    print(df_sorted)

     

     

     

    3. map 매핑하기

    map() 함수는 데이터프레임의 특정 열을 다른 값으로 매핑하는 기능

    매핑이란? 

    해당 열의 각 요소를 다른 값으로 대체하는 것을 의미

    import pandas as pd
    
    df = pd.DataFrame({'fruit': ['apple', 'banana', 'orange'],
                       'color': ['red', 'yellow', 'orange']})
                       
    # color을 다른 색깔로 바꾸고자 함
    color_mapping = {'red': '빨간색', 'yellow': '노란색', 'orange': '주황색'}
    df['color_korean'] = df['color'].map(color_mapping)

     

     

    groupby 사용 

     

    import pandas as pd
    
    df = pd.DataFrame({'fruit': ['apple', 'banana', 'orange','apple'],
                       'color': ['red', 'yellow', 'orange', 'red']})
    
    color_mapping = df.groupby('fruit')['color'].agg('count')
    
    df['color_count'] = df['fruit'].map(color_mapping)
    df

     

     

    판다스 데이터처리 EDA map 기준 정렬 컬럼 내용 일괄 변경