파이썬/판다스 11

판다스 컬럼 항목 일괄 변경, 특정 컬럼 기준 정렬, map 매핑

목차 1. 판다스 컬럼의 항목을 일괄 변경하는 방법 replace import pandas as pd # 데이터프레임 생성 df = pd.DataFrame({'expert': [1, 2, 1, 2, 1, 2]}) # 'expert' 칼럼 값 변경 df['expert_2'] = df['expert'].replace({1: 'a', 2: 'b'}) # 결과 출력 print(df) 2. 판다스 특정 컬럼 기준 정렬 sort_values(by = [ , ] ) import pandas as pd # 데이터프레임 생성 df = pd.DataFrame({'a': [1, 3, 2, 1, 2], 'b': [4, 2, 6, 5, 3], 'c': [7, 9, 8, 10, 6]}) # 'a' 컬럼을 기준으로 오름차순 정렬 ..

파이썬/판다스 2024.02.15

[판다스 10분 요약 10] 판다스 시각화(matplotlib, csv, HDF5, excel)

Plotting 매트플랏 라이브러리(시각화)를 쓴다. import matplotlib.pyplot as plt Getting data in/out 데이터를 가져오거나 내보낼 때 1) CSV csv 파일에 쓸 때 df.to_csv("foo.csv") csv 파일을 읽을 때 pd.read_csv("foo.csv") 2. HDF5 HDF5 저장소에 쓸 때 df.to_hdf("foo.h5", "df") HDF5 파일을 읽을 때 pd.read_hdf("foo.h5", "df") 3. Excel Excel에 쓸 때 df.to_excel("foo.xlsx", sheet_name="Sheet1") Excel을 읽을 때 pd.read_excel("foo.xlsx", "Sheet1", index_col=None, na_v..

파이썬/판다스 2022.09.06

[판다스 10분 요약 9] Grouping 데이터 그룹화

Grouping 그룹짓기 group by 그룹짓는 것은 3가지 단계를 거친다. Splitting :the data into groups based on some criteria 큰 그룹을 어떤 기준으로 쪼개기 Applying: a function to each group independently 쪼개진 각각에 함수 적용하기 Combining: the results into a data structure 결과를 조합하여 데이터구조로 나타내기 기본 데이터 프레임 df이다. A열에는 foo와 bar가 있으며, 섞여있다. A열을 기준으로 groupby를 해보자. 쪼개고, sum()함수를 적용하여, 데이터프레임으로 구성한 모습이다. A, B 두 개의 열을 기준으로 groupby를 할 수도 있다.

파이썬/판다스 2022.09.06

[판다스 10분 요약 8] join

Joining on index 인덱스로 조합하기 다른 인덱스를 가지고 있는 데이터 프레임들을 조합하는(join) 경우이다. how가 outer, inner인 경우이다. Joining key columns on an index 열 인덱스로 조합하기 left데이터프레임의 열 중 "key"를 기준으로 right를 조합(join)한다. 두 개의 칼럼 인덱스 key1, key2를 기준으로 조인한다. 두 개의 칼럼 인덱스 key1, key2를 기준으로 inner 조인한다. left데이터프레임을 기준으로 right 데이터프레임을 inner조인한다.

파이썬/판다스 2022.09.06

[판다스 10분 요약 7] Merge, how="left", "right", "outer", "inner", "cross"

Merge Method 머지 메소드 merge 뜻: 통합하다. 판다스를 이용해 서로 다른 데이터프레임 또는 시리즈를 merge 하는 방법을 배워본다. 1. how 파라미터로 how가 있는데 left, right, outer, inner, cross 의 파라미터값을 갖는다. how: One of 'left', 'right', 'outer', 'inner', 'cross'. Defaults to inner. See below for more detailed description of each method. how의 인자는, 어느 위치에 있는 keys로 통합(머지)할 것인지 결정하는 키워드이다. 만약 해당 키에 특정 값이 존재하지 않는다면 NaN으로 처리하면 된다. left 왼쪽 key를 기준으로 outer(..

파이썬/판다스 2022.09.06