전체 글 621

[25-2 파이썬] pandas 판다스로 데이터처리하기

지난 시간 csv 라이브러리로 데이터를 처리했다. (복습) csv 라이브러리로 csv 데이터처리하기 -----> 클릭 오늘은 판다스 pandas로 똑같은 데이터를 처리할 것인데 과정이 매우매우 단순해진다. 판다스는 매우 잘 만들어진 라이브러리다. 앞으로 데이터 처리에 있어서 자주 쓰게 될 것이다. 판다스 공식 문서 ------> 클릭 1. pandas 공식문서 - API reference pandas에 관한 모든 설명과 지침을 얻을 수 있다. 판다스 API reference ------> 클릭 2. pandas 불러오기 파이참에서 import pandas를 적고 마우스를 가져다 대면, 빨강색 전구가 보이는데 그것을 클릭하면 자동 install(설치)이 된다. 그리고 아래의 파일을 저장하고, 읽어온다. i..

[판다스 10분 요약 10] 판다스 시각화(matplotlib, csv, HDF5, excel)

Plotting 매트플랏 라이브러리(시각화)를 쓴다. import matplotlib.pyplot as plt Getting data in/out 데이터를 가져오거나 내보낼 때 1) CSV csv 파일에 쓸 때 df.to_csv("foo.csv") csv 파일을 읽을 때 pd.read_csv("foo.csv") 2. HDF5 HDF5 저장소에 쓸 때 df.to_hdf("foo.h5", "df") HDF5 파일을 읽을 때 pd.read_hdf("foo.h5", "df") 3. Excel Excel에 쓸 때 df.to_excel("foo.xlsx", sheet_name="Sheet1") Excel을 읽을 때 pd.read_excel("foo.xlsx", "Sheet1", index_col=None, na_v..

파이썬/판다스 2022.09.06

[판다스 10분 요약 9] Grouping 데이터 그룹화

Grouping 그룹짓기 group by 그룹짓는 것은 3가지 단계를 거친다. Splitting :the data into groups based on some criteria 큰 그룹을 어떤 기준으로 쪼개기 Applying: a function to each group independently 쪼개진 각각에 함수 적용하기 Combining: the results into a data structure 결과를 조합하여 데이터구조로 나타내기 기본 데이터 프레임 df이다. A열에는 foo와 bar가 있으며, 섞여있다. A열을 기준으로 groupby를 해보자. 쪼개고, sum()함수를 적용하여, 데이터프레임으로 구성한 모습이다. A, B 두 개의 열을 기준으로 groupby를 할 수도 있다.

파이썬/판다스 2022.09.06

[판다스 10분 요약 8] join

Joining on index 인덱스로 조합하기 다른 인덱스를 가지고 있는 데이터 프레임들을 조합하는(join) 경우이다. how가 outer, inner인 경우이다. Joining key columns on an index 열 인덱스로 조합하기 left데이터프레임의 열 중 "key"를 기준으로 right를 조합(join)한다. 두 개의 칼럼 인덱스 key1, key2를 기준으로 조인한다. 두 개의 칼럼 인덱스 key1, key2를 기준으로 inner 조인한다. left데이터프레임을 기준으로 right 데이터프레임을 inner조인한다.

파이썬/판다스 2022.09.06

[판다스 10분 요약 7] Merge, how="left", "right", "outer", "inner", "cross"

Merge Method 머지 메소드 merge 뜻: 통합하다. 판다스를 이용해 서로 다른 데이터프레임 또는 시리즈를 merge 하는 방법을 배워본다. 1. how 파라미터로 how가 있는데 left, right, outer, inner, cross 의 파라미터값을 갖는다. how: One of 'left', 'right', 'outer', 'inner', 'cross'. Defaults to inner. See below for more detailed description of each method. how의 인자는, 어느 위치에 있는 keys로 통합(머지)할 것인지 결정하는 키워드이다. 만약 해당 키에 특정 값이 존재하지 않는다면 NaN으로 처리하면 된다. left 왼쪽 key를 기준으로 outer(..

파이썬/판다스 2022.09.06