파이썬/판다스

[판다스 10분 요약 2] Viewing data 데이터 보기

Olivia-BlackCherry 2022. 9. 5. 18:22

1. head(), tail()

앞 부분, 끝 부분만 보여준다. 

 

 

2. index, columns 보기

 

 

 

3. to_numpy()

데이터를 넘파이 배열(행렬)로 정열해서 보여준다.

데이터가 모두 실수형일 때는 빠르고 효율적이지만

데이터가 혼합형일 때는 상대적으로 소요되는 비용이 크다. 

참고로 to_numpy()로 데이터를 보여줄 때는, index와 column은 포함하지 않는다.

 

 

4. describe()

데이터를 분석한 요약본을 보여준다. 

count 수, mean 평균, std 표준편차, min 최소값, max 최대값, X% X퍼센트에 해당하는 값

 

 

5. transpose(), T

트랜스포즈란 대각선을 기준으로 열과 행의 위치를 바꾼다. 

예를 들어 (4,1) 자리는 (1, 4)가 되는 것을 뜻한다.

 

 

6. sort_idex(axis =0/1, acending =T/F )

인덱스를 axis에 따라 정렬한다.

1) ascending

ascending은 기울기를 의미하는데

ascending=True이면 기울기가 올라가는 구조이고(오름차순)

ascending = False이면 기울기가 내려가는 구조이다.(내림차순)

 

2) axis

axis는 축을 이야기한다. 

axis=0이면 행 인덱스가 기준이다.

axis=1이면 열 인덱스가 기준이 된다.

axis=0, axis=1의 의미를 파악하는 가장 쉬운 방법은 

행렬을 그려보면 된다. 

axis의 기준이 되는 0과 1을 위치 인덱스라고 생각한다.

 

axis=0은 (a, b)의 a쪽을 뜻한다. 

앞쪽이 바뀌는 곳은 

이므로,

기준이 axis=0인 경우,

sort_index(axis=0)는 빨간 부분을 오름차순으로 정렬하고,

그 행 인덱스를 기준으로 나머지 데이터 값을 정렬한다. 

 

 

axis=1은 (a, b)의 b쪽을 뜻한다. 

뒤쪽이 바뀌는 곳은

이므로,

기준이 axis=1인 경우,

sort_index(axis=1)은 빨간 부분을 오름차순으로 정렬하고,

그 열 인덱스를 기준으로 나머지 데이터 값을 정렬한다. 

 

 

 

7. sort_values(by="값 ")

해당 값에 따라 데이터를 정렬한다.