데이터교육 17

ploty , pie plot, 원그래프, rangeslider, 슬라이더, marks, scatter plot, color, size

목차 오늘은 그동안 나를 너무 힘들게 했던, ploty의 다양한 chart에 대해 집중 공부해보겠다. 이것 때문에 적어도 50시간은 쏟은 것 같은데 제대로 하려면 머리 아프니, 대강 대강 넘어가다보니.. 결국 새로운 과제에 직면했는데 다시 초보자처럼 헤매고 있었다. 그래서, 그냥 정도로 기록해가며 공부를 하려고 한다. ploty가 제공하는 각 chart에 대해 소개한다. 다양한 종류의 data들을 그냥 보기에는 어렵다. 아무리 많은 데이터를 가지고 있다고 해도, 그 데이터를 가지고 유의미한 insight를 도출하지 못한다면 그것은 가지고 있는 거나 없거나, 큰 차이가 없다. 중요한 것은 insight이다. insight를 발견하는데는, 머신러닝의 기술을 빌리지 않는다면 데이터 시각화가 최고의 방법이다. ..

folium으로 Map에 marker, circle, label, polyline, mousepoint, divicon, markcluster정보 구현하기

목차 1. 기본 dataframe : launch_sites_df 2. Map 만들기 nasa_map= folium.Map(location=[28.56230197, -80.57735648], zoom_start=10) nasa_map 3. featuregroup 클래스로 객체 생성하기 지도에 놓이는 객체들을 쉽게 관리하고, 코드의 가독성을 높이기 위함 which = folium.map.FeatureGroup() 4. 지도에 특정 위치 circle로 표기 circle 객체는 which에 담고, which를 맵에 추가한다. for lat, lng in zip(launch_sites_df['Lat'], launch_sites_df['Long']): # 지도 위치 표시하기 which.add_child( foli..

folium, Map, add_child, circle, marker, Stamen Terrain, Stamen Toner, featuregroup, circlemarker, add_to

목차 데이터를 동적인 화면으로 구성하여, 데이터가 말하고자 하는 이야기를 쉽게 캐치할 수 있도록 해보자. import folium import pandas as pd # Import folium MarkerCluster plugin from folium.plugins import MarkerCluster # Import folium MousePosition plugin from folium.plugins import MousePosition # Import folium DivIcon plugin from folium.features import DivIcon 1. Folium 생성 1) folium.Map(location=, zoom_start=) nasa_coordinate = [29.559684888..

sns, seaborn, catplot, scatterplot, barplot, groupby, lineplot

목차 sns.catplot seaborn library에서 제공하는 카테고리별 plot을 생성하는 함수이다. parameter로 hue: 그래프의 요소를 구분하는 기준이다. parameter로 aspect는 그래프의 가로와 세로 비율을 조정하는 데 사용된다. 예를들어 aspect =5라면, 가로 길이를 세로 길이의 5배로 설정한다. 이 파라미터를 조정하여 그래프의 가독성을 높이거나, 데이터 포인트 간의 간격을 조정한다. sns.catplot(y="PayloadMass", x="FlightNumber", hue="Class", data=df, aspect = 5) plt.xlabel("Flight Number",fontsize=20) plt.ylabel("Pay load Mass (kg)",fontsize..

loc, iloc, isnull, dropna, fillna, astype, dtype

목차 loc loc은 pandas에서 dataframe, series에서 특정 행이나 열을 선택한다. 1) 단일 행 선택 아래의 예시에서 보면 loc 다음에는 '특정 행, 열'을 선택하기 때문에 index가 아니라 이름을 보고 선택한다고 생각하면 쉽다. row index의 이름이 4인 것을 찾아보면 된다! 이것은 index number가 4인 것과는 다르다. row= dff.loc[4] 2) 다중 행 선택 3) 단일 열 선택 여기서 유의해야 하는 것이 loc 다음에 [ 행, 열 ] 순서를 따른다는 것이다. 행만 적을 때는 열을 적지 않아도 되지만, 열을 적을 때는 행을 꼭 적어야 한다! 모든 행을 선택한다면 :를, 일부만 필터한다면 그에 맞게 행의 범위를 지정한다. 4) 다중 열 선택 다중 열을 적을 때..