Certificate/data science-IBM 18

ploty , pie plot, 원그래프, rangeslider, 슬라이더, marks, scatter plot, color, size

목차 오늘은 그동안 나를 너무 힘들게 했던, ploty의 다양한 chart에 대해 집중 공부해보겠다. 이것 때문에 적어도 50시간은 쏟은 것 같은데 제대로 하려면 머리 아프니, 대강 대강 넘어가다보니.. 결국 새로운 과제에 직면했는데 다시 초보자처럼 헤매고 있었다. 그래서, 그냥 정도로 기록해가며 공부를 하려고 한다. ploty가 제공하는 각 chart에 대해 소개한다. 다양한 종류의 data들을 그냥 보기에는 어렵다. 아무리 많은 데이터를 가지고 있다고 해도, 그 데이터를 가지고 유의미한 insight를 도출하지 못한다면 그것은 가지고 있는 거나 없거나, 큰 차이가 없다. 중요한 것은 insight이다. insight를 발견하는데는, 머신러닝의 기술을 빌리지 않는다면 데이터 시각화가 최고의 방법이다. ..

folium으로 Map에 marker, circle, label, polyline, mousepoint, divicon, markcluster정보 구현하기

목차 1. 기본 dataframe : launch_sites_df 2. Map 만들기 nasa_map= folium.Map(location=[28.56230197, -80.57735648], zoom_start=10) nasa_map 3. featuregroup 클래스로 객체 생성하기 지도에 놓이는 객체들을 쉽게 관리하고, 코드의 가독성을 높이기 위함 which = folium.map.FeatureGroup() 4. 지도에 특정 위치 circle로 표기 circle 객체는 which에 담고, which를 맵에 추가한다. for lat, lng in zip(launch_sites_df['Lat'], launch_sites_df['Long']): # 지도 위치 표시하기 which.add_child( foli..

folium, Map, add_child, circle, marker, Stamen Terrain, Stamen Toner, featuregroup, circlemarker, add_to

목차 데이터를 동적인 화면으로 구성하여, 데이터가 말하고자 하는 이야기를 쉽게 캐치할 수 있도록 해보자. import folium import pandas as pd # Import folium MarkerCluster plugin from folium.plugins import MarkerCluster # Import folium MousePosition plugin from folium.plugins import MousePosition # Import folium DivIcon plugin from folium.features import DivIcon 1. Folium 생성 1) folium.Map(location=, zoom_start=) nasa_coordinate = [29.559684888..

sns, seaborn, catplot, scatterplot, barplot, groupby, lineplot

목차 sns.catplot seaborn library에서 제공하는 카테고리별 plot을 생성하는 함수이다. parameter로 hue: 그래프의 요소를 구분하는 기준이다. parameter로 aspect는 그래프의 가로와 세로 비율을 조정하는 데 사용된다. 예를들어 aspect =5라면, 가로 길이를 세로 길이의 5배로 설정한다. 이 파라미터를 조정하여 그래프의 가독성을 높이거나, 데이터 포인트 간의 간격을 조정한다. sns.catplot(y="PayloadMass", x="FlightNumber", hue="Class", data=df, aspect = 5) plt.xlabel("Flight Number",fontsize=20) plt.ylabel("Pay load Mass (kg)",fontsize..

webscrapping, beautifulsoup, getText, get, strip, isdigit, fromkeys, extract

목차 beautifulscoup 웹사이트는 엄청나게 복잡한 코드로 이루어져있는데, 뷰티풀 수프는 개발자가 웹사이트를 이해할 수 있도록 도와주는 파이썬 모듈이다. 뷰티풀 수프를 이용하면 복잡한 HTML 코드에서 원하는 HTML 요소를 정확하고 빠르게 가져올 수 있다. 즉, 여러 정보에서 필요한 정보만 쏙 뽑아오는 것이다. 인터넷 웹사이트 중 하나를 뷰티풀 수프를 이용해 가져온다고 가정하자. 1. html파일 읽어온다. -cp949 codec이 해석하기가 어렵다는 에러가 뜨는 것을 방지하기 위해 encoding utf-8을 추가한다. with open("website.html", encoding="UTF-8") as file: contents=file.read() 또는 API를 이용한다. import req..