Certificate 106

folium, Map, add_child, circle, marker, Stamen Terrain, Stamen Toner, featuregroup, circlemarker, add_to

목차 데이터를 동적인 화면으로 구성하여, 데이터가 말하고자 하는 이야기를 쉽게 캐치할 수 있도록 해보자. import folium import pandas as pd # Import folium MarkerCluster plugin from folium.plugins import MarkerCluster # Import folium MousePosition plugin from folium.plugins import MousePosition # Import folium DivIcon plugin from folium.features import DivIcon 1. Folium 생성 1) folium.Map(location=, zoom_start=) nasa_coordinate = [29.559684888..

sns, seaborn, catplot, scatterplot, barplot, groupby, lineplot

목차 sns.catplot seaborn library에서 제공하는 카테고리별 plot을 생성하는 함수이다. parameter로 hue: 그래프의 요소를 구분하는 기준이다. parameter로 aspect는 그래프의 가로와 세로 비율을 조정하는 데 사용된다. 예를들어 aspect =5라면, 가로 길이를 세로 길이의 5배로 설정한다. 이 파라미터를 조정하여 그래프의 가독성을 높이거나, 데이터 포인트 간의 간격을 조정한다. sns.catplot(y="PayloadMass", x="FlightNumber", hue="Class", data=df, aspect = 5) plt.xlabel("Flight Number",fontsize=20) plt.ylabel("Pay load Mass (kg)",fontsize..

webscrapping, beautifulsoup, getText, get, strip, isdigit, fromkeys, extract

목차 beautifulscoup 웹사이트는 엄청나게 복잡한 코드로 이루어져있는데, 뷰티풀 수프는 개발자가 웹사이트를 이해할 수 있도록 도와주는 파이썬 모듈이다. 뷰티풀 수프를 이용하면 복잡한 HTML 코드에서 원하는 HTML 요소를 정확하고 빠르게 가져올 수 있다. 즉, 여러 정보에서 필요한 정보만 쏙 뽑아오는 것이다. 인터넷 웹사이트 중 하나를 뷰티풀 수프를 이용해 가져온다고 가정하자. 1. html파일 읽어온다. -cp949 codec이 해석하기가 어렵다는 에러가 뜨는 것을 방지하기 위해 encoding utf-8을 추가한다. with open("website.html", encoding="UTF-8") as file: contents=file.read() 또는 API를 이용한다. import req..

loc, iloc, isnull, dropna, fillna, astype, dtype

목차 loc loc은 pandas에서 dataframe, series에서 특정 행이나 열을 선택한다. 1) 단일 행 선택 아래의 예시에서 보면 loc 다음에는 '특정 행, 열'을 선택하기 때문에 index가 아니라 이름을 보고 선택한다고 생각하면 쉽다. row index의 이름이 4인 것을 찾아보면 된다! 이것은 index number가 4인 것과는 다르다. row= dff.loc[4] 2) 다중 행 선택 3) 단일 열 선택 여기서 유의해야 하는 것이 loc 다음에 [ 행, 열 ] 순서를 따른다는 것이다. 행만 적을 때는 열을 적지 않아도 되지만, 열을 적을 때는 행을 꼭 적어야 한다! 모든 행을 선택한다면 :를, 일부만 필터한다면 그에 맞게 행의 범위를 지정한다. 4) 다중 열 선택 다중 열을 적을 때..

map, lambda, filter, to_datetime(), date(), datetime.date(year, month, day), dt

목차 map map은 파이썬 내장함수이다. 각 시퀀스의 각 요소에 ()안의 함수를 적용하여 새로운 시퀀스를 생성한다. 이 함수는 주로 list, tuple 등 iterable한 객체에 사용된다. # 예시 1: 리스트 요소 제곱하기 numbers = [1, 2, 3, 4, 5] squared_numbers = list(map(lambda x: x**2, numbers)) print(squared_numbers) # 출력: [1, 4, 9, 16, 25] # 예시 2: 문자열 길이 구하기 fruits = ["apple", "banana", "cherry"] lengths = list(map(len, fruits)) print(lengths) # 출력: [5, 6, 6] pandas로 dataframe을 만들..