Certificate/data science-IBM

sns, seaborn, catplot, scatterplot, barplot, groupby, lineplot

Olivia-BlackCherry 2023. 5. 30. 14:02

목차

    sns.catplot

    seaborn library에서 제공하는 카테고리별 plot을 생성하는 함수이다. 

    parameter로 hue: 그래프의 요소를 구분하는 기준이다.

    parameter로 aspect는 그래프의 가로와 세로 비율을 조정하는 데 사용된다. 예를들어 aspect =5라면, 가로 길이를 세로 길이의 5배로 설정한다. 이 파라미터를 조정하여 그래프의 가독성을 높이거나, 데이터 포인트 간의 간격을 조정한다. 

    sns.catplot(y="PayloadMass", x="FlightNumber", hue="Class", data=df, aspect = 5)
    plt.xlabel("Flight Number",fontsize=20)
    plt.ylabel("Pay load Mass (kg)",fontsize=20)
    plt.show()

     

    sns.scatterplot

    seaborn 라이브러리에서 scatter plot 산점도를 그리기 위한 함수이다. 

    sns.scatterplot(y="LaunchSite", x="FlightNumber", hue="Class", data=df)
    plt.xlabel("Flight Number",fontsize=20)
    plt.ylabel("Pay load Mass (kg)",fontsize=20)
    plt.show()


    groupby

    그룹화하여 aggregation함수를 써서 원하는 값을 뽑는다.

    orbit_success_rate = df.groupby('Orbit')['Class'].mean()
    print(orbit_success_rate)

     

     

    sns.barplot

    막대그래프를 그린다.

    sns.barplot(x=orbit_success_rate.index, y=orbit_success_rate.values)
    plt.xlabel('Orbit')
    plt.ylabel('Success Rate')
    plt.title('Success Rate by Orbit')
    plt.xticks(rotation=45)
    plt.show()

     

     

    또 다른 예시를 보자.

     

    sns.lineplot

    꺾은 선 그래프를 그린다

    sns.lineplot(x=year_df.index, y=year_df.values, data=year_df)
    plt.xlabel("Year",fontsize=20)
    plt.ylabel("success rate",fontsize=20)
    plt.show()