URL
Titanic - Machine Learning from Disaster | Kaggle
캐글 절차
1. competetion에 참여
2. 데이터분석하기
3. 제출하기
4. 순위 확인하기
5. 내 점수 향상할 수 있는 방법 찾기
데이터
★ sibsp 탑승한 sibling, spouse 수
sibling 형제 자매 새엄마 새아빠
spouse 남편, 아내
★ parch 탑승한 부모 자식 수
parent 엄마 아빠
child 자식(딸, 아들, 입양한 딸, 입양한 아들)
0 부모 없이 대리보호자(ex유모)만 있는 경우
★ 데이터 컬럼 분석
- 총 418개의 rows가 있고 11개의 column이 있다.
- PassengerID는 숫자 자체에 의미는 없음
- Pclass는 수의 크기에 따른 의미가 있음 (1 최고, 2 보통, 3 하위)
- Name 의미없음 (삭제)
- Sex 여성/남성 -> 나중에 라벨인코딩 해야함
- Age 수의 크기에 의미 있음
- SibSp 수의 크기에 의미 있음
- parch 수의 크기 의미있음
- Fare 요금 의미있음
- cabin 선실 번호 - 수 자체에는 크기에 대한 의미없음
- embarked 승선 항구이름
< 라벨값 >
- survived 0,1로 생존여부 표시
제출할 것은?
컬럼: PassengerID, Survived
Survived 형식은: 0 또는 1
ex)
평가방식
Accuracy
코드
train/ test data 불러오기
★ loc, iloc
https://olivia-blackcherry.tistory.com/523
★ get_dummies()
https://olivia-blackcherry.tistory.com/575
https://olivia-blackcherry.tistory.com/481
★ 랜덤포레스트
https://olivia-blackcherry.tistory.com/614