replace 4

4차시 타이타닉 정규표현식 regular expression, label encoding, map함수, as_index, str, replace, pd.cut, sort_values(), astype, mode(), sort_index()

목차 1. 정규표현식 Regular Expression정규표현식 의미: 문자열에서 패턴을 찾거나 매칭시키기 위해 사용되는 표현 방식이다. 문자열 검색, 대체, 추출 등 다양한 문자열 처리 작업에 유용하게 사용된다. 구성: 일련의 문자 + 메타 문자.  : 어떠한 문자 하나와도 매칭됩니다. *  : 앞의 패턴이 0개 이상의 반복을 의미합니다. +  : 앞의 패턴이 1개 이상의 반복을 의미합니다. ?  : 앞의 패턴이 0개 또는 1개의 반복을 의미합니다. []  : 대괄호 안에 있는 문자 중 하나와 매칭됩니다. ()  : 괄호 안에 있는 패턴을 그룹화하고, 매칭 결과를 추출할 수 있습니다. \  : 다음에 오는 문자를 이스케이프(escape)하여 특수한 의미를 없앱니다. train_dat..

Kaggle 2024.03.19

Input validation, validate data, EDA, label encoding, dummy encoding, duplicated(), drop_duplicates(), replace, loc

목차 Input Validation The practice of thoroughly analyzing and double-checking to make sure data is complete, error-free, and high-quality 카레를 만들기 위해 야채를 산다고 했을 때, 살 때만 야채의 신선도를 확인하는 것이 아니라 냉장고에 넣을 때, 꺼내서 요리할 때, 며칠 후 남은 야채의 양을 확인할 때 등 수시로 야채가 신선한지 아닌지 계속 확인한다. 데이터도 마찬가지이다. 계속적으로 데이터의 상태를 확인해야한다. 데이터가 깨끗한지, 윤리적인지, 올바른지를 체크한다. Why validate data? 왜 데이터를 확인해야할까? - 비즈니스에서 정확한 의사결정을 돕는다. - 모델성능을 향상시킨다. ..

공백 제거하기, replace, strip()

| abc | >>> |abc| 처럼, abc 좌우에 있는 공백을 제거해보자. 1) replace(기존, 바꿀 것) 바꾼 값을 꼭 저장해야 한다. " " 띄어쓰기 \n 한 줄 띄어쓰기 \t 탭하기 등으로 이루어진 공백을 모두 지울 수 있다. original = " abc " replace_result = original.replace(" ", "") print(replace_result) 2) strip() strip()은 양쪽의 공백을 strip_result = original.strip() print(strip_result) >>abc lstrip()은 왼쪽의 공백을 left_strip_result = original.lstrip() print(left_strip_result) >>abc | rstr..

[24-10 파이썬] 메일머지 구현하기

메일 머지 똑같은 내용인데, 특정 단어만 바꾸어서 여러명에게 편지나 메일을 보내야 하는 경우가 있다. 이럴 때, 파이썬을 이용하면 시간을 절약할 수 있다. 업무 자동화 이야기는 많이 들어봤을 것이다. 파이썬을 이용해 반복적인 업무를 간단히 처리해서 시간을 벌 수 있다는 거다. 오늘은 메일머지의 기본 기능인 특정 단어만 바꾸어 문서를 대량 생산해보는 방법을 구현한다. 오늘의 미션 이름만 바꾸어 여러 장의 글 만들기 - hierarchy - text.txt - names.txt 1. names.txt 파일을 불러온다. with open("./input/Names/names.txt") as file: name_list = file.readlines() print(name_list) 파일 안의 내용이 한 줄씩 ..