HTML & CSS

[48-4 Selenium] 웹스크래핑 연습 문제, find_element, ID, #

Olivia-BlackCherry 2022. 10. 25. 22:31

웹스크래핑 연습문제

웹스크래핑 연습 문제를 풀어보자. 

위키피디아 : https://en.wikipedia.org/wiki/Main_Page

해당 웹페이지에서, 빨강색으로 밑줄 그은 숫자만 스크래핑해보자.

 

 

웹스크래핑 과정

웹사이트에서 숫자에 해당하는 부분의 태그가 무엇인지 찾기 위해, 

해당 요소 근처에서 마우스 오른쪽 클릭을 하고, 검색을 클릭한다. 

그러면, 아래처럼 특정 부분이 선택되어 HTML 코드가 보인다.

 

find_element(By.CSS_SELECTOR, #id)

find_element 이용하여, 정보를 뽑아내면 되는데

여기서는 해당 요소를 특정할 수 있는 것이 id 속성이다. 

id 속성을 select할 때는 특별히 주의를 기울여야 한다. 

클래스 속성을 쓸 때, .(점)을 붙이는 것 처럼

id 속성을 쓰기 전에는 #(샾)을 붙인다 

from selenium import webdriver
from selenium.webdriver.common.by import By
chrome_driver_path = "C:\developer\chromedriver.exe"
driver = webdriver.Chrome(executable_path=chrome_driver_path)
URL = "https://en.wikipedia.org/wiki/Main_Page"
driver.get(URL)

counts = driver.find_element(By.CSS_SELECTOR, "#articlecount a")
print(counts.text)