[1점 이해] 옆으로 쳐봐.

무엇이 커튼입니까?


이른바 커튼이란 사이트에서 정보를 추출하는 것이다.
사이트의 데이터(상품, 가격, 날씨 등)를 자주 얻는다.

python으로 써보세요.


필요한 물건(pip)


・requests
・BeautifulSoup
• 조회하고 싶은 사이트의 URL

물줄기


Requests를 통해 가져오기
res = requests.get("URL")
BeautifulSoup을 통해 웹 사이트 데이터 추출
soup = BeautifulSoup(res.text, "html.parser")
원하는 부분 결정
ex) 클래스 이름:productlists aa의 ul에서 li 가져오기
※ 상품 일람 등의 구조는 대체로 이런 느낌
found_part = soup.find_all("ul", class_='product_lists aaa')
for ul_tag in found_part:
        for li in ul_tag.find_all('li'):
            print(li.find('span').text)
샘플 코드
# coding: utf-8
import requests
from bs4 import BeautifulSoup


def get_soup(url):
    res = requests.get(url)
    soup = BeautifulSoup(res.text, "html.parser")
    tag_obj = soup.title
    print(tag_obj)


if __name__ == '__main__':
    get_soup("ここにリンクのURL")

여기에 주의하십시오


!
사이트에 따라 봉쇄가 금지된 것도 있으니 확인할 필요가 있다.

좋은 웹페이지 즐겨찾기