[1점 이해] 옆으로 쳐봐.
무엇이 커튼입니까?
이른바 커튼이란 사이트에서 정보를 추출하는 것이다.
사이트의 데이터(상품, 가격, 날씨 등)를 자주 얻는다.
python으로 써보세요.
필요한 물건(pip)
・requests
・BeautifulSoup
• 조회하고 싶은 사이트의 URL
물줄기
Requests를 통해 가져오기
res = requests.get("URL")
BeautifulSoup을 통해 웹 사이트 데이터 추출soup = BeautifulSoup(res.text, "html.parser")
원하는 부분 결정ex) 클래스 이름:productlists aa의 ul에서 li 가져오기
※ 상품 일람 등의 구조는 대체로 이런 느낌
found_part = soup.find_all("ul", class_='product_lists aaa')
for ul_tag in found_part:
for li in ul_tag.find_all('li'):
print(li.find('span').text)
샘플 코드# coding: utf-8
import requests
from bs4 import BeautifulSoup
def get_soup(url):
res = requests.get(url)
soup = BeautifulSoup(res.text, "html.parser")
tag_obj = soup.title
print(tag_obj)
if __name__ == '__main__':
get_soup("ここにリンクのURL")
여기에 주의하십시오
!
사이트에 따라 봉쇄가 금지된 것도 있으니 확인할 필요가 있다.
Reference
이 문제에 관하여([1점 이해] 옆으로 쳐봐.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://zenn.dev/yamu_official/articles/b429ed3e7dfd1d텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)