Python을 사용하여 Bing 광고 결과 긁기
9971 단어 webscrapingpythontutorialhtml
소개
이 블로그 게시물은 Bing의 웹 스크래핑 시리즈의 연속이며 Python을 사용하여 Bing 검색에서 광고 결과를 스크래핑하는 방법에 대한 정보를 포함합니다. SerpApi를 사용하는 대체 API 솔루션이 표시됩니다.
수입품
from bs4 import BeautifulSoup
import requests
import lxml
from serpapi import GoogleSearch
스크랩 할 것
펼쳐진 광고
인라인 광고
프로세스
제목/링크 선택
CSS
펼쳐진 광고 결과의 선택자제목/링크 선택
CSS
인라인 광고 결과의 선택자인라인 광고 코드 스니펫:
for inline_ad in soup.select('.b_algo .b_vList.b_divsec .b_annooverride a'):
inline_ad_title = inline_ad.text
inline_ad_link = inline_ad['href']
확장 광고 코드 스니펫:
for expanded_ad in soup.select('.deeplink_title'):
expanded_ad_title = expanded_ad.text
expanded_ad_link = expanded_ad.a['href']
암호
from bs4 import BeautifulSoup
import requests, lxml
headers = {
"User-Agent":
"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36"
}
html = requests.get('https://www.bing.com/search?q=john deere tractors buy', headers=headers)
soup = BeautifulSoup(html.text, 'lxml')
try:
for expanded_ad in soup.select('.deeplink_title'):
expanded_ad_title = expanded_ad.text
expanded_ad_displayed_link = expanded_ad.a['href']
print(f'{expanded_ad_title}\n{expanded_ad_displayed_link}')
except:
pass
try:
for inline_ad in soup.select('.b_algo .b_vList.b_divsec .b_annooverride a'):
inline_ad_title = inline_ad.text
inline_ad_displayed_link = inline_ad['href']
print(f'{inline_ad_title}\n{inline_ad_displayed_link}')
except:
pass
# parts of the output:
'''
# expanded ads
Compact Tractors
https://www.deere.com/en/tractors/compact-tractors/
View The Utility Tractors
https://www.deere.com/en/tractors/utility-tractors/
---------------------------------------------------
# inline ads
2032R
https://www.deere.com/en/tractors/compact-tractors/2-series-compact-tractors/2032r/
1025R
https://www.deere.com/en/tractors/compact-tractors/1-series-sub-compact-tractors/1025r/
'''
Bing 광고 결과 API 사용
SerpApi는 5,000회 검색의 무료 평가판이 있는 유료 API입니다.
from serpapi import GoogleSearch
params = {
"api_key": "YOUR_API_KEY",
"engine": "bing",
"q": "john deere tractors"
}
search = GoogleSearch(params)
results = search.get_dict()
for ads in results['ads']:
title = ads['title']
link = ads['displayed_link']
print(title)
print(link)
# part of the output:
'''
John Deere® Official Site - The Select Series Tractors
https://www.deere.com
John Deere Tractors | tractorhouse.com
https://www.tractorhouse.com/JohnDeere/Tractors
'''
연결
Code in the online IDE • Bing Ad Results API
아웃트로
질문이 있거나 제대로 작동하지 않는 것이 있거나 다른 것을 작성하고 싶은 경우 댓글 섹션이나 Twitter(으)로 자유롭게 의견을 남겨주세요.
당신 것,
Dimitry 및 나머지 SerpApi 팀.
Reference
이 문제에 관하여(Python을 사용하여 Bing 광고 결과 긁기), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/serpapi/scrape-bing-ad-results-using-python-37o6텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)