python 파충류 기반 AJAX 페이지 캡 처
웹 페이지 찾기:http://www.jy.whzbtb.com/V2PRTS
스냅 백 을 통 해 우 리 는 이것 이 AJAX 요청 이라는 것 을 알 수 있 습 니 다. 우 리 는 필요 한 인 자 를 가지 고 있어 야 각 페이지 의 내용 을 얻 을 수 있 습 니 다. 구체 적 으로 아래 의 소스 코드 를 볼 수 있 습 니 다.
import urllib.request
import urllib.error
import urllib.parse
""" 、 header"""
#1.1、 headers
def get_one_page(i):
header={
"User-Agent":'User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36',
}
web_url= "http://www.jy.whzbtb.com/V2PRTS/WinningPublicityInfoList.do"
postData = urllib.parse.urlencode({
"page": str(i),
"rows": "10"
}).encode('utf-8')
#encode: Unicode utf-8
req = urllib.request.Request(url=web_url,
data=postData,
headers=header
)
try:
response = urllib.request.urlopen(req, timeout=3)
except urllib.error.URLError as e:
if hasattr(e, 'code'):
print(e.code)
if hasattr(e, 'reason'):
print(e.reason)
else:
webData=response.read().decode('utf-8')
print(webData)
get_content(webData)
def get_content(webData):
pass # ,
for i in range(1,20): #
try:
get_one_page(i)
except:
get_one_page(i)
관심 있 으 신 분 들 은 보 셔 도 돼 요. ,공동 학습, 공동 향상!!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.