python 파충류 기반 AJAX 페이지 캡 처

1. AJAX 요청 페이지 의 기어 오 르 기
웹 페이지 찾기:http://www.jy.whzbtb.com/V2PRTS
스냅 백 을 통 해 우 리 는 이것 이 AJAX 요청 이라는 것 을 알 수 있 습 니 다. 우 리 는 필요 한 인 자 를 가지 고 있어 야 각 페이지 의 내용 을 얻 을 수 있 습 니 다. 구체 적 으로 아래 의 소스 코드 를 볼 수 있 습 니 다.

import urllib.request    
import urllib.error
import urllib.parse
 
""" 、  header"""  
#1.1、        headers 
def get_one_page(i):
    header={  
        "User-Agent":'User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36',     
        }  
     
    web_url= "http://www.jy.whzbtb.com/V2PRTS/WinningPublicityInfoList.do"  
    
      
    postData = urllib.parse.urlencode({
         "page": str(i),
         "rows": "10"
        }).encode('utf-8')
    #encode： Unicode   utf-8 
     
    req = urllib.request.Request(url=web_url,
                                 data=postData,
                                 headers=header
                                 )
     
    try:  
        response = urllib.request.urlopen(req, timeout=3)  
    except urllib.error.URLError as e:  
        if hasattr(e, 'code'):  
            print(e.code)  
        if hasattr(e, 'reason'):  
            print(e.reason)  
    else:          
        webData=response.read().decode('utf-8')
        print(webData)
        get_content(webData)
     
def get_content(webData):
    pass  #    ， 


for i in range(1,20):   #         
    try:
        get_one_page(i)
    except:
        get_one_page(i)

관심 있 으 신 분 들 은 보 셔 도 돼 요. ，공동 학습, 공동 향상!!

이 내용에 흥미가 있습니까?

현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:

다양한 언어의 JSON

JSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다