scrapy 프 록 시 설정

4501 단어 python파충scrapy
http://stackoverflow.com/questions/4710483/scrapy-and-proxies
파일 middlewares.py 를 setting.py 평행 디 렉 터 리 에 추가 합 니 다.
import base64
class ProxyMiddleware(object):
# overwrite process request
def process_request(self, request, spider):
    # Set the location of the proxy
    request.meta['proxy'] = "http://YOUR_PROXY_IP:PORT"

    # Use the following lines if your proxy requires authentication
    proxy_user_pass = "USERNAME:PASSWORD"
    # setup basic authentication for the proxy
    encoded_user_pass = base64.b64encode(proxy_user_pass)
    request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

많은 인터넷 상의 답 은 base 64.encodestring 을 사용 하여 proxy 를 인 코딩 합 니 다.user_pass,username 이 너무 길 면 오류 가 발생 할 수 있 으 므 로 b64encode 인 코딩 방식 을 추천 합 니 다.
그리고 setting.py 에서 DOWNLOADERMIDDLEWARES 에서 열 어 주세요.procject name.middlewares.Proxy Middleware:1 이면 됩 니 다.

좋은 웹페이지 즐겨찾기