scrapy 머리 수정 방법 상세 설명

Scrapy 에 자동 으로 추 가 된 머리
어떠한 설정 도 없 이 scrapy 는 요청 에 기본적으로 머리 정 보 를 추가 합 니 다.
Scrapy 는 프로필 에 있 는 USER 를 통 해AGENT 설정,머리 에 User-agent 를 자동 으로 추가 합 니 다.이 설정 은 User-agent 를 포함 하 는 모든 설정 으로 덮어 씁 니 다.

다운로드 기 를 요청 하면 머리 Accept-Encoding:gzip,deflate 가 자동 으로 추 가 됩 니 다.Accept-Encoding 을 포함 한 머리 설정 으로 덮어 씁 니 다.
settings.py 파일 의 기본 머리 설정

#DEFAULT_REQUEST_HEADERS = {
# 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
# 'Accept-Language': 'en'
#}
이 설정 이 주석 상태 에 속 할 때 머리 는 Accept:text/html,application/xhtml+xml,application/xml 로 설정 되 어 있 습 니 다.q=0.9,*/*;q=0.8 과
Accept-language:en,주석 수정 취소 또는 추가 삭제 가능
우선 순위
  • Request 와 미들웨어 의 머리 설정 에 덮어 씁 니 다
  • scrapy 가 자동 으로 추가 하 는 User-agent 와 Accept-Encoding 을 덮어 쓸 수 있 습 니 다.
  • 파충류 중 custom 통과 가능settings 설정 은 현재 파충류 에 만 적 용 됩 니 다.
    
    class XXXSpider(scrapy.Spider):
     ...
     custom_settings = {
      DEFAULT_REQUEST_HEADERS = {...}
    	}
     ....
    
    Request 에 머리 설정
    엔진 에 Request 를 되 돌려 줄 때 머리 를 설정 할 수 있 습 니 다.
    
    ...
    def parse(self):
      headers = {
        ...
      }
      
      yield scrapy.Request(url, headers=headers)
    
    우선 순위
  • Request 에 설 치 된 header 는 settings.py 파일 의 기본 머리 와 합 쳐 집 니 다.중복 설정 이 있 으 면 그 설정 을 덮어 씁 니 다
  • 미들웨어 설정 에 덮어 씁 니 다.
  • 미들웨어 에 설정
    Request 에서 미들웨어 를 다운로드 하여 다운로드 기 에 보 내 달라 고 요청 할 때 미들웨어 를 다운로드 하여 머리 를 설정 할 수 있 습 니 다.
    
    class XXXDownloaderMiddleware
      def process_request(self, request, spider):
    	  request.headers["key"] = value
        return None
    
    설정 파일 에서 다운로드 중간 값 을 사용 해 야 합 니 다.
    
    DOWNLOADER_MIDDLEWARES = {
      'project.middlewares.XXXDownloaderMiddleware': 543,
    }
    
    우선 순위
  • Refer 를 제외 한 모든 머리 설정 을 덮어 씁 니 다.
  • referer 미들웨어
    여러 번 요청 이 있 을 때 referer 미들웨어 는 Request 의 머리 에 있 는 referer 에 요청 한 url 을 자동 으로 추가 합 니 다.
    우선 순위
  • 가장 높 으 며,모든 머리 를 설정 한 후 referer
  • 를 추가 합 니 다.
  • 한 번 만 요청 하 는 것 외 에 refer 가 없 는 경우 다른 머리 설정 에 refer 를 설정 하 더 라 도 refer 미들웨어 로 덮어 씁 니 다.
  • referer 미들웨어 닫 기
    프로필 에 REFERER 추가ENABLED=False 종료 가능
    우선 순위 분석
    Scrapy 가 자동 으로 추가 하 는 User-agent 와 Accept-Encoding<프로필 의 기본 설정 DEFAULTREQUEST_HEADERS이 글 은 scrapy 에 대한 자신의 이해 만 표시 합 니 다.잘못 이 있 으 면 지적 을 환영 합 니 다.
    스 크 래 피 머리 수정 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.스 크 래 피 머리 수정 에 관 한 내용 은 예전 의 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 많은 응원 부 탁 드 리 겠 습 니 다!

    좋은 웹페이지 즐겨찾기