요청 한 지름길 만 들 기

요청 을 만 드 는 지름길 로 response.follow 를 사용 할 수 있 습 니 다:
    import scrapy

    class QuotesSpider(scrapy.Spider):
        name = "quotes"
        start_urls = [
            'http://quotes.toscrape.com/page/1/',
        ]
        def parse(self,response):
            for quote in response.css('div.quote'):
                yield{
                    'text':quote.css('span.text::text').extract_first(),
                    'author':quote.css('span small::text').extract_first(),
                    'tags':quote.css('div.tags a.tag::text').extract(),
                }
            next_page = response.css('li.next a::attr(href)').extract_first()
            if next_page is not None:
               yield response.follow(next_page,callback = self.parse)

scrapy.Request 와 달리 response.follow 는 웹 페이지 를 직접 이동 하 는 것 을 지원 합 니 다.url join 방법 이 필요 없습니다.주의해 야 할 것 은 response.follow 가 요청 인 스 턴 스 만 되 돌려 주 는 것 입 니 다.너 는 이 요청 을 만들어 야 한다.
문자열 대신 선택 기 에 response.follow 를 전달 할 수 있 습 니 다.이 선택 기 는 중요 한 속성 을 추출 할 수 있 습 니 다:
    >>>for href in response.css('li.next a::attr(href)'):
           yield response.follow(href, callback = self.parse)

태그 요소 에 대해 간단 한 방법 이 있 습 니 다.response.follow 는 href 속성 을 자동 으로 사용 합 니 다.그래서 코드 가 더 간결 합 니 다.
    >>>for a in response.css('li.next a'):
           yield response.follow(a,callback = self.parse)

메모:resposne.follow(response.css(li.next a)는 무효 값 입 니 다.response.css 는 선택 기의 모든 결 과 를 가 진 유사 한 목록 의 대상 을 되 돌려 줍 니 다.단일 선택 기 가 아 닙 니 다.예 를 들 어 하나의 for 순환 도*response.follow(response.css(li.nexta)[0]을 사용 할 수 있 습 니 다.

좋은 웹페이지 즐겨찾기