복리손 으로 파 이 썬 에 게 여신 세트 그림 을 가 르 칩 니 다.


저자: 엽 정 운
저자: 엽 정 운
CSDN:https://blog.csdn.net/fyfugoyfa
힘 든 생활 속 에 부 드 러 운 꿈 이 있어 야 지.
福利!手把手教你Python爬取女神套图_第1张图片
대상 URL:http://www.win4000.com/meinvtag4_1.html
미 탁 망 의 한 라벨 아래 에 있 는 미녀 벽지 에 올 라 가 상세 한 페이지 를 클릭 하면 안에 세트 그림 이 있 는 것 을 발견 할 수 있다.
웹 분석
福利!手把手教你Python爬取女神套图_第2张图片
페이지 넘 기기 URL 변경 규칙 보기:
http://www.win4000.com/meinvtag4_1.html
http://www.win4000.com/meinvtag4_2.html
http://www.win4000.com/meinvtag4_3.html
http://www.win4000.com/meinvtag4_4.html
http://www.win4000.com/meinvtag4_5.html

페이지 에 보 이 는 모든 그림 을 클릭 하면 상세 한 페이지 가 있 고 안 에는 세트 그림 이 있다.
福利!手把手教你Python爬取女神套图_第3张图片
福利!手把手教你Python爬取女神套图_第4张图片
상세 페이지 에 있 는 그림 URL 변화 규칙:
http://www.win4000.com/meinv216987_1.html
http://www.win4000.com/meinv216987_2.html
http://www.win4000.com/meinv216987_3.html

福利!手把手教你Python爬取女神套图_第5张图片
웹 페이지 소스 코드 에서 도 데 이 터 를 직접 찾 을 수 있 습 니 다.
福利!手把手教你Python爬取女神套图_第6张图片
          
              
http://pic1.win4000.com/pic/8/e0/24b989d57c.jpg

2. 파충류 의 기본 적 인 사고
福利!手把手教你Python爬取女神套图_第7张图片
1. 5 페이지 짜 리 그림 의 URL 가 져 오기
def get_taotu_url():
    for i in range(1, 6):
        url = f'http://www.win4000.com/meinvtag4_{i}.html'
        headers = {
            'User-Agent': choice(user_agent)
        }
        #           
        rep = requests.get(url, headers=headers)
        # print(rep.status_code)         200
        # print(rep.text)
        html = etree.HTML(rep.text)
        taotu_url = html.xpath('//div[@class="tab_tj"]/div/div/ul/li/a/@href')
        #       url
        taotu_url = [item for item in taotu_url if len(item) == 39]
        #      24   
        print(taotu_url, len(taotu_url), sep='
')

福利!手把手教你Python爬取女神套图_第8张图片
2.            
def get_img(url):
    headers = {
        'User-Agent': choice(user_agent)
    }
    #           
    rep = requests.get(url, headers=headers)
    #     
    html = etree.HTML(rep.text)
    #              
    name = html.xpath('//div[@class="ptitle"]/h1/text()')[0]
    os.mkdir(r'./    /{}'.format(name))
    max_page = html.xpath('//div[@class="ptitle"]/em/text()')
    #              url  
    url1 = url.replace('.html', '_{}.html')
    for i in range(1, int(max_page[0]) + 1):
        url2 = url1.format(i)
        sleep(randint(1, 3))
        reps = requests.get(url2, headers=headers)
        dom = etree.HTML(reps.text)
        src = dom.xpath('//div[@class="main-wrap"]/div[1]/a/img/@data-original')[0]
        file_name = name + f' {i} .jpg'
        img = requests.get(src, headers=headers).content
        with open(r'./    /{}/{}'.format(name, file_name), 'wb') as f:
            f.write(img)
            print(f'      :{file_name}')

3. 전체 코드 구현
전체 코드:
"파 이 썬 빨리 배우 기"를 주목 한 후, 회복: 여신
福利!手把手教你Python爬取女神套图_第9张图片
"파 이 썬 빨리 배우 기"를 주목 한 후, 회복: 여신
실행 효 과 는 다음 과 같 습 니 다:
福利!手把手教你Python爬取女神套图_第10张图片
프로그램 이 잠시 실행 되자 그림 은 모두 내 려 와 로 컬 폴 더 에 저장 되 었 고 5 페이지 의 120 세트 그림 은 흐뭇 했다.
福利!手把手教你Python爬取女神套图_第11张图片
기타 설명
4. 567917. 데 이 터 를 너무 많이 캡 처 하 는 것 을 권장 하지 않 고 서버 에 부하 가 되 기 쉬 우 며 맛 보기 만 하면 된다
4. 567917. 본 고 를 통 해 파충 류 는 세트 그림 의 기어 오 르 기, 문자열 의 조합 을 통 해 URL 요 구 를 어떻게 구성 하 는 지 알 수 있 습 니 다
4. 567917. 본 고 는 Python 파충 류 를 이용 하여 여신 세트 그림 을 대량으로 다운로드 하고 실현 하 는 과정 에서 문제 가 발생 할 수 있 습 니 다. 많이 생각 하고 테스트 를 해서 문 제 를 해결 하고 더욱 깊이 이해 할 수 있 습 니 다
4. 567917. 코드 는 직접 복사 하여 실행 할 수 있 습 니 다. 괜 찮 으 면 칭찬 을 해 주세요. 작가 에 대한 가장 큰 격려 이기 도 합 니 다. 부족 한 점 은 댓 글 에서 많이 지적 해 주 십시오福利!手把手教你Python爬取女神套图_第12张图片
요철 복지
한 권 소개???:이 책 은 Python 과 기계 학습 두 가지 인기 분 야 를 결합 하여 이해 하기 쉬 운 지식 설명 을 통 해 독자 들 이 기계 학습 을 배우 고 파악 하도록 도와 준다.아래 그림 을 클릭 하면 상세 한 상황/구 매!???
福利!手把手教你Python爬取女神套图_第13张图片
북경대학 출판사 의 지지 에 감 사 드 립 니 다!"요철 데이터"300 포인트 교환???!
福利!手把手教你Python爬取女神套图_第14张图片

좋은 웹페이지 즐겨찾기