Python selenium get 페이지 가 느 릴 때의 문 제 를 해결 합 니 다.
스 크 립 트 를 실행 할 때 driver.get("url")은 현재 url 페이지 의 내용 이 많 으 면 불 러 오 는 것 이 매우 느 리 고 시간 이 걸 립 니 다.그러나 우리 가 조작 해 야 할 요 소 를 불 러 왔 습 니 다.페이지 를 불 러 오 는 것 을 멈 추고 뒤의 스 크 립 트 실행 에 영향 을 주지 않 습 니 다.해결 방법
페이지 불 러 오기 timeout,get 동작 설정:try get except 스 크 립 트 window.stop(),Gecko Driver 를 사용 하면 효과 가 있 습 니 다.
하지만 ChromeDriver 에 문제 가 있 을 수 있 습 니 다.이상 timeout 후속 스 크 립 트 를 던 지면 계속 실행 되 지 않 습 니 다.
GeckoDriver 의 실행 은 다음 과 같 습 니 다.
바 이 두 스티커 를 방문 하여 댓 글 의 총 페이지 수 를 가 져 옵 니 다:
두 가지 방식 으로 얻 을 수 있 습 니 다.간단 한 것 은 직접 포 지 셔 닝 요소 가 모두 11 페이지 입 니 다.
코드 는 포 지 셔 닝 끝 페이지 로 총 페이지 수 를 가 져 옵 니 다.
from selenium import webdriver
import re
driver = webdriver.Firefox()
# timeout ,
driver.set_page_load_timeout(20)
driver.set_script_timeout(20)
#try get
try:
driver.get("http://tieba.baidu.com/p/5659969529?red_tag=w0852861182")
except:
print(" , , ")
driver.execute_script("window.stop()")
last_page_element = driver.find_element_by_css_selector("li.l_pager.pager_theme_4.pb_list_pager >a:nth-child(12)") #
#
text = last_page_element.get_attribute("href")
all_page_num = re.search("\d+$",text).group() #
print(" :%s"%all_page_num)
파 이 썬 셀 레 니 엄 get 페이지 가 느 릴 때의 문 제 는 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.참고 하 시기 바 랍 니 다.여러분 들 도 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python의 None과 NULL의 차이점 상세 정보그래서 대상 = 속성 + 방법 (사실 방법도 하나의 속성, 데이터 속성과 구별되는 호출 가능한 속성 같은 속성과 방법을 가진 대상을 클래스, 즉 Classl로 분류할 수 있다.클래스는 하나의 청사진과 같아서 하나의 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.