파 이 썬 파충류 기초 탐구 selenium

3757 단어 Python파충selenium
Python 파충류,데이터 분석,사이트 개발 등 사례 튜 토리 얼 영상 무료 온라인 시청
https://space.bilibili.com/523606542
Selenium
Selenium 은 웹 의 자동화 테스트 도구 로 처음에 사이트 자동화 테스트 를 위해 개 발 된 것 으로 게임 용 버튼 요정 처럼 지 정 된 명령 에 따라 자동 으로 조작 할 수 있 습 니 다.
Selenium 테스트 도 구 는 실제 사용자 가 조작 하 는 것 처럼 브 라 우 저 를 직접 조작 합 니 다.Selenium 은 명령 에 따라 브 라 우 저 로 하여 금 자동 으로 페이지 를 불 러 오고 필요 한 데 이 터 를 얻 게 하 며 심지어 페이지 캡 처 를 하거나 사이트 의 일부 동작 이 발생 했 는 지 판단 할 수 있 습 니 다.
selenium 의 용도
(1)selenium 은 브 라 우 저 를 구동 하여 사용자 정의 논리 코드 를 자동 으로 실행 할 수 있 습 니 다.즉,코드 를 통 해 인간 이 브 라 우 저 를 사용 하여 목표 사이트 에 자동 으로 방문 하고 조작 할 수 있 습 니 다.그러면 우 리 는 그것 을 파충류 로 만 들 수 있 습 니 다.
(2)selenium 은 본질 적 으로 브 라 우 저 를 구동 하여 브 라 우 저의 조작 을 완전히 모 의 하 는 것 이다.예 를 들 어 점프,입력,클릭,드 롭 다운 등 이다.더 나 아가 웹 페이지 렌 더 링 후의 결 과 를 얻 으 면 다양한 브 라 우 저 를 지원 할 수 있다.
selenium 이 장단 점 이에 요.
(1)장점
장점 은 일련의 복잡 한 통신 절 차 를 피 할 수 있다 는 것 이다.예 를 들 어 우리 가 이전에 배 운 requests 모듈 은 requests 모듈 이 모 의 요청 을 할 때 원래 있 는 통신 절 차 를 모두 분석 한 후에 야 요청 을 통 해 응답 할 수 있 는 지 하 는 것 이다.만약 목표 사이트 에 일련의 복잡 한 통신 절차 가 있다 면,예 를 들 어 로그 인 할 때의 미끄럼 검증 등...그러면 requests 모듈 을 사용 할 때 매우 번 거 롭 지 않 습 니까?그러나 걱정 할 필요 도 없다.사이트 의 반 기어 오 르 기 전략 이 높 을 수록 사용자 의 체험 효과 가 떨 어 지기 때문에 사 이 트 는 사용자 의 음위 아래 안전 전략 을 낮 춰 야 한다.
조금 만 더 requests 요청 라 이브 러 리 를 보면 js 를 실행 할 수 있 습 니까?안 되 는 거 아니 야?그러면 사이트 에서 ajax 요청 을 보 내야 한다 면 비동기 로 데 이 터 를 가 져 와 페이지 에 렌 더 링 해 야 합 니 다.js 로 요청 을 보 내야 하 는 것 이 아 닙 니까?그 브 라 우 저의 특징 은 무엇 입 니까?대상 사이트 에 직접 방문 한 다음 에 상대방 의 데 이 터 를 가 져 와 페이지 에 렌 더 링 할 수 있 습 니까?그럼 이게 바로 selenium 을 사용 하 는 장점!
(2)단점
selenium 을 사용 하 는 것 은 본질 적 으로 브 라 우 저 를 구동 하여 대상 사이트 에 요청 을 보 내 는 것 입 니 다.브 라 우 저 는 대상 사이트 에 접근 할 때 정적 자원 을 모두 불 러 와 야 하 는 것 이 아 닙 니까?html,css,js 이 파일 들 은 불 러 올 때 까지 기 다 려 야 합 니까?속도 가 너무 느 린 거 아니 야?그것 을 사용 하 는 나 쁜 점 은 효율 이 매우 낮 다 는 것 이다!그래서 우 리 는 보통 그것 으로 로그 인 검증 을 한다.
1.Selenium 작업 원리
Python爬虫基础讲解:初探selenium
 
그림 에서 보 듯 이 Python 을 통 해 Selenium 을 제어 한 다음 에 Selenium 으로 하여 금 브 라 우 저 를 제어 하고 브 라 우 저 를 조작 하 게 함으로써 Python 을 사용 하여 간접 적 으로 브 라 우 저 를 조작 하 게 한다.
1.1 Selenium 설정
셀 레 니 엄 은 다양한 브 라 우 저 를 지원 하 는데 가장 흔히 볼 수 있 는 것 은 화 호 와 구 글 브 라 우 저 다.우선 컴퓨터 에 브 라 우 저 를 다운로드 하고 브 라 우 저 버 전 은 새 것 이 좋 지 않 습 니 다.
화 호:다음 과 같이 캡 처
Python爬虫基础讲解:初探selenium
구 글:캡 처 는 다음 과 같다.
Python爬虫基础讲解:初探selenium
1.2 브 라 우 저 구동
Selenium 은 구체 적 으로 어떻게 브 라 우 저 를 조작 할 수 있 습 니까?이것 은 브 라 우 저 구동 덕분이다.Selenium 은 API 인 터 페 이 스 를 통 해 브 라 우 저 구동 과 의 상호작용 을 실현 하고 브 라 우 저 와 의 상호작용 을 실현 할 수 있다.그래서 브 라 우 저 드라이버 를 설정 해 야 합 니 다.
불 여우 구동 다운로드 주소:
http://npm.taobao.org/mirrors/geckodriver/
구 글 드라이버 다운로드 주소:
https://npm.taobao.org/mirrors/chromedriver/
브 라 우 저 드라이버 설정:
다운로드 한 브 라 우 저 드라이브 를 압축 해제 하고 압축 해 제 된 exe 파일 을 Python 의 설치 디 렉 터 리 에 두 면 python.exe 와 같은 디 렉 터 리 에 두 면 됩 니 다.
Python爬虫基础讲解:初探selenium
1.3 Selenium 사용
selenium 모듈 을 설치 하고 python 은 이 모듈 을 통 해 브 라 우 저 를 구동 합 니 다.다음 명령 행 으로 이 모듈 을 설치 하면 됩 니 다.

pip install selenium
2 쾌속 입문

#       
 
from selenium import webdriver
 
driver = webdriver.chrome()
url = 'https : / /www.baidu . com/ '
driver.get(url)
#  get                 
driver.get(url)
#     
driver.quit()
이상 은 파 이 썬 파충류 기초 셀 레 니 엄 의 상세 한 내용 입 니 다.파 이 썬 파충류 기초 셀 레 니 엄 에 관 한 자 료 는 다른 관련 글 을 주목 하 세 요!

좋은 웹페이지 즐겨찾기