Python 파충류 구 글 크롬 F12 패키지 프로 세 스 원리 분석

브 라 우 저가 웹 페이지 를 여 는 과정 은 파충류 가 데 이 터 를 얻 는 과정 이 며,둘 은 같다.브 라 우 저 렌 더 링 웹 페이지 는 풍부 하고 다채로운 데이터 집합 입 니 다.파충류 가 얻 은 것 은 웹 페이지 의 소스 코드 htm 입 니 다.가끔 은 웹 페이지 의 html 코드 에서 원 하 는 데 이 터 를 찾 을 수 없 지만 브 라 우 저가 열 린 웹 페이지 에는 이러한 데이터 가 있 습 니 다.이것 이 바로 브 라 우 저 가 ajax 기술 을 통 해 이 데 이 터 를 비동기 로 불 러 왔 습 니 다(몰래 다운로드).
브 라 우 저가 몰래 다운로드 한 데 이 터 를 어떻게 봐 야 하 는가?
정 답 은 구 글 크롬 브 라 우 저의 F12 단축 키 입 니 다.마우스 오른쪽 단추 메뉴 인'검사'(Inspect)를 통 해 크롬 자체 개발 자 도 구 를 열 수도 있 습 니 다.개발 자 도 구 는 브 라 우 저 웹 페이지 의 왼쪽 이나 아래 에 나타 납 니 다.그 모습 은 이 렇 습 니 다.

그것 을 어떻게 사용 하 는 지 간단히 알 아 보 자.
구 글 크롬 패키지:1.맨 위 줄 메뉴
왼쪽 상단 화살 표 는 웹 페이지 의 요 소 를 보 려 면 누 르 십시오.
두 번 째 핸드폰,태 블 릿 아이콘 은 모 바 일 에서 웹 페이지 를 표시 하 는 것 을 모 의 하 는 것 이다.
Elements 렌 더 링 된 웹 페이지 태그 요소 보기
알림 은 렌 더 링 후(비동기 로 불 러 온 그림,데이터 등 포함)의 전체 웹 페이지 의 html 입 니 다.최초 로 다운로드 한 html 이 아 닙 니 다.
Console 은 JavaScript 의 console log 정 보 를 보고 웹 페이지 를 쓸 때 유용 합 니 다.
소스 는 웹 페이지 소스 코드,CSS,JavaScript 코드 를 표시 합 니 다.
Network 로 딩 요청 을 모두 확인 하면 파충류 에 도움 이 됩 니 다.
뒤의 것 은 잠시 내 버 려 두 어 라.
구 글 크롬 클러치:2.중요 구역
그림 에서 빨 간 상자 의 두 단 추 는 비교적 유용 하 다.번호 가 2 인 것 은 삭제 요청 기록 이다.번호 3 은 기록 을 유지 하 는 것 으로 웹 페이지 에 방향 을 바 꿀 때 유용 하 다.
그림 에서 녹색 구역 은 전체 웹 페이지 를 불 러 오 는 것 입 니 다.브 라 우 저의 모든 요청 기록 은 사이트 주소,상태,유형 등 을 포함 합 니 다.파충 류 를 쓸 때 우 리 는 이곳 에서 단 서 를 찾 아 금광 을 추출 해 야 한다.
맨 아래 번호 가 4 인 빨 간 상 자 는 이 웹 페이지 를 불 러 오 는 것 을 보 여 줍 니 다.모두 181 번 을 요 청 했 습 니 다.수량 이 얼마나 놀 라 운 지 7 브 라 우 저 를 안 타 깝 게 합 니 다.
요청 한 사이트 주 소 를 누 르 면 오른쪽 에 새로운 창 이 나타 납 니 다.요청 한 신뢰 정 보 를 표시 합 니 다.

그림 의 왼쪽 빨간색 상 자 는 클릭 한 요청 사이트 입 니 다.녹색 테 두 리 는 상세 한 창 입 니 다.
자세 한 창 은 Headers(요청 헤더),Preview(미리 보기 응답),Response(서버 응답 내용),Timing(시간 소모)을 포함 합 니 다.
Preview,Response 는 이 요청 이 파충류 가 원 하 는 데이터 가 있 는 지 확인 하 는 데 도움 을 줍 니 다.
Headers 는 파충류 가 브 라 우 저 와 같은 데 이 터 를 얻 을 수 있 도록 파충류 에서 http 요청 을 재 구축 하 는 데 도움 을 줍 니 다.
크롬 개발 자 도 구 를 이해 하고 능숙 하 게 사용 하면 호랑이 가 날 개 를 달 아 자신의 파충 류 를 순조롭게 쓸 수 있 습 니 다.
이상 이 바로 본 고의 모든 내용 입 니 다.여러분 의 학습 에 도움 이 되 고 저 희 를 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.

좋은 웹페이지 즐겨찾기