전 후 ForeSpider 스 크 립 트 튜 토리 얼 - 링크 추출: 원본 js 변수 에 링크 하여 스 크 립 트 를 작성 합 니 다.
오늘, 소 편 이 여러분 에 게 가 져 온 튜 토리 얼 은 전 후 ForeSpider 스 크 립 트 튜 토리 얼 - 링크 추출 에서 소스 코드 의 js 변수 에 링크 하여 스 크 립 트 를 쓰 는 실전 튜 토리 얼 입 니 다.구체 적 인 내용 은 다음 과 같다.
링크 주 소 는 원본 코드 에서 찾 을 수 있 습 니 다.대상 웹 페이지 에서 오른쪽 단 추 를 누 르 고 '원본 코드 보기' 를 선택 하 십시오. 키 보드 는 'ctrl + F' 를 누 르 면 대상 링크 가 있 는 위 치 를 찾 습 니 다.대상 링크 는 js 변수 에 존재 합 니 다.
1. 링크 순환 필요
장면: 추출 할 링크 는 모두 소스 코드 에 나타 나 집중 적 으로 분포 한다.
예제: 오늘 의 핫 이 슈 뉴스 목록 페이지 링크 가 져 오기
목록 페이지 의 첫 번 째 링크 를 보고 링크 주 소 는 "입 니 다.https://www.toutiao.com/group/6637244114360336900/"이 페이지 에서 마우스 오른쪽 단 추 를 누 르 고 소스 코드 를 보 려 면" ctrl + F "를 선택 하고 문자열" 66372441414360336900 "을 찾 아 위 치 를 찾 습 니 다.
관찰 해 보면 중국어 문 자 는 '\ u' 로 시작 하 는 문자열 로 유 니 코드 인 코딩 형식 으로 표시 되 며 '역장 도구' 가 온라인 으로 인 코딩 을 하면 중국 어 를 보 여 줍 니 다.그 밖 에 링크 주소 분할 문자 "/" 에 전의 문자 "\" 를 추 가 했 지만 소프트웨어 는 우리 가 전의 처 리 를 하 는 데 도움 을 주 었 습 니 다. 여 기 는 걱정 하지 않 고 직접 값 을 부여 하면 됩 니 다.
전 의 된 문자열 을 JSON 뷰 어 에 배치 하면 데이터 형식 이 json 인 것 을 관찰 할 수 있 습 니 다.
스 크 립 트 인 스 턴 스:
var str=DOM.GetSource().ToStr(); //
var jsonStr=DOM.UnEscape(str.Middle("data = ","]};")+"]}"); // \
jScript js;// JS
var obj=js.RunJson(jsonStr);// JSON , JSON
var ar=obj.real_time_news;//
for(int i=0;i
2. 링크 가 반복 되 지 않 음
장면: 소수의 링크 를 추출 하고 위치 가 분산 되 어야 한다. 예 를 들 어 고양이 분류 페이지 (3 급 분류).
인 스 턴 스: 없 음.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
ForeSpider 스크립트 자습서: 링크 필터 스크립트자세히 보기 링크 필터 스크립트는 주소와 제목 필터의 스크립트입니다. 필터 형식은 스크립트 필터를 선택해야 적용됩니다. 필터 스크립트는 복잡한 링크나 제목 필터를 처리하는 데 사용됩니다. 하나.사용 가능한 글로벌 객...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.