전 후 ForeSpider 스 크 립 트 튜 토리 얼 - 링크 추출: 원본 js 변수 에 링크 하여 스 크 립 트 를 작성 합 니 다.

더 읽 기
오늘, 소 편 이 여러분 에 게 가 져 온 튜 토리 얼 은 전 후 ForeSpider 스 크 립 트 튜 토리 얼 - 링크 추출 에서 소스 코드 의 js 변수 에 링크 하여 스 크 립 트 를 쓰 는 실전 튜 토리 얼 입 니 다.구체 적 인 내용 은 다음 과 같다.
 
링크 주 소 는 원본 코드 에서 찾 을 수 있 습 니 다.대상 웹 페이지 에서 오른쪽 단 추 를 누 르 고 '원본 코드 보기' 를 선택 하 십시오. 키 보드 는 'ctrl + F' 를 누 르 면 대상 링크 가 있 는 위 치 를 찾 습 니 다.대상 링크 는 js 변수 에 존재 합 니 다.
1. 링크 순환 필요
장면: 추출 할 링크 는 모두 소스 코드 에 나타 나 집중 적 으로 분포 한다.
예제: 오늘 의 핫 이 슈 뉴스 목록 페이지 링크 가 져 오기
목록 페이지 의 첫 번 째 링크 를 보고 링크 주 소 는 "입 니 다.https://www.toutiao.com/group/6637244114360336900/"이 페이지 에서 마우스 오른쪽 단 추 를 누 르 고 소스 코드 를 보 려 면" ctrl + F "를 선택 하고 문자열" 66372441414360336900 "을 찾 아 위 치 를 찾 습 니 다.

관찰 해 보면 중국어 문 자 는 '\ u' 로 시작 하 는 문자열 로 유 니 코드 인 코딩 형식 으로 표시 되 며 '역장 도구' 가 온라인 으로 인 코딩 을 하면 중국 어 를 보 여 줍 니 다.그 밖 에 링크 주소 분할 문자 "/" 에 전의 문자 "\" 를 추 가 했 지만 소프트웨어 는 우리 가 전의 처 리 를 하 는 데 도움 을 주 었 습 니 다. 여 기 는 걱정 하지 않 고 직접 값 을 부여 하면 됩 니 다.​
전 의 된 문자열 을 JSON 뷰 어 에 배치 하면 데이터 형식 이 json 인 것 을 관찰 할 수 있 습 니 다.​
스 크 립 트 인 스 턴 스:
 
var str=DOM.GetSource().ToStr(); //           

var jsonStr=DOM.UnEscape(str.Middle("data = ","]};")+"]}");  //         \

jScript js;//  JS  

var obj=js.RunJson(jsonStr);//  JSON ,   JSON  

var ar=obj.real_time_news;//          

for(int i=0;i

2. 링크 가 반복 되 지 않 음
장면: 소수의 링크 를 추출 하고 위치 가 분산 되 어야 한다. 예 를 들 어 고양이 분류 페이지 (3 급 분류).
인 스 턴 스: 없 음.

좋은 웹페이지 즐겨찾기