ForeSpider 스크립트 자습서: 링크 필터 스크립트
링크 필터 스크립트는 주소와 제목 필터의 스크립트입니다. 필터 형식은 스크립트 필터를 선택해야 적용됩니다. 필터 스크립트는 복잡한 링크나 제목 필터를 처리하는 데 사용됩니다.
하나.사용 가능한 글로벌 객체(읽기만 가능)
EXTRACT:현재 채집 엔진 [객체 유형:extractor]
DATADB:현재 연결된 데이터베이스[객체 유형:dataBase]
RESULT:현재 결과 세트 객체[객체 유형:result]
URL: 현재 채집한 링크 대상 [대상 유형: URL]
URLTEXT: 현재 링크에서 수집한 모든 상태와 속성을 설명하는 대상 [객체 유형:urltext]
DOC:현재 채집된 문서 객체[객체 유형:grabDoc]
DOM: 현재 문서를 수집하는dom 대상 [대상 유형:dom]
ITEM: 현재 dom 트리에 연결된 href 태그 노드[객체 유형:domItem]
TMPL:현재 문서 템플릿 객체[객체 유형: tmplTmpl]
LINK:현재 링크 추출 객체[객체 유형: tmplLink]
VALUE:현재 필터링된 문자열[객체 유형:string]
둘.this 객체
현재 링크는 [tmplFilter] 객체를 필터링합니다.
셋.스크립트 반환 값
0이 아닌 예약을 되돌려줍니다. 그렇지 않으면 여과합니다.
예:
1. 다음 스크립트는 빈 링크를 필터링합니다.
if(VALUE)
return true;
else return false;
2. [제목 필터링] 다음 스크립트는 제목이 5자 이하인 링크를 필터링합니다.
if(VALUE.length>=5)
return true;
else return false;
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
ForeSpider 스크립트 자습서: 필드 처리 스크립트자세히 보기 필드 처리 스크립트는 필드의 값을 씻는 데 사용됩니다.어떤 필드를 클릭하면 필드 처리의 하단 메뉴에서 스크립트 처리를 선택한 후 설정할 스크립트를 선택하십시오.이 단계는 스크립트를 통해 얻은 데이터를 더...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.