HttpClient에서 웹 페이지를 캡처하는 두 가지 방법
1527 단어 HttpClient웹 페이지 캡처
Parser parser = new Parser();
parser.setURL("http://www.yahoo.com.cn");
b를 추출한다. 로컬 웹 파일을 추출하여 파일을 읽고 웹 파일을 문자열로 전환한다.
Parser parser=Parser.createParser(html,charset);
2. NodeFilter를 이용하여 filter a. Tag Name NodeFilter filter=new TagNameFilter("IMG");b. Tag Class NodeFilter filter = new NodeClassFilter(ImageTag.class);3. 일치 필터를 통해 모든 조건에 맞는 Tag NodeList list=parser를 얻을 수 있습니다.extractAllNodesThat(filter); for(int i=0;i String content=list.elementAt(i).toHtml();//조건에 부합되는 Tag 내용을 얻어 구체적인 상황에 대해 더욱 상세하게 처리하면
ImageTag imageTag=(ImageTag)list.elementAt(i);
…………
}
필요에 따라 상응하는 처리를 한다.2. Visitor를 이용하여 웹 페이지를 분석한다. 1. Parser a를 생성한다. url을 통해 인터넷의 웹 페이지
Parser parser = new Parser();
parser.setURL("http://www.yahoo.com.cn");
b를 추출한다. 로컬 웹 파일을 추출하고 파일을 읽고 웹 파일을 문자열로 전환한다.
Parser parser=Parser.createParser(html,charset);
2,visitor로 페이지에 접근
ex:ObjectFindingVisitor visitor=new ObjectFindingVisitor();
parser.visitAllNodesWith(visitor);
3,특정한visitor를 통해 조건에 맞는 Tag
Node[] nodes=visitor.getTags();
for(int i=0;i ImageTag imageTag=(ImageTag)nodes[i];
…………
//
}
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【httpclient】에서의 요구로부터 controller까지의 흐름에 대해서 확인과 리팩토링이전에는 JQuery의 autocomplete, ajax 및 httpclient를 사용하여 자동 완성을 구현했지만 내용에 대해 희미하게만 파악할 수 없었습니다. 리팩토링을 실시하면서 내용을 확인한다. 우선, 외부 A...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.