링크 공유 자바 구현 (제목 캡 처 및 설명 정보)

1749 단어 자바 구현
임의의 링크 주 소 를 직접 분석 하고 자 했 습 니 다. 만약 에 이 사이트 가 글 이 라면 글 만 캡 처 하고 글 이 아니면 제목 과 설명 정보 만 캡 처 했 습 니 다. 그러나 관련 자 료 를 많이 찾 았 습 니 다. 본인 의 능력 에 한계 가 있 습 니 다. 많은 벽돌집 이 쓴 알고리즘 도 헛소리 입 니 다. 아예 제목 과 표현 을 간단하게 캡 처 했 습 니 다. 이것 은 간단 합 니 다. 여기에 붙 이 고 싶 지 않 았 습 니 다.그러나 나중에 사용 할 까 봐 잘 찾 아 보 세 요. 먼저 여기에 기록 하 세 요.
package com.jyeba.core.html;

public class HtmlInfo {
private String title;
private String desc;
public void setTitle(String title) {
this.title = title;
}
public String getTitle() {
return title;
}
public void setDesc(String desc) {
this.desc = desc;
}
public String getDesc() {
return desc;
}

}

     
package com.jyeba.core.html;



public class HtmlTools {
public static HtmlInfo getHtmlInfo(String url) throws IOException {
HtmlInfo html = new HtmlInfo();

Document doc = Jsoup.connect(url)

.data("query", "Java")

.userAgent("Mozilla")

.cookie("auth", "token")

.timeout(6000)

.get();

Elements e = doc.select("title");
if (e.size() > 0) {

System.out.println(e.text());
html.setTitle(e.text());
}

e = doc.select("meta[name=Description]");
if (e.size() > 0) {
System.out.println(e.get(0).attr("content"));
html.setDesc(e.get(0).attr("content"));
}

return html;

}
public static void main(String[] args) throws IOException{
HtmlInfo info=HtmlTools.getHtmlInfo("http://news.qq.com/a/20111017/000091.htm");

}
}
 

좋은 웹페이지 즐겨찾기