웹 정보 캡 처

- 커 뮤 니 티 에서 많은 사람들 이 홈 페이지 정 보 를 캡 처 할 필요 가 있 는 것 을 보고 제 가 만 든 DEMO 를 올 려 서 참고 하 시기 바 랍 니 다. 여러분 들 도 의견 을 많이 제시 하고 이 작은 절 차 를 보완 하 는 것 을 함께 공부 하 시기 바 랍 니 다.
 
준비 도구: Dreamweaver, RegexBuddy
잡기 3 단계 진행:
1) 웹 페이지 데 이 터 를 다운로드 합 니 다.
2) 웹 페이지 를 처리 하여 원 하 는 데 이 터 를 얻는다.
3) 데이터 저장
1. 웹 소스 코드 다운로드
이 절 차 는 여러 가지 방법 으로 실현 할 수 있 지만 목적 은 하나 밖 에 없다. 그것 이 바로:
웹 페이지 Url 을 지정 하여 웹 페이지 소스 코드 를 얻 습 니 다.
1. WebClient 다운로드 사용:
//...
//   WebClient         
using System.Net;					
//...
WebClient wbDown = new WebClient();		
string strResult = wbDown.DownloadString("http://www.baidu.com/");
//OK,strResult           
//...

장점: 편리 하고 빠 르 며 System. Net. WebClient 를 직접 호출 하면 다운로드 할 수 있 으 며 대부분의 웹 페이지 를 다운로드 할 수 있 습 니 다.
단점: 사용자 이름과 비밀번호 가 필요 한 사 이 트 를 만나면 골 치 아프다.
2. HttpWebRequest 와 HttpWebResponse 사용
//...
using System.Net;
using System.IO;
//       
string strUrl = "http://www.baidu.com/";
HttpWebRequest Request = (HttpWebRequest)WebRequest.Create(strUrl);
HttpWebResponse Response = (HttpWebResponse)Request.GetResponse();
StreamReader sr = new StreamReader(Response.GetResponseStream(), System.Text.Encoding.GetEncoding("gb2312"));
string strResult = sr.ReadToEnd();
//...

장점: 유연성 이 비교적 커서 다양한 데 이 터 를 다운로드 할 수 있 고 설정 한 후에 사용자 이름 비밀 번 호 를 가 진 웹 페이지 를 다운로드 할 수 있 으 며 쿠키 를 전달 할 수 있 습 니 다.
단점: 코드 가 많 고 우아 하지 않 으 므 로 포장 후 사용 하 는 것 을 권장 합 니 다.
3. 웹 브 라 우 저 사용
WebBrower 는 작은 것 이나 mini IE 에 해당 합 니 다. 창 에 이 컨트롤 을 표시 하고 구체 적 인 웹 페이지 를 볼 수 있 습 니 다. 앞의 몇 가 지 는 볼 수 없습니다. 물론 원 하신 다 면 숨 길 수도 있 습 니 다.
i) 웹 브 라 우 저 숨 기기
//...
string Url = @"http://www.baidu.com/";
WebBrowser wb = new WebBrowser()
{
	Url = new Uri(Url)
};
while (!wb.DocumentText.Contains("

좋은 웹페이지 즐겨찾기