웹 정보 캡 처
준비 도구: Dreamweaver, RegexBuddy
잡기 3 단계 진행:
1) 웹 페이지 데 이 터 를 다운로드 합 니 다.
2) 웹 페이지 를 처리 하여 원 하 는 데 이 터 를 얻는다.
3) 데이터 저장
1. 웹 소스 코드 다운로드
이 절 차 는 여러 가지 방법 으로 실현 할 수 있 지만 목적 은 하나 밖 에 없다. 그것 이 바로:
웹 페이지 Url 을 지정 하여 웹 페이지 소스 코드 를 얻 습 니 다.
1. WebClient 다운로드 사용:
//...
// WebClient
using System.Net;
//...
WebClient wbDown = new WebClient();
string strResult = wbDown.DownloadString("http://www.baidu.com/");
//OK,strResult
//...
장점: 편리 하고 빠 르 며 System. Net. WebClient 를 직접 호출 하면 다운로드 할 수 있 으 며 대부분의 웹 페이지 를 다운로드 할 수 있 습 니 다.
단점: 사용자 이름과 비밀번호 가 필요 한 사 이 트 를 만나면 골 치 아프다.
2. HttpWebRequest 와 HttpWebResponse 사용
//...
using System.Net;
using System.IO;
//
string strUrl = "http://www.baidu.com/";
HttpWebRequest Request = (HttpWebRequest)WebRequest.Create(strUrl);
HttpWebResponse Response = (HttpWebResponse)Request.GetResponse();
StreamReader sr = new StreamReader(Response.GetResponseStream(), System.Text.Encoding.GetEncoding("gb2312"));
string strResult = sr.ReadToEnd();
//...
장점: 유연성 이 비교적 커서 다양한 데 이 터 를 다운로드 할 수 있 고 설정 한 후에 사용자 이름 비밀 번 호 를 가 진 웹 페이지 를 다운로드 할 수 있 으 며 쿠키 를 전달 할 수 있 습 니 다.
단점: 코드 가 많 고 우아 하지 않 으 므 로 포장 후 사용 하 는 것 을 권장 합 니 다.
3. 웹 브 라 우 저 사용
WebBrower 는 작은 것 이나 mini IE 에 해당 합 니 다. 창 에 이 컨트롤 을 표시 하고 구체 적 인 웹 페이지 를 볼 수 있 습 니 다. 앞의 몇 가 지 는 볼 수 없습니다. 물론 원 하신 다 면 숨 길 수도 있 습 니 다.
i) 웹 브 라 우 저 숨 기기
//...
string Url = @"http://www.baidu.com/";
WebBrowser wb = new WebBrowser()
{
Url = new Uri(Url)
};
while (!wb.DocumentText.Contains("
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
MySQL에서 머신러닝용 경마 데이터 준비하지만 자유형 구축의 논리에도 시간이 걸리고 자유형 자체에도 시간이 걸리는 점 등을 고려해 이번에는 중앙경마를 주최하는 JRA가 제공하는 JRA-VAN 데이터 실험실의 무료 체험판에 첨부된 DVD 데이터로 MySQL...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.