C\#Selenium+PhantomJS 로 데이터 캡 처

2437 단어 C#붙잡다데이터
수중 항목 은 js 로 표 시 된 사이트 의 데 이 터 를 캡 처 해 야 합 니 다.자주 사용 하 는 httpclient 를 사용 하여 잡 은 페이지 는 데이터 가 없습니다.인터넷 바 이 두 를 살 펴 보 니 여러분 이 추천 하 는 방안 은 PhantomJS 를 사용 하 는 것 입 니 다.PhantomJS 는 인터페이스 가 없 는 webkit 브 라 우 저 로 브 라 우 저 효과 와 일치 하 게 js 렌 더 링 페이지 를 사용 할 수 있 습 니 다.Selenium 은 웹 테스트 프레임 워 크 입 니 다.Selenium 을 사용 하여 PhantomJS 를 조작 할 수 있 습 니 다.하지만 인터넷 의 예 는 대부분 파 이 썬 의 것 이다.어 쩔 수 없 이 python 을 다운로드 하여 튜 토리 얼 에 따라 만 들 었 는데 Selenium 도입 문제 에 걸 렸 습 니 다.결국 포기 하고 자신 이 관용 하 는 c\#를 사용 하 세 요.c\#에 없 는 것 을 믿 지 않 습 니 다.30 분 동안 의 고생 끝 에 해결 되 었 다.이 박문 을 기록 해서 c\#를 하 는 초보 자 들 이 PhantomJS 를 사용 할 수 있 도록 기다 리 겠 습 니 다.
첫 번 째 단계:visual studio 2017 에 콘 솔 프로젝트 를 새로 만 들 고 nuget 패키지 관리 자 를 엽 니 다.

2 부:Selenium 을 검색 하여 Selenium.WebDriver 를 설치 합 니 다.메모:프 록 시 를 사용 하려 면 3.0.0 버 전 을 설치 하 는 것 이 좋 습 니 다.

세 번 째 단계:다음 그림 과 같은 코드 를 쓰 세 요.근 데 집행 할 때 잘못 보고 해 요.PhantomJS.exe 를 찾 을 수 없 기 때 문 입 니 다.이 럴 때 하 나 를 다운로드 할 수도 있 고 네 번 째 단 계 를 계속 볼 수도 있다.

using OpenQA.Selenium;
using OpenQA.Selenium.PhantomJS;
using System;
namespace ConsoleApp1
{
 class Program
 {
 static void Main(string[] args)
 {
  var url = "http://www.baidu.com";
  IWebDriver driver = new PhantomJSDriver(GetPhantomJSDriverService());
  driver.Navigate().GoToUrl(url);
  Console.WriteLine(driver.PageSource);
  Console.Read();
 }
 private static PhantomJSDriverService GetPhantomJSDriverService()
 {
  PhantomJSDriverService pds = PhantomJSDriverService.CreateDefaultService();
  //         
  //pds.Proxy = $"{ip}:{port}"; 
  //           
  //pds.ProxyAuthentication = GetProxyAuthorization();
  return pds;
 }
 }
}

STEP 4:nuget 을 열 어 Selenium.PhantomJS.WebDriver 패 키 지 를 설치 합 니 다.

다섯 번 째 단계:운행.phantomjs.exe 가 자동 으로 다운로드 되 는 것 을 볼 수 있 습 니 다.

자,이제 당신 의 데이터 캡 처 를 시작 할 수 있 습 니 다.
이상 은 본 고의 모든 내용 입 니 다.본 고의 내용 이 여러분 의 학습 이나 업무 에 어느 정도 도움 이 되 기 를 바 랍 니 다.또한 저 희 를 많이 지지 해 주시 기 바 랍 니 다!

좋은 웹페이지 즐겨찾기