익명 IP(월 10달러)로 가시가시 Scraping, Ruby+Nokogiri 소스 첨부
인사말
익명 IP를 회전시켜 액세스 제한에 신경 쓰지 않고 Gashigashi Scraping 방법을 소개합니다.
이번에는 Ruby + Nokogiri로 끝나는 간단한 것들을 소개합니다.
htp // p 여과 xy sh. 코m/
htp // p 여과 xy sh. 코m/ 우선 여기에서 회원 등록.
무료 버전도 있기 때문에 끝내면 괜찮을 것입니다.
여기에 등록한 username
①과 password
②는 나중에 사용하므로 삼가한다.
대시 보드에 표시된 인증 된 프록시의 호스트 3 및 포트 4를 삼가하십시오.
노코기리의 고고
#open
의 proxy_http_basic_authentication
옵션을 사용하면
require "open-uri"
class OpenWithProxy
def initialize(proxy_host, proxy_port, username, pass)
@proxy_uri = URI.parse("#{proxy_host}:#{proxy_port}")
@username = username
@pass = pass
end
def open(url)
Kernel.open(url, proxy_http_basic_authentication: [@proxy_uri, @username, @pass])
end
end
owp = OpenWithProxy.new('③で控えたやつ', '④で控えたやつ', '①で控えたやつ', '②で控えたやつ')
# こんな感じ. owp = OpenWithProxy.new('http://us.proxymesh.com', '31280', 'username', 'password')
제대로 프록시를 씹는지 확인
사용하면 IP를 볼 수 있습니다.
require 'json'
check_ip = -> { JSON.parse(owp.open('http://api.ipify.org?format=json').read)['ip'] }
check_ip.call
#=> "166.78.113.337"
check_ip.call
#=> "166.28.153.347"
check_ip.call
#=> "192.237.163.323"
...
오, 10 개의 IP 중에서 매번 무작위로 선택되는 것 같습니다.
노코기리에게 건네주고 가시가시
require 'nokogiri'
doc = Nokogiri::HTML owp.open('https://www.google.com')
doc.title
#=> "Google"
좋아!
Reference
이 문제에 관하여(익명 IP(월 10달러)로 가시가시 Scraping, Ruby+Nokogiri 소스 첨부), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/gogotanaka/items/ef1b265379293f9f0bd6
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
#open
의 proxy_http_basic_authentication
옵션을 사용하면require "open-uri"
class OpenWithProxy
def initialize(proxy_host, proxy_port, username, pass)
@proxy_uri = URI.parse("#{proxy_host}:#{proxy_port}")
@username = username
@pass = pass
end
def open(url)
Kernel.open(url, proxy_http_basic_authentication: [@proxy_uri, @username, @pass])
end
end
owp = OpenWithProxy.new('③で控えたやつ', '④で控えたやつ', '①で控えたやつ', '②で控えたやつ')
# こんな感じ. owp = OpenWithProxy.new('http://us.proxymesh.com', '31280', 'username', 'password')
제대로 프록시를 씹는지 확인
사용하면 IP를 볼 수 있습니다.
require 'json'
check_ip = -> { JSON.parse(owp.open('http://api.ipify.org?format=json').read)['ip'] }
check_ip.call
#=> "166.78.113.337"
check_ip.call
#=> "166.28.153.347"
check_ip.call
#=> "192.237.163.323"
...
오, 10 개의 IP 중에서 매번 무작위로 선택되는 것 같습니다.
노코기리에게 건네주고 가시가시
require 'nokogiri'
doc = Nokogiri::HTML owp.open('https://www.google.com')
doc.title
#=> "Google"
좋아!
Reference
이 문제에 관하여(익명 IP(월 10달러)로 가시가시 Scraping, Ruby+Nokogiri 소스 첨부), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/gogotanaka/items/ef1b265379293f9f0bd6
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
require 'nokogiri'
doc = Nokogiri::HTML owp.open('https://www.google.com')
doc.title
#=> "Google"
Reference
이 문제에 관하여(익명 IP(월 10달러)로 가시가시 Scraping, Ruby+Nokogiri 소스 첨부), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/gogotanaka/items/ef1b265379293f9f0bd6텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)