【그 1】Python으로 headless-chrome에서의 스크래핑(Docker Hub/Google CONTAINER REGISTER 등록편)
소개
시작하기 전에 다음이 필요합니다.
Docker 이미지 생성
docker 다운로드
Dockerfile 만들기
Dockerfile
FROM python:3
MAINTAINER kojipon <[email protected]>
# Install libraries.
RUN apt-get update -qqy \
&& apt-get -qqy install unzip curl wget xvfb xz-utils zlib1g-dev libssl-dev mysql-client
# Install Google Chrome.
RUN wget -q -O /tmp/google-chrome-stable_current_amd64.deb https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb \
&& dpkg -i /tmp/google-chrome-stable_current_amd64.deb \
; apt-get -qqyf install
# Install chromedriver.
RUN wget -q -O /tmp/chromedriver.zip http://chromedriver.storage.googleapis.com/`curl -sS chromedriver.storage.googleapis.com/LATEST_RELEASE`/chromedriver_linux64.zip \
&& unzip /tmp/chromedriver.zip chromedriver -d /usr/local/bin/
# Install GCP tools.
RUN wget -q -O /tmp/cloud_sql_proxy https://dl.google.com/cloudsql/cloud_sql_proxy.linux.amd64 \
&& mv /tmp/cloud_sql_proxy /usr/local/bin/cloud_sql_proxy \
&& chmod +x /usr/local/bin/cloud_sql_proxy
# Install Japanese font.
RUN wget -q --content-disposition -O /tmp/IPAfont00303.zip http://ipafont.ipa.go.jp/old/ipafont/IPAfont00303.php \
&& unzip /tmp/IPAfont00303.zip -d /usr/share/fonts/ \
&& fc-cache -fv
# Install python libraries
RUN pip install selenium pytz google-cloud-bigquery mysql-connector-python-rf
$ git clone [email protected]:<your-account>/docker-python3-chrome-gcp.git
$ cd docker-python3-chrome-gcp
$ vi Dockerfile
<Dockerfile の内容を記載>
$ git add-commit -m "Added Dockerfile."
<備考: add-commit = !git add -A && git commit>
$ git push -u origin master
$ docker build --no-cache -t python3-chrome-gcp .
※ キャッシュが古くて更新させれていないパッケージがある場合は --no-cache で回避
$ docker run -it --name dev1 python3-chrome-gcp bash
$ echo " ¥
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
options = Options()
options.add_argument('--headless')
driver = webdriver.Chrome(chrome_options=options)
driver.get('https://www.google.co.jp/')
print(driver.title)
driver.quit()
" >> sample.py
$ python sample.py
Docker 등록
Docker Hub와 Github의 협력
Google CONTAINER REGISTRY와 Github 간의 협력
イメージ名の gcr.io/$PROJECT_ID / $REPO_NAME:$COMMIT_SHA の gcr.io/$PROJECT_ID まではそのままでなければイメージを PUSH できません
【그 2】Python으로 headless-chrome에서의 스크래핑(Google Cloud SQL / Google Storage 구축편) 에 계속
Reference
이 문제에 관하여(【그 1】Python으로 headless-chrome에서의 스크래핑(Docker Hub/Google CONTAINER REGISTER 등록편)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/kojipon/items/e5686c1412a69905e4bf텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)