사쿠라 서버에서 정기적인 Python 스크래핑을 위해 cron 설정 방법.

소개



정기적으로 스크레이핑 하려면 cron 설정을 해야 하는 것 같고, 검색하면 오래된 기사에서 너무 알기 어려웠기 때문에 독자적인 방법을 기재했습니다.

스크래핑에 대해서는 전회 쓰고 있으므로 스크래핑을 하고 싶은 사람은 아래의 링크에서 봐 주세요
htps : // 코 m / 케이 _ 케이 _ 케이 / ms / 730 ba 09 7830 d5c00 a 1c

그럼 실제로 설정합시다.



터미널을 열고 사쿠라 서버에 로그인합니다.

아래 명령을 실행합니다.
ssh アカウント名@初期ドメイン(xxx.sakura.ne.jp)

비밀번호를 듣기 때문에 도메인 ID를 칠 때 필요한 비밀번호를 입력.% 가 나오면 로그인할 수 있었습니다.


사쿠라 서버의 파이썬 버전은 오래된



파이썬 버전이 오래되었으므로 버전을 올리려고하면 모두 필사적이지만 귀찮습니다.path 도 바꿔야 하기 때문에 더욱 귀찮아서 그대로.

하지만! 그대로 움직이면 오류가


Traceback (most recent call last):
  File "train_mnist.py", line 4, in <module>
    import requests
ImportError: No module named requests

로컬은 Python3. 사쿠라는 Python2.



로컬에서
pip install (外部モジュール名)

설치하고 움직였다고 생각합니다.

사쿠라에도 외부 모듈의 설치가 필요.

사쿠라 버전 낮고 pip 사용할 수 없습니다.



눈치채는 분은 pip로 인스톨 하려고 합니다만, 할 수 없습니다.

따라서 필요한 모듈은 아래와 같이 설치하십시오.
python -m install requests

이번에는 requests를 설치했지만,
Beautiful Soup을 설치하고 싶은 분은 아래의 명령
python -m install beautifulsoup4

이런 식으로 필요한 모듈을 설치합니다.

이번에 사용하는 외부 모듈을 설치할 수 있으면 터미널에서의 작업은 끝.

사쿠라 서버를 설정합니다.



계약중인 사쿠라 서버에 로그인합니다.





애플리케이션 설정에서 ⓵의 cron 설정 링크를 클릭합니다.





⓵을 누르면 ⓶의 신규 항목의 추가 링크가 나오는 화면으로 진행합니다.
그대로 ⓶의 새 항목 추가를 누릅니다.

cron을 얼마나 자주 움직이는지 설정해 갑니다.





⓵에는cd /home/自分のアカウント名/www/ファイルのあるディレクトリ;<半角スペース>/usr/local/bin/python<半角スペース>対象ファイル.py
⓶에는
설명에 있는 대로 몇 달의 며칠의 몇시, 몇분마다 움직이고 싶은지 기술합니다.
이미지에서는 2분 간격으로 실행시키고 있습니다.

입력이 끝나면 ⓷ 보내기 버튼을 클릭하십시오.

전송을 누르면 cron 설정 화면으로 돌아가므로 환경 변수 설정




여기에

환경 변수 설정 : PYTHONPATH환경 변수 값 : home/アカウント名/lib/python
위를 입력하고 추가를 클릭

등록 완료! !



실제로 움직이고 있는지 확인합시다.



사쿠라의 cron 설정으로 1> /dev/null를 입력하지 않은 분에게는 메일이 도착합니다.
메일에는 에러가 있는 경우는 에러문이 쓰여 있으므로 확인.
만약, 에러가 나오면 에러대로 해결해 갑니다.

마지막으로 요 확인



사쿠라 파이썬의 기본 인코딩은 ascii입니다.
그래서, 일본어를 내고 싶은 분은 디폴트를 변경해 주세요.
디폴트 인코딩을 확인하고 싶은 분은 먼저 리턴 사쿠라를 터미널을 엽니다.
로그인 하고 python 라고 입력 아래의 커멘드를 실행해 주세요.
% python


>>>import sys
>>>print sys.getdefaultencoding()


기본 인코딩을 확인할 수 있습니다.
이번 작성한 것은 Int형만이 필요했기 때문에 변경하지 않고 죄송했습니다만, 필요한 분은 트라이 해 봐 주세요.

cron 설정으로 만든 사이트는 이쪽



완성 사이트:https://compadre.matrix.jp/aisekiya/

좋은 웹페이지 즐겨찾기