papermill과 commuter로 JupyterNotebook 중심의 워크플로우 실현
소개
Beyond Interactive: Notebook Innovation at Netflix
실현할 수 있는 일
각 데이터 사이언티스트/엔지니어가 각자의 로컬 환경에서 JupyterNotebook에서 전처리나 모델 개발 노트북을 만들어 실행하지만, 실행 결과의 공유·관리가 귀찮다
검증의 노트북을, 파라미터를 여러가지 바꾸어 실행하고 싶지만, 시리얼로 실행해 가는 것은 귀찮아(노트북 복제해 단번에 흘려도 좋지만 번잡해진다)
papermill에 의해 S3에 노트북이 모여 있지만 확인하고 싶을 때 일부러 다운로드하는 것은 귀찮습니다.
참고 링크
papermill
papermill is a tool for parameterizing, executing, and analyzing Jupyter Notebooks.
커뮤터
commuter reads notebooks from a local directory or Amazon S3
이용 절차
평소대로 노트북으로 코딩
평소대로 노트북으로 코딩
papermill로 노트북 실행
설치 명령
$ pip install papermill
화면 조작
View -> Cell Toorbar -> Tags -> "parameters"
노트북 실행 명령
papermill sample01.ipynb s3://sagemaker-bucket001/outputs/sample01.ipynb -k python3 -p a 4
commuter로 노트북 확인
Dockerfile
FROM node:latest
# run installation/ build commands.
RUN npm -g config set user root & npm i --quiet --no-progress --unsafe-perm -g @nteract/commuter
ENV HOST=0.0.0.0
ENV PORT=4000
EXPOSE 4000
CMD npm run start
docker-compose.yml
version: '3'
services:
commuter:
build:
context: '.'
dockerfile: 'Dockerfile'
ports:
- "14000:4000"
network_mode: "bridge"
environment:
- NODE_ENV=production
- HOST=0.0.0.0
- COMMUTER_STORAGE_BACKEND=s3
- COMMUTER_DISCOVERY_BACKEND=none
- COMMUTER_PORT=4000
# - COMMUTER_LOCAL_STORAGE_BASEDIRECTORY=/app
# - COMMUTER_ES_HOST
- COMMUTER_S3_BASE_PREFIX=outputs
- COMMUTER_S3_PATH_DELIMITER="/"
- COMMUTER_BUCKET=sagemaker-bucket001
- COMMUTER_S3_KEY=<aws_access_key_id>
- COMMUTER_S3_SECRET=<aws_secret_access_key>
# - COMMUTER_S3_ENDPOINT
# volumes:
# - /opt/commuter:/app/commuter
restart: always
command: commuter
시작 명령
$ docker-compose up
결론
Reference
이 문제에 관하여(papermill과 commuter로 JupyterNotebook 중심의 워크플로우 실현), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/noko_qii/items/62a7f70fceb6153620f4텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)