Jupyter notebook에서 sister를 사용한 자연 언어 처리 개발 환경을 Docker로 구축
개요
명령 줄 2에서 jupyter notebook 및 자연 언어 처리 라이브러리 sister을 사용하여 개발 환경을 시작합니다.
보통으로 설정하면, Docker 기동마다, sister 의 사전 다운로드가 발생하므로, 사전 데이터를 영속화하는 설정을 더한
docker-compose.yml
를 썼습니다.계기
평소는 Ruby 메인의 개발로, python은 자연 언어 처리를 할 때 밖에 건드리지 않는다.
개발 환경의 구축으로 편하게 하고 싶기 때문에, 곧바로 사용할 수 있는 repository를 만들었습니다.
코드
사용법
docker 설치
도커 메모리 증가
원하는 곳에서 저장소를 복제합니다.
git clone https://github.com/junara/docker_sister_jupyter.git
폴더로 이동합니다.
cd docker_sister_jupyter
docker-compose build
docker-compose up -d
docker-compose down
아니, Docker라면 간단하네요.
확인
http://localhost:8888/?token=jupyter로 이동하십시오.
샘플은 다음과 같습니다. http://localhost:8888/notebooks/work/SampleEnglish.ipynb
import sister
sentence_embedding = sister.MeanEmbedding(lang="ja") # Need long time to download data at first time.
sentence = "私はうさぎです。"
vector = sentence_embedding(sentence)
print(vector)
이런 간지
해설
sister의 cahce를 이하로 local에 volumes에서 영속화 하고 있습니다. 이렇게하면 docker 환경을 다시 작성할 때마다 사전 다운로드가 더 이상 발생하지 않습니다.
docker-compose.yml
volumes:
- ./cache/.sister:/home/jovyan/.sister:delegated
Dockerfile은 이런 느낌. jupyter/scipy-notebook을 기반으로 require.txt에서 라이브러리를 추가 할 수 있습니다.
FROM jupyter/scipy-notebook
COPY requirements.txt /home/jovyan
RUN pip install -r /home/jovyan/requirements.txt
require.txt에 sister를 추가하여 설치하려고합니다. 추가 라이브러리가 있으면 여기에 넣으십시오.
docker-compose exec jupyter pip install -r /home/jovyan/requirements.txt
하면 추가 라이브러리가 설치됩니다.require.txt
sister
이상.
Reference
이 문제에 관하여(Jupyter notebook에서 sister를 사용한 자연 언어 처리 개발 환경을 Docker로 구축), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/junara/items/7fa7abdbdd69c1a05608텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)