kubeflow on Rancher 에 Pod has unbound PersistentVolumeClaims 오류

kubeflow를 Rancher (v2.2.3)로 배포했을 때 멈춘 점의 메모.

사건



전제로 다음과 같이 AWS EC2에 Rancher에서 k8s 클러스터를 구축하고 카탈로그에서 "kubeflow"를 선택하여 실행



그러면 겉보기 배포는 성공한 것처럼 보이며 kubeflow 대시보드에도 액세스할 수 있다.



다음에 「Jupyterhub」를 기동하면, 아래의 「Spawning Server」의 상태로부터 진행하지 않고, 결과 에러가 된다.



로그를 확인하면 다음 오류가 발생합니다.
Pod has unbound PersistentVolumeClaims

원인과 대처



원인은 에러 로그대로, Persistent Volume(영구 스토리지)가 올바르게 설정되어 있지 않기 때문입니다.
kubeflow의 컴퍼넌트 「vizier-db」가 영속 스토리지를 필수로 하는 것 같다.

대처는, GitHub issues의 「oganhz commented on 9 Oct 2018」의 레스가 참고가 되었다.

카탈로그에서 "nfs-provisioner"를 만든 후 kubeflow를 배포하여 오류를 해결합니다.
이것이 영구 스토리지를 케어해 준다.



우선 설정은 모두 디폴트로 기동하면(자), Storage Class가 생성된다.



그런 다음 kubeflow를 시작하면 PersistentVolume 마운트가 필요한 구성 요소가 잘 구성되어 오류없이 시작할 수있었습니다.





참고

좋은 웹페이지 즐겨찾기