Azure Databricks의 데이터 소스로 Azure Blob Storage를 사용할 때 연결하는 방법
3070 단어 AzureDatabricksAzureStorage
기본적으로는 2종류가 있으며,
이번에는 전자에 대해 살펴 보겠습니다.
다양한 리소스 만들기
이번은 Databricks 측에 시크릿의 스코프(키의 콜렉션)를 등록하는 것으로, Blob Storage와 접속합니다.
먼저 Storage Account에 대한 액세스 키를 비밀로 KeyVault에 저장합니다. 만든 Storage Account에서 액세스 키로 이동하여 key1을 복사합니다.
그런 다음 키를 키 컨테이너에 비밀로 배치합니다. 작성한 키 컨테이너에서 시크릿으로 이동하여 생성/가져오기를 선택합니다.
를 설정하고 만듭니다.
그런 다음 Databricks 측 설정으로 이동합니다.
Azure Databricks instance의 개요에서 URL을 검토합니다.
그 URL에 대해 다음과 같은 형태로 액세스합니다.
https://<your_azure_databricks_url>#secrets/createScope
키 컨테이너의 [속성]에서 다양한 값을 복사하여 설정합니다. Manage Principal은 Creator로 만들 때 오류가 발생했습니다.
설정 후 [Create]합니다. 이렇게 하면 KeyVault가 Databricks의 Scope에 등록할 수 있었습니다.
그런 다음 샘플 데이터를 Blob Storage 컨테이너에 업로드합니다. 여기에서
samplecontainer
를 만들고 sales.txt
를 업로드했습니다.마지막으로 Databricks의 노트북에서 연결을 확인합니다. 클러스터를 적절하게 작성하십시오. 노트북의 셀에 대해 다음 코드를 실행합니다.
dbutils.fs.mount(
source = "wasbs://<container-name>@<storage-account-name>.blob.core.windows.net",
mount_point = "/mnt/<mount-name>",
extra_configs = {"fs.azure.account.key.<storage-account-name>.blob.core.windows.net":dbutils.secrets.get(scope = "<scope-name>", key = "<key-name>")})
mount 함수에 대해 True가 돌아오면 성공입니다. Cmd2 쪽에서는 내용의 확인을 하고 있습니다.
참조
Reference
이 문제에 관하여(Azure Databricks의 데이터 소스로 Azure Blob Storage를 사용할 때 연결하는 방법), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/zukakosan/items/ee9ed4081d62b2890c20
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여(Azure Databricks의 데이터 소스로 Azure Blob Storage를 사용할 때 연결하는 방법), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/zukakosan/items/ee9ed4081d62b2890c20텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)