amazon SageMaker sample을 하나씩 검증해 봅니다 [1]

2619 단어 JupyterPython3AWS

BlazingText



Word2vec 과 텍스트 분류 알고리즘의 고도로 최적화된 구현을 제공해 주고, 그 Word2vec 알고리즘은, 단어를 고품질의 분산 벡터에 매핑 해 주는 것이라고 합니다 (잘 모르겠습니다).

요컨대, 비슷한 단어는 비슷한 값의 벡터를 가지고 있기 때문에 그것을 분류합시다는 느낌. 이것이 할 수 있으면, 단어의 분류라든가 문장의 의미 해석 따위가 할 수 있게 된다, 라고.

자세한 내용은 여기 BlazingText 알고리즘

1. blazingtext_hosting_pretrained_fasttext.ipynb



BlazingText가 사전 훈련된 텍스트 분류와 Word2Vec 모델의 FastText 모델 호스팅을 지원하는 방법을 보여줍니다.

설명은 영어로 쓰여 있으므로, 수시로 Google 번역으로 무엇을 하고 있는지 확인.
기본은 샘플 코드를 그대로 실행합니다.

Introduction

파라미터 지정




Hosting the Language Idenfication model by FastText
언어 식별을 위해 FastText에서 사용할 수 있는 사전 교육 모델 활용

FastText 웹 사이트에서 언어 식별(텍스트 분류) 모델[1]을 다운로드합니다.


그런 다음 모델을 tar로 압축하고 Python SDK에서 사용 가능한 유틸리티를 사용하여 S3에 업로드합니다. 데이터의 로컬 복사본이 더 이상 필요하지 않으므로 삭제합니다.


model.bin이 완료되었습니다.

Creating SageMaker Inference Endpoint
추론용 엔드포인트 의 작성을 실시합니다.

그런 다음 여러 언어의 끝점에 여러 문장을 전달하여 언어 식별이 예상대로 작동하는지 확인합니다.


····· 아마 잘 가고 있다고 생각됩니다.
추론 - 엔드포인트 설정 및 엔드포인트 페이지에서 엔드포인트가 성공적으로 작성되었는지 확인했습니다.

Stop/Close the Endpoint (Optional)
실시간 예측을 제공하기 위해 엔드포인트를 계속 실행할 필요가 없는 경우 노트북을 닫기 전에 엔드포인트를 삭제합니다.


이 페이지에서 작성된 것이 사라지고 있으면 완료.

좋은 웹페이지 즐겨찾기