amazon SageMaker sample을 하나씩 검증해 봅니다 [1]

BlazingText

Word2vec 과 텍스트 분류 알고리즘의 고도로 최적화된 구현을 제공해 주고, 그 Word2vec 알고리즘은, 단어를 고품질의 분산 벡터에 매핑 해 주는 것이라고 합니다 (잘 모르겠습니다).

요컨대, 비슷한 단어는 비슷한 값의 벡터를 가지고 있기 때문에 그것을 분류합시다는 느낌. 이것이 할 수 있으면, 단어의 분류라든가 문장의 의미 해석 따위가 할 수 있게 된다, 라고.

자세한 내용은 여기 BlazingText 알고리즘

1. blazingtext_hosting_pretrained_fasttext.ipynb

BlazingText가 사전 훈련된 텍스트 분류와 Word2Vec 모델의 FastText 모델 호스팅을 지원하는 방법을 보여줍니다.

설명은 영어로 쓰여 있으므로, 수시로 Google 번역으로 무엇을 하고 있는지 확인.
기본은 샘플 코드를 그대로 실행합니다.

Introduction

파라미터 지정

Hosting the Language Idenfication model by FastText
언어 식별을 위해 FastText에서 사용할 수 있는 사전 교육 모델 활용

FastText 웹 사이트에서 언어 식별(텍스트 분류) 모델[1]을 다운로드합니다.

그런 다음 모델을 tar로 압축하고 Python SDK에서 사용 가능한 유틸리티를 사용하여 S3에 업로드합니다. 데이터의 로컬 복사본이 더 이상 필요하지 않으므로 삭제합니다.

model.bin이 완료되었습니다.

Creating SageMaker Inference Endpoint
추론용 엔드포인트 의 작성을 실시합니다.

그런 다음 여러 언어의 끝점에 여러 문장을 전달하여 언어 식별이 예상대로 작동하는지 확인합니다.

····· 아마 잘 가고 있다고 생각됩니다.
추론 - 엔드포인트 설정 및 엔드포인트 페이지에서 엔드포인트가 성공적으로 작성되었는지 확인했습니다.

Stop/Close the Endpoint (Optional)
실시간 예측을 제공하기 위해 엔드포인트를 계속 실행할 필요가 없는 경우 노트북을 닫기 전에 엔드포인트를 삭제합니다.

이 페이지에서 작성된 것이 사라지고 있으면 완료.

Reference

이 문제에 관하여(amazon SageMaker sample을 하나씩 검증해 봅니다 [1]), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/KisaMM/items/2c6b0b03fd4700207b78

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다