GCP의 Cloud Text-to-Speech API를 활용하는 간단한 방법(cURL 사용)

소개



GCP(Google Cloud Platform)에는 Cloud Text-to-Speech라는 텍스트를 음성으로 변환하는 서비스가 있습니다.
이번에는, cURL을 이용해, 우선 어려운 것을 생각하지 않고 바삭하게 사용해 보겠습니다.

사전 준비



Cloud Text-to-Speech API 문서의 빠른 시작: 명령줄 사용의 시작하기 전에를 참조하여 환경을 준비합니다.
h tps : // c ぉ d. 오, ぇ. 코 m / xt - s 페어 ch / cs / 쿠키 cks rt-p 여과 l

Cloud SDK는 아래에서 다운로드할 수 있습니다.
h tps : // c ぉ d. 오, ぇ. 이 m/sdk/두 cs/

명령



다음 명령을 실행합니다.
curl \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
--data "`cat <入力ファイル名> | sed 's/"/@@@/g' | sed "s/@@@/'/g"`" \
"https://texttospeech.googleapis.com/v1/text:synthesize" | \
jq -r '.audioContent' | \
base64 --decode  > <出力ファイル名>.mp3

입력 파일



다음과 같은 내용의 JSON 파일을 지정합니다. (절대 경로 또는 상대 경로)
둘러싸는 문자는 더블 쿼트, 싱글 쿼트 어느 쪽이라도 OK(커맨드측에서 차이를 흡수)

※문자열에 싱글 쿼트나 더블 쿼트가 존재하는 경우의 고려는 하고 있지 않으므로, 그러한 문장을 처리하는(sed로 가공하는) 필요가 있는 경우는, 적절히 조정이 필요합니다. sed로 가공하는 것이 귀찮은 경우는, 미리 텍스트 에디터 등으로 더블 쿼트를 싱글 쿼트로 치환해 둡니다.
{
   'input':{
      'text':'Android is a mobile operating system developed by Google,
         based on the Linux kernel and designed primarily for
         touchscreen mobile devices such as smartphones and tablets.'
   },
   'voice':{
      'languageCode':'en-gb',
      'name':'en-GB-Standard-A',
      'ssmlGender':'FEMALE'
   },
   'audioConfig':{
      'audioEncoding':'MP3'
   }
}

덧붙여 아래의 URL의 「시험합시다」로 문장과 조건을 설정해, 「Show JSON」을 클릭하면, 상기 포맷과 같은 JSON 텍스트를 취득할 수 있습니다. 매우 편리합니다.

Cloud Text-to-Speech
h tps : // c ぉ d. 오, ぇ. 이 m/에서 xt-s-pe ch/? hl = 그럼



다음 출력 결과를 파일로 저장합니다.


출력 파일



임의의 파일 이름을 지정합니다. 확장자는 mp3입니다.

참고 정보



Cloud Text-to-Speech API 문서
h tps : // c ぉ d. 오, ぇ. 이 m/에서 xt-s-pee ch/do cs/? hl = 그럼

좋은 웹페이지 즐겨찾기