영어 음성을 텍스트화하고 번역하는 방법

영어 음성파일을 Google Speech-to-Text 을 사용하여 텍스트화하고 Google 스프레드시트 으로 번역하는 방법을 들었으므로 해설해 보겠습니다. 여러 가지 방법이 있지만 여기에서는 Google Cloud Platform(GCP)의 Cloud Shell에서 gcloud 명령을 사용하는 방법을 설명합니다.

전체 흐름의 이미지





절차



mp3을 flac로 변환



2020년 2월 29일 현재 Google Speech-to-Text가 공식적으로 지원되는 형식은 flac, wav이므로 이번에는 너네 지금 베 RT. 작은 m을 사용하여 mp3을 flac로 변환합니다. 이번에 사용하는 파일 test.mp3는 전 동료 회사가 개최한 Webinar의 음성입니다.
  • test.mp3너네 지금 베 RT. 작은 m에 업로드
  • 다음 매개 변수를 지정하여 test.mp3


    Parameter
    Value


    Change bit resolution
    16비트

    Change sampling rate
    16000Hz

    Change audio channels
    mono


    변환된 flac 파일 다운로드



    자신의 PC 등에 test.flac를 다운로드해 둡니다.

    GCP 초기 설정


  • Cloud Console 에서 Project 만들기
  • Cloud Speech-to-Text API 사용(검색 창에서 test.flac 에서 검색)

  • Google Cloud Storage(GCS)에 flac 파일 업로드


  • GCS 에서 버킷 만들기 그런 다음 계속 ➡️ 계속 ➡️ 계속 ➡️ 계속 ➡️ 만들기로 진행하십시오.
  • Speech-to-Text 파일 업로드

  • flac 파일 텍스트


  • Cloud Console에서 Cloud Shell 사용을 클릭하여 Cloud Shell 시작
  • gcloud 명령을 사용하여 0228-speech 파일을 텍스트화합니다.
  • 🟢コマンド: test.flac を text 化(バケット名、ファイル名は自分のものを使ってください)
    gcloud ml speech recognize-long-running \
        'gs://0228-speech/test.flac' \
        --language-code='en-US' --async
    
    ℹ️出力結果
    Check operation [operations/8912459795353051547] for status.
    {
      "name": "8912459795353051547" 📣この OPERATION_ID をコピーしておいてください
    }
    
    🟢コマンド: 進行状況チェック(OPERATION_ID は上のステップでコピーしたもの)
    gcloud ml speech operations describe OPERATION_ID
    
    ℹ️出力結果
    {
      "metadata": {
        "@type": "type.googleapis.com/google.cloud.speech.v1.LongRunningRecognizeMetadata",
        "lastUpdateTime": "2020-02-28T12:05:09.348366Z",
        "progressPercent": 28, 📣進捗率 28% ということ
        "startTime": "2020-02-28T11:43:58.633950Z"
      },
      "name": "8912459795353051547"
    }
    
    🟢コマンド: 翻訳作業が終わった後に、test.json ファイルを作成するように。(OPERATION_ID は上のステップでコピーしたもの)
    gcloud ml speech operations wait OPERATION_ID > test.json
    
    ℹ️出力結果
    Waiting for operation [operations/OPERATION_ID] to complete....
    
  • gcloud 명령을 사용하여 test.flac 파일을 GCS로 전송합니다.
  • 🟢コマンド: test.json を Google Cloud Storage に転送
    gsutil cp test.json gs://0228-speech/test.json
    
    🟢コマンド: test.json を Google Cloud Storage で公開
    gsutil acl ch -u AllUsers:R gs://0228-speech/test.json
    
    ℹ️出力結果
    Updated ACL on gs://0228-speech/test.json
    
  • GCS에서 공개 링크를 클릭하고 URL을 복사합니다.


  • GCS에 업로드 된 JSON 파일을 Google 스프레드 시트로 구문 분석



    How to import JSON data into Google Spreadsheets in less than 5 minutes 에 간결한 절차가 있으므로 여기를 참고로 JSON을 구문 분석합니다.
  • Google 스프레드시트 만들기
  • 도구 ➡️ 스크립트 편집기
  • 첫 번째 코드를 모두 제거하고 여기 Script 덮어쓰기
  • test.flac라는 이름으로 저장
  • Google 스프레드시트로 돌아가서 ImportJSON을 사용하여 test.flac 파일을 구문 분석합니다.ImportJSON.gs
  • 이대로라면, GCS 상의 파일을 삭제하면(자) 참조할 수 없게 되므로, 한 번 카피해, 텍스트만을 붙여 넣으면 좋을지도 모릅니다.
  • 성공적으로 퍼스를 얻으면 GOOGLETRANSLATE 함수 을 사용하여 번역하십시오.test.json
  • 완성 이미지는, 이런 느낌입니다.

  • GCS에 업로드한 파일 삭제



    마지막으로 GCS에 업로드한 파일을 삭제합니다. 아직 사용한다고 하는 분은 남겨 두어도 문제 없습니다만, 조금 과금되므로 주의를.
    🟢コマンド: GCS に作成したバケットにあるファイルをすべて削除
    gsutil -m rm gs://0228-speech/**
    

    이상입니다.

    의견, 의뢰등 있으면, Facebook | 트위터 까지 부탁합니다.

    좋은 웹페이지 즐겨찾기