python 바 이 두 음성 인식 api 호출

최근 음성 검색 관련 일 을 처리 하고 있 습 니 다.
그 중에서 음성 인식 을 사용 하고 메시지 와 바 이 두 의 api 를 호출 합 니 다.전 자 는 js 를 사용 하 는 것 이 실현 되 고 후 자 는 python 3 으로 이 루어 집 니 다(자신 이 python 을 사용 하기 때 문 입 니 다)
환경:
python3.5
centos 7
흐름
전체 바 이 두 음성 인식 restapi 사용 은 세 부분 으로 나 뉜 다.
1(동작 신청)응용 프로그램 을 만 들 고 응용 프로그램의 API Key 와 Secret Key 를 가 져 옵 니 다.
2(프로그램 구현)알 고 있 는 애플 리 케 이 션 의 API Key 및 Secret Key 를 통 해 post 요청 보 내기https://openapi.baidu.com/oauth/2.0/token 토 큰 가 져 오기
3(프로그램 구현)지난 절 차 를 통 해 얻 은 token,post 를 통 해 관련 음성 메 시 지 를 보 냅 니 다.http://vop.baidu.com/server_api,식별 결 과 를 가 져 옵 니 다.
이상 과정 참고바 이 두 음성 개발 문서또는 인터넷 자료.
python 구현
프로그램 전 체 는 다음 과 같 습 니 다.

import requests
import json
import uuid
import base64

def get_token():
 url = "https://openapi.baidu.com/oauth/2.0/token"
 grant_type = "client_credentials"
 api_key = "NzGBYD0jPFDqVT8VHRYa****"  #        
 secret_key = "8439155b9db2040b4acd13b0c*****" #        
 data = {'grant_type': 'client_credentials', 'client_id': api_key, 'client_secret': secret_key}
 r = requests.post(url, data=data)
 token = json.loads(r.text).get("access_token")
 return token


def recognize(sig, rate, token):
 url = "http://vop.baidu.com/server_api"
 speech_length = len(sig)
 speech = base64.b64encode(sig).decode("utf-8")
 mac_address = uuid.UUID(int=uuid.getnode()).hex[-12:]
 rate = rate
 data = {
 "format": "wav",
 "lan": "zh",
 "token": token,
 "len": speech_length,
 "rate": rate,
 "speech": speech,
 "cuid": mac_address,
 "channel": 1,
 }
 data_length = len(json.dumps(data).encode("utf-8"))
 headers = {"Content-Type": "application/json",
 "Content-Length": data_length}
 r = requests.post(url, data=json.dumps(data), headers=headers)
 print(r.text)


filename = "two.wav"

signal = open(filename, "rb").read()
rate = 8000

token = get_token()
recognize(signal, rate, token)

동시에 음성 정 보 를 얻 는 것 은 다음 과 같다.

import scipy.io.wavfile
filename = "two.wav"
rate, signal = scipy.io.wavfile.read(filename=filename)

이상 이 바로 본 고의 모든 내용 입 니 다.여러분 의 학습 에 도움 이 되 고 저 희 를 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.

좋은 웹페이지 즐겨찾기