IBM Watson의 SpeechToText에서 'Android 마이크에서 음성을 집어 글자를 일으키는'앱을 만들었습니다.
Watson에 대한 설명은 이전에 작성한 기사를 참조하십시오.
이번에 사용한 라이브러리
"speech-android-sdk"라는 Android 용 라이브러리를 사용했습니다. 전회 소개한 SDK라면 여러가지 API를 호출할 수 있었습니다만, 이번은 SpeechToText, TextToSpeech에 특화한 것이 됩니다(그 대신, Android와의 친화성은 확실합니다!)
게다가 이 라이브러리의 큰 장점은 무엇보다 이것을 사용하면 "Android의 마이크에서 소리를 집어 음성 인식을 할 수 있다"는 것입니다.
htps : // 기주 b. 코 m / 와트 ぉ - ゔ ぇ ぺぺ r c ぉ d / s ぺえ ch an d 로이 d sdk
이 라이브러리는 IBM Watson의 공식 리포지토리에 등록되어 있습니다.
사용법
htps : // 기주 b. 코 m / 와트 ぉ ゔ ぇ ぺ ぺ r c ぉ d / s ぺえ ch an d 로이 dsdk # 인 s ta 치 온
를 참고해 보세요. 여기서 일본어로 번역한 것을 기술하는 것보다는 이해하기 쉽다고 생각합니다.
아래 코드는 AndroidManifest.xml에 기재되어 있습니다. (마이크와 통신 사용하기 때문에 당연히 당연하지만...)
<uses-permission android:name="android.permission.RECORD_AUDIO"></uses-permission>
<uses-permission android:name="android.permission.INTERNET"></uses-permission>
ISpeechDelegate 는 SpeechToText 를 호출한 후의 이벤트를 따기 위한 인터페이스입니다. 나중에 쓰는 초기화 처리를 위해 사용하기 때문에, 그 전에 구현하는 것이 더 원활하게 간다고 생각합니다.
ISpeechDelegate는 다음과 같은 API입니다.
ISpeechDelegate
public interface ISpeechDelegate {
/**
* SpeechToTextのサーバとの接続が成功した時に呼ばれます。
*/
void onOpen();
/**
* SpeechToTextサービスとのやり取りの間でエラーが発生した時に呼ばれます。
*/
void onError(String error);
/**
* SpeechToTextのサーバとの接続解除がされた時に呼ばれます。
*/
void onClose(int code, String reason, boolean remote);
/**
* SpeechToTextサービスからの解釈結果を受け取ります。認識処理モード中の間にマイクが音を拾うたびに呼ばれます。
*/
void onMessage(String message);
/**
* 音量と振幅のデータを受け取ります。オシロスコープ的なのを作るのに使える???
*/
void onAmplitude(double amplitude, double volume);
}
4. 초기화 처리
음성 인식을 시작하기 전에 다음 초기화 처리를 실행합니다.
SpeechToText.sharedInstance().initWithContext(
URI.create("wss://stream.watsonplatform.net/speech-to-text/api"),
context,
new SpeechConfiguration()); SpeechToText.sharedInstance().setCredentials("YOUR_ACCOUNT", "YOUR_PASSWORD");
SpeechToText.sharedInstance().setDelegate([ISpeechDelegateの実装]);
SpeechToText.sharedInstance().setModel("ja-JP_BroadbandModel");
// 上記モデルの引数で言語を指定することが可能。
개인적인 추천은 initWIthContext를 Application#onCreate내에서 구현해, 상황에 따라서 2행째 이후를 Activity의 어딘가에 구현하는 것이 좋다고 생각합니다. (특히 setModel 근처에서는 앱에 따라서는 언어를 바꾸어 시험하고 싶다는 필요도 있을 것)
5. 인식 개시
SpeechToText.sharedInstance().recognize()
를 실행합니다. Java판 SDK와 달리, 워커스레드상에서 움직인다고 하는 처리를 쓰지 않아도 OK입니다.6. 인식 종료
SpeechToText.sharedInstance().stopRecognize()
를 실행합니다.실제로 만든 앱
이 SDK를 사용하여 'Android의 마이크에서 음성을 집어 글자를 일으키는'앱을 만들었습니다.
응용 프로그램의 소스는 Github에 업로드하고 있으므로 부담없이 DL하고 시도해보십시오.
소감
솔직히, 전회 소개한 SDK보다는 API적으로 사용하기 쉬운 인상이었습니다. 이번에 소개한 것 같은 기능을 빨리 실현하고 싶은 사람에게는 매우 편리해야 할 것이라고 생각합니다. (좀 더 고도의 일을 하고 싶은 경우는···이제 스스로 SDK 쓸 수 밖에 없을까, 라는 생각은 합니다만...)
Reference
이 문제에 관하여(IBM Watson의 SpeechToText에서 'Android 마이크에서 음성을 집어 글자를 일으키는'앱을 만들었습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/LyricalMaestro0/items/c934018a9733d4227b35
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
솔직히, 전회 소개한 SDK보다는 API적으로 사용하기 쉬운 인상이었습니다. 이번에 소개한 것 같은 기능을 빨리 실현하고 싶은 사람에게는 매우 편리해야 할 것이라고 생각합니다. (좀 더 고도의 일을 하고 싶은 경우는···이제 스스로 SDK 쓸 수 밖에 없을까, 라는 생각은 합니다만...)
Reference
이 문제에 관하여(IBM Watson의 SpeechToText에서 'Android 마이크에서 음성을 집어 글자를 일으키는'앱을 만들었습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/LyricalMaestro0/items/c934018a9733d4227b35텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)