Bluemix에서 Watson ~ Speech to Text 사용해보기

2748 단어 BluemixWatson
Bluemix의 서비스 중에 Watson으로 분류되는 서비스가 많이 있습니다만, 그 서비스가 어떤 것인지 시험해 보겠습니다.
어쨌든 각각이 어려울 것 같습니다.

Speech to Text란?



어쨌든 이름을 본 것만으로 기능이 상상됩니다. 말 그대로 마이크를 향해 말한 말을 텍스트로 해줍니다. 지금 지원하는 것은 영어, 일본어, 스페인어였습니다. 영어, 스페인어 사이에 일본어가 들어있는 것은 굉장하다고 생각합니다. 숫자로 말하면 중국어라든지가 인구가 많을 것 같은데・・・

서비스 추가



우선 서비스 추가. Watson에 분류된 안에 있습니다. 여기에서 내 대시보드에 서비스를 추가합니다. 처음 1000분은 무료이므로 그때까지는 비용이 들지 않습니다. (원래 자신은 트라이얼중이고, 괜찮을 것)

그리고 대시보드에서 Speech to Text 서비스 시작
기동 후의 화면은 이런 느낌입니다.



이 데모 응용 프로그램에서 Speech의 입력은이 화면을 향해 마이크에서 직접 음성을 넣을 수 있으며, 미리 녹음 된 음성 파일을 업로드하여 처리 할 수 ​​있습니다.

우선 해보겠습니다. 일본어에서.
원고라든가 준비해 두면 좋았습니다만, 생각이 들고 이야기를 하고 있으므로 일본어로도 잘못되어 있을지도 모릅니다. 입력 결과는 이런 느낌. 단순한 연설인식이 아니라 백엔드에서 왓슨이 도와주고 있는 만큼, 보리라고 말한 곳에서 말하지 않았는데 생란까지 화면에 표시되어 있던 것 같아요. 「청권 종이」라고 말해 보았습니다만, 자신이 씹어 버렸습니다.



그리고 영어
자신이 말을 걸어도 전혀 안됩니다. 발음이 없는 것 같습니다.
손에 있던 Bose의 헤드폰의 설명을 iPhone에서 흘려, 그것을 입력에 Speech to Text로 처리해 보았습니다.
어때? 이것이라면 괜찮을 것 같습니다. 역시 영어 잘하는 것 같습니다. 상당한 속도로 말하고 있었지만 제대로 따라잡고 있습니다.


요약



Speech to Text는 애플리케이션에 내장되어 사용할 수 있게 되어 있습니다만, 이번 이용한 것은 샘플로서 제공되고 있던 데모 애플리케이션입니다. 실제로 API를 어플리케이션에 짜넣어 보면, 음성 제어나, 녹음 끝난 음성으로부터 텍스트 정보를 일으키는 등 여러가지 용도에 사용할 수 있을 것 같습니다.
BigData로서 음성 파일등을 해석할 때에는, 우선, 이 기능을 사용해 텍스트화해 버리면, 해석을 잘 할 수 있을 것 같습니다.

이번은, PC의 본체에 내장된 마이크를 이용했습니다만, 제대로 헤드셋과 가만하면 더 인식률은 높아질 것 같습니다. 서비스도 단독으로 움직이기 때문에, Bluemix상에서, 우선은, 어느 정도의 정밀도로 인식하는지 시험해 보는 것은 어떻습니까.

좋은 웹페이지 즐겨찾기