WebSpeecheAPI에서 여러 가지 선택을 해봤어요.

6771 단어 WebSpeechAPI
개시하다
최근에는 이미 많은 OS의 음성인식 등으로 필요성이 약해졌지만, 크롬에 부착된 웹스피치API로 음성 입력 테스트를 할 수는 없다.
OS에 딸린 것은 기본적으로 맞춤형으로 제작할 수 없기 때문에 앞으로 맞춤형을 목표로 현황이 어느 정도의 성능인지 조사한다.
한자와 가명에 대응하는 일본어만 바꾸면 괜찮을 거예요.그러나 숫자가 약해 편차가 생기기도 하고 한자 숫자로 변하기도 한다.
숫자에 관해서는 조화를 통해 해결할 수 있는 패턴수가 아닌 경우가 많기 때문에 전환 후보를 늘려 발견하거나 특정한 프로그램 라이브러리에서 전환해야 한다고 생각합니다.
옵션
우선 공급업체에 위탁해야 하는 수준의 계량요금은 스피치토텍스 솔루션 (러시아 등) 배제가 아니다.개인과 중소벤처기업에서 해야 한다는 전제 조건이기 때문이다.그렇게 힘이 있는 게 3개(2개) 있어요.
(2020년 2월쯤)
스키마 이름
일본어 스트리밍
일본어
개발 규모
사용자 정의
Google SpeechToText


중~대규모(상황에 따라 Storage 연합)

AWS Transcribe
X

대규모(S3 공동 작업 필요)

Watson
?

대규모이었어

Web Speech API


소규모

간단하게 시작하고 싶으므로 웹 스피치 API부터 시도해 봅니다.
다른 서비스의 사용용도는 입력보다는 실시간 사운드와 녹음된 문자로 인해 발생하기 때문에 이렇게 대규모로 변하기 쉽겠죠
해본 일
<body>
  <input id='text'>
  <button id='start'>start</button>
  <button id='stop'>stop</button>
</body>

<script>
   SpeechRecognition = webkitSpeechRecognition || SpeechRecognition;
    const recognition = new SpeechRecognition();
    recognition.maxAlternatives=1;
    recognition.lang = 'ja-JP';
    input_form = document.getElementById('text');
    start_button = document.getElementById('start');
    stop_button = document.getElementById('stop');

    start_button.addEventListener('click', function() {

        recognition.onresult = (event) => {
            console.log(event.results);
            input_form.value = event.results[0][0].transcript;
        }

        recognition.start();
    })

    stop_button.addEventListener('click', function() {
        recognition.stop();

    })
</script>
이미 어디서나 얻을 수 있는 시스템의 인코딩 실험.
시험의 결과
에비오, 소니 등 일부 소기업의 이름도 매우 많다
어려울 것 같은 문자열.
발음하다
기대하다.
결실
한 사람
10000
만 원
열 분
10
순박하고 떫다
한 사람
한 사람
한 사람
숫자계는 매우 어려운 것 같아서 말하자면 한자 숫자로 바꾸기 쉽다.
그래머를 넣을 수 있는 인터페이스도 준비했지만, 그것만으로 전부 산수 숫자로 바꿀 수 있을지 모르겠다.
다른 프로그램 라이브러리에서 변환 처리를 해야 합니다.
여러 모드가 일치하는 것을 표시할 수 있기 때문에, 그것으로 표시합니다
recognition.maxAlternatives
후보를 늘릴 수 있으니까 10
위의 "한 칸"으로 테스트를 해볼게요.

원하는 거 네 번째는 얻을 수 있을 거예요.정규 표현식 매핑에서 숫자만 있는 것을 주우면 해결할 수 있을 것 같지만 확실하지 않다.
상술한 "10"도 테스트할 수 있다

어떻게 된 거야?결과가 달라졌다.환경과 말하는 사람의 기간과 신체 상태 등에 따라 차이가 난다.하지만 이런 상황에서는 숫자만 꺼낼 수 있다.
결론
일반적인 입력 사항 등이라면 웹스피치API나 사전 없이 로그인해도 된다.그러나 입력 항목에 검증이 추가된 경우 예를 들어 숫자만 계산하는 등 몇 가지 선택을 제시하고 그 중에서 선택한다.다른 라이브러리와 연합 변환 같은 처리가 필요합니다.
참고 자료

좋은 웹페이지 즐겨찾기