줄리우스의 첫걸음

3126 단어 HardOffFreeBSDJulius
조금이라도 Julius를 FreeBSD로 시도해 보았습니다.

FreeBSD 10.4R에서 일단 github의 Julius의 브런치을 clone하고 configure하고 make하면 빌드가 통과하지 않습니다.

하나는 devname이라는 이름을 시스템 헤더가 사용하게 되어 에러가 되게 된 것, 하나는 FreeBSD용 코드에서의 변수명의 실수였습니다. 이들은 수정하여 풀릭 내놓았습니다. 이제 FreeBSD로 뭔가 아무도 빌드하지 않았을지도 모르겠네요.

나중에 gmake가 아니면 통과하지 않는 것 같습니다만, 이것은 프로젝트의 방침일지도 모르기 때문에, 솔직하게 gmake를 사용하기로 합니다.

빌드가 지나면 julius/julius라는 실행 파일이 생깁니다.
% ./julius/julius 
Julius rev.4.4.2.1 - based on 
JuliusLib rev.4.4.2.1 (fast)  built for x86_64-unknown-freebsd10.4

Copyright (c) 1991-2016 Kawahara Lab., Kyoto University
Copyright (c) 1997-2000 Information-technology Promotion Agency, Japan
Copyright (c) 2000-2005 Shikano Lab., Nara Institute of Science and Technology
Copyright (c) 2005-2016 Julius project team, Nagoya Institute of Technology

Try '-setting' for built-in engine configuration.
Try '-help' for run time options.

FreeBSD에서는 기본적으로 시스템 사운드 장치를 인식하지만 볼륨을 조정해야 합니다.
% mixer mic 80:80
Setting the mixer mic from 0:0 to 80:80.

실제로 인식시키기 위해서는 dictation-kit 라는 파일이 필요하며 이것도 다운로드합니다. 여기에 들어있는 구성 파일에서 julius를 시작해보십시오.
% cd dictation-kit-v4.4
% ~/julius/julius/julius -C main.jconf -C am-gmm.jconf

시작하면 로그가 흐르고 다음 줄이 나오고 인식을 시작합니다.
<<< please speak >>>

mic의 볼륨이 너무 커서 노이즈 레벨이 높으면 이 표시가 되지 않기 때문에 mixer 명령으로 볼륨을 내립니다.

이야기 해 봅시다.
Stat: adin_freebsd: device name = /dev/dsp (application default)
STAT: AD-in thread created
pass1_best:  台風 が き ます 。
pass1_best_wordseq: <s> 台風+名詞 が+助詞 き+動詞 ます+助動詞 </s>
pass1_best_phonemeseq: silB | t a i f u: | g a | k i | m a s u | silE
pass1_best_score: -5068.315918
### Recognition: 2nd pass (RL heuristic best-first)
STAT: 00 _default: 24732 generated, 2380 pushed, 322 nodes popped in 205
sentence1:  台風 が 来 ます 。
wseq1: <s> 台風+名詞 が+助詞 来+動詞 ます+助動詞 </s>
phseq1: silB | t a i f u: | g a | k i | m a s u | silE
cmscore1: 0.504 0.486 0.768 0.125 0.795 1.000
score1: -5068.802734



인식할 수 있었습니다.

인식률은 그다지 좋지 않습니다. 배후에 세미의 울음소리 등이 들어가 버리면 인식하지 않게 되는 것 같습니다.

오디오 디바이스는 많이 가지고 있습니다만, 소비세가 5%였을 무렵에 HardOff로 105엔으로 사 온 Skype용의 전화형 USB 모듈을 사용해 보았습니다. 이 모듈은 C-MEDIA라는 회사의 CM109라는 칩을 사용하고 있습니다만, 상당히 좋은 것 같은 생각이 듭니다. 객실 승무원처럼 테스트 해 보았습니다. 참고 : 객실 승무원 Poku 전화를 받고 싶다 - 데일리 포털 Z



여러가지 시도하고 깨달았지만, 이 장치의 마이크는 음성용으로 컴프레서가 들어 있는 것 같은 느낌이 듭니다. Julius를 사용하는 경우 마이크의 특성도 상당히 영향을 미칠 것으로 보입니다.

무슨 일이 일어나고 있는지 궁금합니다. :)

좋은 웹페이지 즐겨찾기