본문 바로가기

과제모음

CMU SPHINX - JAVA 음성인식

반응형
JAVA API 로 예제데모로 제공된 JSGF 파일을 이용하여 음성인식을 작성하였다.

패키지 경로를 재설정해주고

API 와 Sphinx4 발음사전이 들어있는 jar 파일들을 라이브러리 참조를 해준후에

grammar 파일을 새로 작성하여 소스를 수정한 결과 인식률이 그럭저럭 80~90% 정도로 올라갔다.

우리가 인식하여야 하는것은 발음사전에 없는 단어도 있기 때문에 

jar 파일의 압축을 풀어 사전파일에 단어들을 추가 및 발음 기호를 참고 하여 발음도 적어준후

이클립스로 다시 컴파일 & 런 결과 인식성공

 => 이론적으로 발음을 참조하여 새로운 단어 인식이 가능하다는 것이 증명됨

내가 해야 할것 
 - JSGF 소스분석 (line by line)
 - 참조된 class 파일들의 분석

초기버전이 인식이 낮았던이유
 - 마이크 상의 문제
   => 마이크의 소위 감도가 좋으면 오히려 입력이 잘 안되는 사태가 발생(발음할때 나는 파열음이라든지 새는발음마저 인식)
       그 결과는 엉뚱한 단어 또는 아예 인식이 되지 않는 결과가 발생한다.
 - 일반적인 헤드셋을 사용함으로써 의외로 쉽게 해결이 된다.
반응형