본문 바로가기

과제모음

HTK음성인식 초기훈련

반응형
- gram 파일생성
$인식어 = word | word..;
>> hparse gram wdnet 으로 word network 파일 생성

- 발음사전(dict 작성)

- 단어단위 전사파일 작성
=>words.mlf 를 작성함
Master Label File 선언이 필수되어야 함
=>#!MLF!#
~.lab 의 경로를 생성해 준다

mkphones0.led 작성
EX => dict에있는 발음과 일치하는 것을 재배치
IS sil sil => 매 발성의 시작과 끝에 묵음처리
DE sp  => 모든 sp(Short Pause)삭제
>> hled -n monophones0 -l * -d dict -i phones0.mlf mkphones.led eords.mlf

- 특징추출
=> config 파일과 scp 파일 작성후
>>hcopy -T 1 -C config -S all.scp
scp 파일은 wav 파일을 mfc로 변환해준다

- 훈련및 testfile 목록작성
=> train.scp / test.scp 작성
mfc파일의 경로를 적어 놓는다

- 모델 초기화
=> hmm(number) 를 미리 만든후에 proto, varFloor 생성후 HMMdefs , Macros파일을 작성한다

- 초기모델훈련
- sp추가(sp 모델작성)
=> sp가 추가된 monophones1을 생성해서 사용

sil.hed
AT 2 4 0.2 {sil.tansP}
AT 4 2 0.2 {sil.transP}
AT 1 3 0.3 {sp.transP}
TI {sil.state[3], sp.state[2]}
반응형

'과제모음' 카테고리의 다른 글

[CMU Sphinx]언어모델(Language Model : LM)파일 생성법  (0) 2010.01.22
CMU SPHINX - JAVA 음성인식  (0) 2010.01.22
Running the HTK Demo(htk demo)  (0) 2010.01.22
[Cmu sphinx]발음 rule  (0) 2009.09.03
[CMU Sphinx]변경사항  (0) 2009.08.20