본문 바로가기

반응형

전체 글

(201)
[CMU Sphinx]음성인식 발음사전 확인 사이트 http://www.speech.cs.cmu.edu/cgi-bin/cmudict 검색창에 적어놓은 단어에 알맞은 발음 기호들을 생성해준다 cmudict.0.6 버전과 cmudict.0.7 두가지 버전의 발음사전들을 다운받을수도 있고 새로운 단어를 만들때 각 단어들의 발음기호를 확인하여보고 그것을 조합하는데 참조 할 수도 있다.
[CMU Sphinx]음성인식 단어사전 변경사항 - 기존 문장단위의 사전 파일 내용들을 BNF 표기로 변경 - 그에 따른 기존 소스의 파일출력부 변경요망 - 기타 발음 기호 및 발음 데이터 추가 - 에코서버를 이용한 클라이언트----------->서버--------------->클라이언트 의 작동 구성 상기 클라이언트는 별개임 서버의 역할은 파싱및 파싱데이터 디바이스 전송 - 파싱데이터 문장단위가 아닌 음절 단위로 전송(XML 로 재변환을 위해)
[CMU Sphinx] JSGF 음성인식 지적사항 - 용어의 통일 - 언어습관(다 , 까 로 끝맺을것) - Big feature 위주로(전체적인 그림에서 세부적인 그림으로) - 발표 날짜와 발표자 성명, 소속 기재할것
[CMU Sphinx]7월 16일 결과 Language Model 을 만들어서 인식을 시키는 것에는 문장에 한계가 있다(N-gram 옵션에 대한 이해가 부족함) 두문장 정도는 무난함. 변경사항 JSGF 데모를 참고하여 직접적인 dict 파일의 수정이 아닌 gram파일을 작성하여 인식시킬것 JSGFDemo.java 파일 검색결과 gram 파일들의 호출부분 존재 loadAnRecognize(" "); 부분 double quote 안에 확장자명을 생략한 gram 파일을 호출해온다.
CMU Sphinx4 htk 에서 시도했던 단어인식 트리구조에 의한 인식이면 더욱 좋음 자바프로젝트로 오픈후 링크소스로 소스를 링크하면 라이브러리를 제외한 패키지 파일들이 인클루딩 라이브러리는 sphinx4 와 파일에 따라 적절한 라이브러리 선택 이클립스에서 컴파일후 에러뜨면 에러나는 부분을 수정(경로를 재설정해준다) 수정후에 패키지파일들 수정된 패키지로 이동 CMU Sphinx4의 경우엔 사전파일들이 jar 파일안데 압축되어 있다 (주파수와 발음트레이닝 파일도 동봉되어있음) sphinx4 를 실행하기 위핸 ant 라는 파일이 필요(makefile) 과 같은역할 -> 일종의 매크로이다 ant 설치후 패스설정
htk->sphinx4 로 변경 그동안 해왔던 htk 기반 음성인식 인식률 문제로 인하여 CMU Sphinx4로 툴변경 htk의 문제점은 라이브러리(DB)부족이라고 생각됨 CMU Sphinx4 - JAVA 기반 - Eclipse 이용하여 작성 메뉴얼을 근거하여 16일까지 간단한 음성인식 소프트웨어를 개발하는 수준까지 + JAVA 다루는법 병행
2009년 6월 18일 (htk정리-음성녹음) 기본적인 실행방법 - 녹음 => Cool editor 사용(헤더 없이 녹음해야한다) - gram, wdnet, dict, mlf 파일들을 생성한다 - HVite 는 실시간 인식기능을 제공함
2009년 컴퓨터수학(이산수학) 강의자료 및 솔루션 강의자료 : 1,2,3 솔루션 : 1,2,3,4,5 교재 : Discrete Mathematics for Computer Science

반응형