놀이까지는 아니구요 ^^;
제가 졸업 작품 하면서 만들었던 건데 혹시나 관심 있으신 분들
한 번 해보시라는 뜻에서 올려놨습니다. ^^ (맨 위 오른쪽에 있죠?)
준비물은.. 마이크!!
1. recognition.zip을 다운받아 아무곳에나 압축을 풀어주세요.
2. 마이크가 정상적으로 작동 하는지 확인하셔야 합니다. ^^
(마이크 작동 확인으로 제일 쉬운 방법은.. 윈도우에 있는 녹음기로 녹음이 잘 되는지 확인해 보세요 ^^)
3. 폴더 안에 있는 run.exe 파일을 실행합니다.
4. 맨 처음엔 Level measurement Completed 메시지가 뜨면, 그 다음부터는
2번, 3번 번호가 뜰 때마다 단어를 말씀하시는데..
일을 크게 벌리지 않아서 10개 단어밖에 인식하지 못합니다. ^^;
교수님, 김치, 대한민국, 모니터, 안녕, 여기봐, 전자, 졸업, 카메라, 화이팅 <- 이렇게 10단어입니다.
다른 단어를 말씀하시면 열 개 중에 아무거나 그냥 뜨구요~ 목소리 크기라던가 마이크 특성에 따라서
100%까지는 아니라도 80%정도의 정확도는 보장합니다. ^^
5. 번호가 뜰 때 말씀하신 단어가 곧바로 sil (말 한 단어) sil 의 형태로 뜹니다.
6. 그만 하고 싶으시면 창을 그냥 닫아주세요. ^^
이게 뭐냐!! 하시는 분들은 이 것이 제가 하는 것의 최종 단계가 아니니 참아주세요~ ^^;;
저는 지금 단어 인식이 아니라 화자 인식 즉, 말 한 사람이 누구냐를 진행하고 있습니다.
사실 완성은 했는데 제 측근들로만 구성되어 있어서 올려봤자 별로 재미가 없군요. ㅎㅎ
그냥 이런 것이 있다 정도만 맛 보시길 바랍니다. ^^
감기 조심하세요~
- 2007/10/11 16:45
- yyt1982.egloos.com/3845837
- 덧글수 : 14




덧글
레놀도야지 2007/10/12 10:39 # 답글
재밌는걸 만드셨군요. 주위 친구들이 돌아가며 감기에 걸리는군요. 건강하세요!
taki 2007/10/13 23:31 # 답글
요즘 정말 갑자기 추워져서 난감해요~ 레놀도야지님도 감기 조심하세요~^^
taki 2007/10/26 12:19 # 답글
제가 가진 소스를 일방적으로 보내드릴 수는 없습니다. 저에게 정보를 제공해주시고 안되는 부분을 물으신다면 답변해드리는 쪽으로는 도움 드릴 수 있겠군요.단어 인식 하시는 건가요? 화자 인식 하시는 건가요? 단어 인식이라도 단어 인식과 음소단위 인식이 다릅니다. 구분해야 하는 단어나 음소 갯수와 각 단어당 녹음 갯수 등을 먼저 알려주시고 모르는 부분을 알려주세요.
오오오..드뎌.ㅠㅠ 2008/02/11 14:12 # 삭제 답글
안녕하세요..저는 정보보안쪽으로 공부를 하고있는 학생입니다.정말 여기까지 오는데 힘들었어요..ㅠㅠ
아무자료나 선배들의 조언이 없는 상태에서 음성인식을 시작한지 3일..
정말 힘드네요..그러다가 타키님 블로그를 발견했는데요.
제가 찾던 그런쪽인것 같아요..HTK도 어제 새벽 4시경에 알았습니다.
죄송하지만 꾸준하게 들려서 여러가지 조언을 듣고 싶습니다.
프로젝트소스를 구하는 그런건 절대로 아니구요...
정말 기초부터 탄탄히 쌓아서 음성인식의 대가(?)가 되고 싶어요.^ㅅ^
일단은 음성인식공부 시작의 로드맵을 살포시 알려주셨으면 감사하겠습니다.
너무 부탁만 한것 같아서 정말 죄송한데요.
혹시나 해서 메신저 주소 남깁니다.
mespers@nate.com
taki 2008/02/24 01:49 # 답글
로드맵이라.. 할 것도 없어요 ^^:; 충북대학이던가 권오욱 교수님 사이트에 가보면 설명이 나와있습니다. 저는 회사를 다녀서 도움을 드리기가 힘들 것 같군요..
greatgw 2008/03/24 23:56 # 삭제 답글
저기 윈도우에서 설치까지 했는데..HSLab이 실행이 안되네요, 홈페이지에서도 윈도우에서는 지원이 안된다는데..
db녹음은 어떻게 하셨는지 궁금하네요,
taki 2008/04/09 21:57 # 답글
db녹음은 goldwave에서 했습니다.윈도우 지원은 저도 안했구요. 프로그램 실행하면서 커맨드 창 띄우는 식으로 했습니다.
커맨드 창을 숨기는 방법으로 하는 사람들도 있더군요.
greatgw 2008/04/19 03:02 # 삭제 답글
아 그럼 저기 올린프로그램은 윈도우에서 제작하신거 아니에요?
taki 2008/04/28 07:44 # 답글
dos 기반입니다. 윈도우용은 API로 직접 제작하셔야 합니다.
몽쉘 2008/11/28 19:35 # 답글
이거 왜 실행이 안돼나요?두번째 단계로 안 넘어 갑니다.
taki 2008/12/11 15:48 # 답글
두번째 단계로 넘어가지 않을 때는 음성 입력이 들어가지 않는 겁니다.마이크 상태나 연결을 확인해보세요~
오세혁 2009/07/03 19:27 # 삭제 답글
음성인식 공부중인 학생인데요 저는 영어 인식을 하는데...아무리해도 인식률이 거의 0프로에 가깝네요 튜토리얼대로도 해보고
권오욱 교수님 꺼로도 해보고 기타 다른 여러 걸로고 보고 해봤는데 말이죠
혹시 이거 만드실때 음성파일 같은경우엔 몇개정도 쓰시고 DB를 만드셨는지
아니면 원래 있는 DB를 쓰셨는지 여쭈어 봐도될까요? ㅎㅎ
그리고 괜찮으시다면 이파일 만들면서 쓰셨던 파일 전부 제메일로 좀 보내주실수 있으신가요?
tiger86sh@naver.com 부탁드립니다 ^^
오세혁 2009/07/03 19:30 # 삭제
아 파일은 gram,wdnet,dict,mlf파일등등 전부다요...ㅠㅠ
taki 2009/07/09 12:19 # 답글
저는 음성 샘플을 직접 만들었었습니다.한 단어를 20명에게 각각 50개씩 받았었어요. 단어당 1000개네요.
단어 인식은 인식률이 좋고 마이크 특성에도 (화자 인식 보다는) 영향을 덜 받기 때문에
샘플수를 줄여도 될거라고 생각합니다. 500개 정도만 해도 될거라고 생각합니다...
그런데 인식률이 0프로에 가깝다는건.. 제가 보기엔 DB 문제가 아니라 뭔가 설정이
잘 못 된거라고 생각합니다. 제가 작성했던 파일들을 보내드리기 보다는
현재 작업 하고 계신 파일들을 보내주시면 제꺼랑 한번 비교해보겠습니다.
제 메일 주소는 메일로 보내드리겠습니다.