음성인식 시스템 개발하려고 하는데요.
글쓴이: closeyes / 작성시간: 목, 2005/03/24 - 1:48오후
제가 눈이 좋지 않은데.왜 현역으로 군대 갔는지 궁금할정도로 좋지가 않거든요.사격할 때 두개로 보임 ㅋㅋ--;
원래는 에디터 만드는 걸 주력으로 할려고 했는데 , 갑자기 개발하고 싶은 열정이 생겼습니다.
하지만 사전 지식이 너무 없네요.지금 당장 거창한 걸 만들고 싶은 건 아니고 , 그럴 수도 없겠지만 계속 공부하면서 발전할 꺼리가 필요합니다.사전 지식이 없기때문에 조언이 필요합니다.
혹시 이런 방면에 지식이 있으시면 , 도움이 되는 책이나 사이트를 알려주세요.
Forums:
http://bbs.kldp.org/viewtopic.php?t=5057
http://bbs.kldp.org/viewtopic.php?t=50571
http://maincc.hufs.ac.kr/~tae/
위 사이트의 파워포인트에서 발음기호가 깨진다면 SIL IPA 관련 폰트를
위 사이트의 파워포인트에서 발음기호가 깨진다면 SIL IPA 관련 폰트를 설치해주세요.
IPA 발음기호에 대한 이해를 위해서는 (Firefox에서 잘 보입니다):
http://en.wikipedia.org/wiki/International_Phonetic_Alphabet
http://en.wikipedia.org/wiki/IPA_in_Unicode
http://en.wikipedia.org/wiki/International_Phonetic_Alphabet_for_English
----
제가 프로그래밍을 할줄 아는 것도 아니고 실제로 작업에 참여해본 것은 아니지만, 일단은 time domain 신호를 frequency domain으로 변화시키는 방법, frequency domain의 스펙트럼/스펙트로그램 처리등에 대한 이해도 필요하실 것으로 생각합니다.
그쪽 연구하는 사람들 대부분이 Pattern Recognition부터 시
그쪽 연구하는 사람들 대부분이 Pattern Recognition부터 시작하더군요..
(-_-)/
[quote="kjw2048"].. Pattern Recognition.
즉, A.I.
----------------------------------------------------------=>
Be supercalifragilisticexpialidocious, run for your life!
공업수학부터하셔야죠
푸리에변환이 필수일텐데요^^;
OTL
답변 정말 감사합니다. 도서관에서 pattern recoginition , 음운학 , 음성학 같은 책들을 한번 둘러보다가 놀랬습니다. 정말 많은 이론들이 필요하다는 걸 알게되었고 , 개발한다는게 단순히 의욕만 앞선다고 되는게 아니라는 것도 알게 되었습니다.
그렇지만 지금 당장 포기하고 싶지도 않습니다.가장 늦었을 때가 가장 빠른 때라는 걸 알고 있기 때문입니다.물론 예외도 있겠지만요.
앞으로 일년 후쯤에 해외쪽으로 취업하는 과정에서 공부하고 있습니다. 해외 취업시 프로젝트로 음성인식에 관한 걸 했다는 걸 추가할 수 있을려면 어떤 방향으로 공부해야 되는지 궁금합니다.
음성학의 경우 여러 분야가 있는데 음성인식과 연관이 가장 깊은 분야는 음
음성학의 경우 여러 분야가 있는데 음성인식과 연관이 가장 깊은 분야는 음향음성학 (용어가 맞는지 모르겠네요.) 즉 acoustic phonetics입다.
음운론은 그냥 맛보기로, 음성학과의 차이 정도만 접해보시면 좋을 것 같습니다.
저는 실용적인 측면에서의 음향음성학을 중점적으로(?) 배운 사람이라서 어떤 공부를 하셔야 좋을지 잘 모르겠습니다. 그렇지만 다음 문서를 보시면 어느 정도 도움이 되리라 믿습니다.
comp.speech 뉴스그룹의 FAQ의 일부입니다. 음성인식을 다루고 있습니다.
http://www.speech.cs.cmu.edu/comp.speech/FAQ6.html
Lawrence Rabiner & Biing-hwang Juang
Lawrence Rabiner & Biing-hwang Juang, Fundamentals of Speech Recognition 을 일단 한번 슬쩍(?) 읽어보시면 도움이 됩니다.
음성인식용 패턴인식의 키워드 몇가지라면... VQ, DTW, HMM...
공개된 음성 인식 시스템도 몇가지 있으니 한번 둘러보세요. 누가 뭐래도 제일 유명한 시스템이라면 sphinx를 빼놓을 수 없겠지요. sourceforge에서 voice나 speech로 검색하시면 꽤 많은 시스템을 찾으실 수 있습니다.