이번에 음성합성을 이용해서 임베디드용으로(저용량, 저사양으로) TTS를 구현할려고 합니다. 프로젝트로요. 근데 문제는 이쪽으로는 아무것도 모르고 책도 별로 없더군요. 그래서 어떻게 공부해야할지 막막해서 이렇게 글을 올립니다. 혹시, 음성합성을 할려면 무엇을 공부해야하며, 책을 추천해 주셨으면 좋겠습니다.(왠만하면 원서말고, 우리말로 된걸로요. ^^;;)
(이곳 저곳 알아보고, 해서 강좌를 보고는 있는데 역시 정리가 된 책이 필요하더군요. 아는 건 없고, 주위에 아는 사람은도 없고, 정말 막막합니다. ㅠㅠ)
맞아요. 정말 막막해요. :( 음성을 전공하는 것도 아니고 전산 전공도 아니라, 둘이 퓨전으로 덤비는 문서를 보면 참...
Re: 음성합성 공부 방법
맞아요. 정말 막막해요. :( 음성을 전공하는 것도 아니고 전산 전공도 아니라, 둘이 퓨전으로 덤비는 문서를 보면 참...
일단 festival 같은 구현체를 보시는 게 좋을 것 같습니다.
한국어 형태소 분석은 얼마전에 net:pykts 가 올라왔죠.
그느드르므브스즈츠크트프흐아어오우으이애에만 있으면 모든 말이 조
그느드르므브스즈츠크트프흐
아어오우으이애에
만 있으면 모든 말이 조합 됩니다.
글자랑 같아요.
컴퓨터 라면 크어므 프이우 트어 를 이어서 틀어주면 되죠.
형태소 분석해서 발음으로 고쳐주기만 하면,
소리 만드는것은 어렵지 않아요.
말이 좀 웃겨서 그렇지... :twisted:
삶은효과 -> 살믄효과 -> 스아르 므느 흐이오 그오아
이걸 자연스럽게 하기 위해서 가나다라 를 따로 녹음하는것일 겁니다.
억양도 몇가지 따로 녹음하고 소리를 늘였다 줄였다 하면,
사람이 읽는것 처럼 나올거에요.
(말이 쉽지 이게 기술이겠죠. :oops: )
뒤집어서 발음하는 장난도 재밌어요.
삶은효과 -> 살믄효과 -> 아오그 요흐 느므 라스
실제로 이렇게 발음하고 뒤집어서 조금 빨리 틀면 '살믄효과' 라고 들려요.
https://xenosi.de/
자소단위 녹음의 요령은 자음을 짧게 모음을 길게 녹음하고,받침 없
자소단위 녹음의 요령은 자음을 짧게 모음을 길게 녹음하고,
받침 없는 글자는 모음을 길게 소리내고,
받침 있는 글자는 모음도 짧게 소리내면
알아듣지 못하는 경우는 없을거에요.
https://xenosi.de/
[quote]자소다뉘 노그메 요령은 자으믈 짤게 모으믈 길게 노그마고,
발음에 대해 기술된 책 하나 있어야 겠군요.
겹받침의 경우 뒷글자가 자음으로 시작하면 두번째 받침을 생략한다.
받침은 ㄱㄴㄷㄹㅁㅂㅇ 만 사용한다.
ㄷㅂ받침뒤에 ㄴ이 오면 받침을 ㄴ으로 발음한다.
ㄹ받침뒤에 ㄴ이 오면 ㄴ을 ㄹ로 발음한다.
두음법칙...
등등...
프로젝트 끝나면 적용된 법칙만 공개해주세요~
https://xenosi.de/
음성합성...
음성합성은 경험해보지 못해서 자세한 답변은 못드리겠습니다만,
TD-PSOLA 키워드로 논문 검색해보세요.
예전에 저희 연구실에서, TD-PSOLA 방식으로 한국어 숫자음 음성합성을 했던적이 있습니다.
합성에 관해서 출판된 교재는 한글 교재는 없는듯 합니다.
음향학회 또는 음성학회, 전자공학회 논문을 찾아보세요.
신호처리 엔지니어
TD-PSOLA우와~ 이거 억양을 표현하는 알고리즘이네요!데이터만
TD-PSOLA
우와~ 이거 억양을 표현하는 알고리즘이네요!
데이터만 충실히 넣으면 진짜 사람이 말하는것 처럼 되겠어요.
https://xenosi.de/
.
.
http://www.kyug.net/bbs/zboard.php?id=do
http://www.kyug.net/bbs/zboard.php?id=download3
이곳에서 sclee 님께서 만드신 한글-tts 를 참조해보세요.
댓글 달기