Festival의 한국어 스피치 팩을 만들 수 있을까요?
제가 지식이 짧아서 맞는 발상인지는 모르겠지만. orca라는 녀석을 사용하면 GNOME에서 스크린리더를 쓸 수 있는 것 같습니다. 실제로 영문은 아주 잘 읽어 주더군요. 그래서 이게 어떻게 돌아 가나 봤더니 여느 스크린리더와 비슷하다는 생각을 하게 되었습니다. 긎 우에서 TTS처리 부분을 Festival이라는 엔진을 쓰더군요. 글쎄요, 사실 잘 몰랐습니다 뭔지... 관련 정보를 찾아보니 일단 음성 출력을 위한 내부 자료등을 팩 형태로 구성할 수 있는듯 하고 일종의 TTS엔진인 듯 싶었습니다. 그래서, 가능할지는 모르겠지만, 한글 언어 출력 엔진.. 정확히는 한국어 출력 엔진을 만들 수 있지 않을까 생각하다가 가능한 일인가 싶어서요. 아시는 분들이 얼마나 계실지 잘 모르겠지만... 혹시라도 어던 샘플등을 이용해서 소리를 형성해 낸다면 그리고 그 샘플을 만들고 입력한 것을 바탕으로 수정을 한다거나 하는 것들이 가능하다면, 수천시간을 고생해서라도 팸플을 만들고 엔진에 넣을 수 있는 팩을 만들어야 디겠다는 생각을 하게 되었습니다. 일반적으로 제가 아는 한도에서 TTS는 알고리즘을 이용하여 소리를 좃합하고 이를 통해 출력하는 방식과 모든 자료를 저음질이지만 알아 들을 수 있는 형식으로 자료화하고 이걸 DB로 만들어 불러서 조합하는 방식으로 출력을 하는 방식.. 이렇게 두 가지로 알고 있습니다. 아 문장이 좀 이상하네요... 아무튼... 알고리즘 방식이라면 어떨런지 몰라도, DB 조합 방식이라면 만들 수 있지 않을까... 생각하는데, 제 생각이 틀린 것일까요...
가낟ㄴ히 요약하자면 이렇습니다.
1. Festival음 TTS엔진으로 알고 있다. 그리고 이 것에는 출력 언어 팩을 추가하거나 제거할 수 잇는 것 같다.
2. TTS 방식에는 알고리즘을 통한 조합방식이 있고 음소 단위의 소리에 대한 것을 모두 자료화하여 이 자료를 DB로 만든 후 이 DB를 이용해서 출력하는 DB 조합 방식이 있는 것으로 알고 있다.
3. 이 중 전자가 아닌 후자라면 샘플링 자료를 얻어서 직접 언어 팩을 만들 수도 있다고 보는데, 이것이 Festival에서 가능한 것인가?
4. 가능하다면 어떤 도구가 제작에 필요하며 방식은 어떤 것들이 있을 수 있는가?
5. 상기 1, 2, 3 항목의 정보가 나 자신이 아는 데로인가? 혹은 거짓이나 잘못 알고 있는 것이 있는가?
정도가 되겠네요.. 정리한 내용이 참 예의 없어 보입니다만...
혹시 정보를 가지고 계신 분이나 경험이 있으신 분이 계시다면 답변을 부탁드립니다.
그리고... 어디다 올려야 할 지를 몰라 여기다 올렸씁니다. 이건 뭐 프로그래밍이라고 할 수도 없고... 음...
PS: 그 자료를 다 잃을까 걱정하고 있는 점자 PDA는 지금 수리할 비용을 모우는 중입니다 으으.
저도 전에 Festival을
저도 전에 Festival을 들여다 본 일이 있는데, 불가능한 일은 아닙니다. 일단 시작하기에 가장 적합한 문서는 Building Synthetic Voices라는 Festival 프로젝트의 공식 문서입니다.
http://festvox.org/bsv/
말씀하신대로 Festival은 다언어 음성 합성 시스템이고, diphone 데이터베이스를 사용하며, Scheme 프로그래밍 언어로 스크립팅됩니다.
위 문서에 "예제"로 일본어 음성을 만드는 과정이 나와 있으니 참고가 될 것입니다.
흠흠. 감사합니다.
흠흠. 감사합니다. 살펴 봤다고 하고 프로그램 자체에 대한 것만 살펴보고 잘 찾아 보지 않아 번거롭게 해 드린 것 같습니다. 저 내용을 보니 일단 공부하는 데만 몇 주 걸릴 거 같고 준비 하는 데만 약 몇 주 걸릴 거 같고.. 작업 착수해서 몇 계월 후에 완성할 거 같은데... 일단 문서를 읽기 편하게 갈무리해 두는 일부터 좀 시작해야 할 것 같습니다. 한국어 음성 팩이 완성된다면, 정말 좋을텐데... 잘할 수 있을지는 모르겠네요..
아무튼, 자료 URL 감사히 쓰겠습니다... 일본어 예제가 있다니 한글도 비슷할 거 같군요. 우선적으로 일본어와 한국어는 어순이 비슷비슷하므로... 미미한 부분이 다르지만요. 중국어가 예제가 아닌 것이 어저면 다행입니다.
그럼... 혹시나 제가 잠적 하더라도 작업하다가 노트북이 맛이 가서 못 오는구나 생각해 주십시요. 뭐 저를 아시는 분들도 거의 없으실 듯 하지만... 하도 일 친다 그러고 실제로는 못하거나 안하고 말만 많았떤 것이 많아서... 하핫...
----
Lee Yeosong(이여송 사도요한)
E-Mail: yeosong@gmail.com
HomePage: http://lys.lecl.net:88/
Wiki(Read-Only): http://lys.lecl.net:88/wiki/
Blog: http://lys.lecl.net:88/blog
MSN: ysnglee2000@hotmail.com
----
절이 싫으면 중이 떠나는 것이 아니라, 절이 싫으면 중이 절을 부숴야 한다.
사람천사
한국외대 장태엽 교수님
한국외대 장태엽 교수님이 아마 에딘버러에 계실 때 Festival을 다루신 것으로 알고 있습니다. 혹시 모르니 연락해보심이 어떨까요. ID는 tae시고 호스트네임은 검색해보시면 아실 수 있으실 것입니다. (잘 계시려나 모르겠네요.)
praat
원글 쓰신 분은 아마 이미 알고 계시겠지만 다른 분들께 알려드리려고 글을 씁니다.
praat라는 프로그램, 써보면 재미있습니다.
http://www.fon.hum.uva.nl/praat/