.

radiocallas의 이미지
keizie의 이미지

radiocallas wrote:
이번에 음성합성을 이용해서 임베디드용으로(저용량, 저사양으로) TTS를 구현할려고 합니다. 프로젝트로요. 근데 문제는 이쪽으로는 아무것도 모르고 책도 별로 없더군요. 그래서 어떻게 공부해야할지 막막해서 이렇게 글을 올립니다. 혹시, 음성합성을 할려면 무엇을 공부해야하며, 책을 추천해 주셨으면 좋겠습니다.(왠만하면 원서말고, 우리말로 된걸로요. ^^;;)

(이곳 저곳 알아보고, 해서 강좌를 보고는 있는데 역시 정리가 된 책이 필요하더군요. 아는 건 없고, 주위에 아는 사람은도 없고, 정말 막막합니다. ㅠㅠ)

맞아요. 정말 막막해요. :( 음성을 전공하는 것도 아니고 전산 전공도 아니라, 둘이 퓨전으로 덤비는 문서를 보면 참...

일단 festival 같은 구현체를 보시는 게 좋을 것 같습니다.

한국어 형태소 분석은 얼마전에 net:pykts 가 올라왔죠.

송효진의 이미지

그느드르므브스즈츠크트프흐
아어오우으이애에

만 있으면 모든 말이 조합 됩니다.
글자랑 같아요.

컴퓨터 라면 크어므 프이우 트어 를 이어서 틀어주면 되죠.

형태소 분석해서 발음으로 고쳐주기만 하면,
소리 만드는것은 어렵지 않아요.
말이 좀 웃겨서 그렇지... :twisted:

삶은효과 -> 살믄효과 -> 스아르 므느 흐이오 그오아

이걸 자연스럽게 하기 위해서 가나다라 를 따로 녹음하는것일 겁니다.
억양도 몇가지 따로 녹음하고 소리를 늘였다 줄였다 하면,
사람이 읽는것 처럼 나올거에요.
(말이 쉽지 이게 기술이겠죠. :oops: )

뒤집어서 발음하는 장난도 재밌어요.
삶은효과 -> 살믄효과 -> 아오그 요흐 느므 라스
실제로 이렇게 발음하고 뒤집어서 조금 빨리 틀면 '살믄효과' 라고 들려요.

송효진의 이미지

자소단위 녹음의 요령은 자음을 짧게 모음을 길게 녹음하고,

받침 없는 글자는 모음을 길게 소리내고,
받침 있는 글자는 모음도 짧게 소리내면
알아듣지 못하는 경우는 없을거에요.

송효진의 이미지

Quote:
자소다뉘 노그메 요령은 자으믈 짤게 모으믈 길게 노그마고,

바침 엄는 글자는 모으믈 길게 소리내고,
바침 인는 글자는 모으믈 짤게 소리내면
아라드찌 모타는 경우는 업슬거에요.


발음에 대해 기술된 책 하나 있어야 겠군요.

겹받침의 경우 뒷글자가 자음으로 시작하면 두번째 받침을 생략한다.
받침은 ㄱㄴㄷㄹㅁㅂㅇ 만 사용한다.
ㄷㅂ받침뒤에 ㄴ이 오면 받침을 ㄴ으로 발음한다.
ㄹ받침뒤에 ㄴ이 오면 ㄴ을 ㄹ로 발음한다.
두음법칙...
등등...

프로젝트 끝나면 적용된 법칙만 공개해주세요~

jsko81의 이미지

음성합성은 경험해보지 못해서 자세한 답변은 못드리겠습니다만,
TD-PSOLA 키워드로 논문 검색해보세요.
예전에 저희 연구실에서, TD-PSOLA 방식으로 한국어 숫자음 음성합성을 했던적이 있습니다.

합성에 관해서 출판된 교재는 한글 교재는 없는듯 합니다.
음향학회 또는 음성학회, 전자공학회 논문을 찾아보세요.

신호처리 엔지니어

송효진의 이미지

TD-PSOLA
우와~ 이거 억양을 표현하는 알고리즘이네요!
데이터만 충실히 넣으면 진짜 사람이 말하는것 처럼 되겠어요.

radiocallas의 이미지

.

paranoea의 이미지

http://www.kyug.net/bbs/zboard.php?id=download3

이곳에서 sclee 님께서 만드신 한글-tts 를 참조해보세요.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.