40메가바이트 mp3파일에서 목소리만 뽑아 내야 경우에.

impactbar의 이미지

이쪽으로는 전혀 문외한이라 문의 드립니다.

운영체제는 상관없으며

40메가 정도의 mp3 파일 여러개에서

사람의 음성만 뽑아내야 됩니다. ( 잡소리가 많이 섞여 있습니다.)

발성대역만을 뽑아내면 되는데

툴을 선택할 수가 없군요. 정확하게 말하면 다룰 줄 아는 툴이 하나도 없군요...ㅜ.ㅜ (사운드포지 또는 쿨에디터가 적당한지요?)

이쪽으로 사용하기 편한 툴 추천 부탁드립니다.

좋은 하루 되십시오.

사족 : 구글에서 음성추출로 검색하니 동영상에서 사운드 뽑아 내는 것 밖에 없더군요... ^^;

zenguy의 이미지

기억은 잘 나지 않지만, 오래전에 음악을 리믹스할때 반주를 제거하고 보이스만 추출해서 사용했던 적이 있습니다. 그당시 사용했던 툴은 말씀하신 사포를 사용했어구요. :)

툴을 조금 익히시면, 방법이 있을듯 하군요.

-_-; 결국 답이 되질 못했네요... 하지만, 사포로 가능합니다. ^-^

bugiii의 이미지

어떤 믹싱된 음원에서 특정 음원을 추출해야 한다... 잡음이 섞인 환경에서 사람 목소리만 읽어내야 한다는 것입니까? 음성 인식의 앞단인가요?

일단 필터를 찾아보셔야 하겠습니다. 사람 목소리의 주파수 대역과 가청 주파수 대역을 조사하시고 밴드 패스 필터를 적용하시는 것이 우선이겠습니다. 또한 발성한 사람의 특성 (성별이나 톤?)도 분석기로 어느정도 분류하는 것도 필요하겠습니다. 시간에 따른 간단한 FFT를 돌리는 것도 필요하겠고, 미리 남성/여성 구분하는 인자도 필요할지 모르겠습니다.

하지만 잡음이 사람 목소리 주파수 대역에 섞여 있으면 이것은 어쩔 수 없이 같이 묻어나옵니다. 이런 건 나름대로의 꽁수가 필요할 듯 합니다.

그리고, 필터라는 것이 정말 컷오프가 칼 같이 되는 것은 절대 없기 때문에 그 양쪽 자르는 지점을 잘 선택하셔야 하구요. (칼처럼 되면 안정하지 못한 필터가...)

필터는 다양한 종류가 있는데, 구현하시기 전에 사운드 툴 같은 소프트웨어를 이용해서 충분히 테스트를 하시는 것이 좋겠습니다. 가청 주파수대의 신호 분석 + 변형은 사운드 툴에서 충분히 검토해볼 수 있을 것입니다.

처리과정은 mp3 -> 샘플링 데이타 (wave 파일 정도?) -> 밴드패스 필터 (혹은 로우 -> 하이) -> 특별한 꽁수 -> 특정 대역 주파수만 담은 샘플링 데이타 -> 후처리 정도로 생각하시면 될 것 같습니다...

아 잡음이 어떤 종류인지도 중요하겠네요. 또 잡음의 크기도 꽤 영향을 미칠 것 같구요... 잡음 제거라는 것으로도 한번 찾아보시게 어떨까요?

그럼, 이만...

Prentice의 이미지

가청주파수는 20Hz~20,000Hz라는 것이 통념(?)입니다만, 실제로는 어린이가 아닌 이상 20,000Hz까지는 못 듣는 것이 보통입니다.

음성대역은 사람에 따라 다르겠지만, 20Hz~4,000Hz 정도 까지의 대역만 들리더라도 무리없이 말의 의미를 파악할 수 있습니다. 시옷, 치읓등의 치찰음을 알아듣기 약간 힘들게 될지도 모르지만요. 마음에 안드시면 20Hz~8,000Hz 대역만 남기는 필터링을 하셔도 좋습니다.

impactbar의 이미지

답변 감사드립니다.

학교 다닐때 프리에 변환 열심히 해둘껄 그랬습니다. ^^;

백과 사전을 찾아보니 성역(사람이 내는 목소리의 주파수 대역)은

80~1,280㎐의 4옥타브

라고 나오네요.

문제는 이제 사운드포지에서 적용해야되는데

섬세한 조정은 이퀄라이저에서 못하는 것 같습니다.

어디를 봐야 될까요.

좋은 하루 되십시오.

Prentice의 이미지

유성음은 2000Hz 밑으로 나타나지만 무성음 중에 마찰음의 경우 상당히 높게까지 올라갑니다. 1200Hz쯤에서 필터링하시면 알아듣는데에 지장이 있을지도 모릅니다.

Effect, filter등이 보이시면 거기서 lowpass, 또는 bandbass를 찾아보세요.

처리(?)가 끝나면 저장을 하셔야 하는데, mp3로 저장하실 경우 음질에 악영향을 끼치므로 유의하셔야 할 것입니다.

impactbar의 이미지

답변 감사드립니다.

사운드포지에서 EQ항목에서 마우스로 어느정도 섬세하게 조절가능하더군요.

잡음 줄이는 정도로 타협을 봐야될 것 같습니다.

사람의 성역 안의 잡음은 어쩔 수가 없군요.

다시 한번 답변에 감사 드립니다.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.