음악파일을 업로드하면 사람목소리와 배경음을 분리하는 프로그램을 만들고 싶은데 어떤식으로 시작해야될지 막막하네요..
어떤 기술이 쓰여져지는 힌트가되는 키워드 알려주실수 있을까요?
읽어주셔서 감사합니다.
사람목소리따로 배경음 따로 데이터가 있다는 전제하에 해당하는 두개의 미디어파일에서 웨이브파형을 추출해서 직접 감산을 하진 않을 것 같고요. (목소리데이터 타이밍이 정확히 일치하지 않을 수 있기 때문에...) 푸리에변환같은거 써서 적절한 샘플구간을 두어서 주파수축으로 변환한다음에 두 파일의 웨이브파형을 쭈욱 따라가면서 각 샘플구간의 주파수강도를 감산연산을 해주고 역변환하면 될 것 같습니다.
음악 - 배경음 = 사람목소리. 음악 - 사람목소리 = 배경음.
이렇게 되겠죠.... 이 이상은 잘 모르겠습니다.
근데 그런 프로그램은 이미 나와있어요;;;
더 알려드리고 싶지만 프로그래밍을 접어서 더 자세히는 모르겠네요. 입코딩때문에 더 혼란스러우시지 않으셨으면 합니다.
그럼 이만.
이런것도 있습니다. 참고.
https://www.facebook.com/groups/TensorFlowKR/permalink/509349912739405/
소곤소곤
텍스트 포맷에 대한 자세한 정보
<code>
<blockcode>
<apache>
<applescript>
<autoconf>
<awk>
<bash>
<c>
<cpp>
<css>
<diff>
<drupal5>
<drupal6>
<gdb>
<html>
<html5>
<java>
<javascript>
<ldif>
<lua>
<make>
<mysql>
<perl>
<perl6>
<php>
<pgsql>
<proftpd>
<python>
<reg>
<spec>
<ruby>
<foo>
[foo]
잘 모르지만...
사람목소리따로 배경음 따로 데이터가 있다는 전제하에
해당하는 두개의 미디어파일에서 웨이브파형을 추출해서 직접 감산을 하진 않을 것 같고요.
(목소리데이터 타이밍이 정확히 일치하지 않을 수 있기 때문에...)
푸리에변환같은거 써서 적절한 샘플구간을 두어서 주파수축으로 변환한다음에
두 파일의 웨이브파형을 쭈욱 따라가면서
각 샘플구간의 주파수강도를 감산연산을 해주고 역변환하면 될 것 같습니다.
음악 - 배경음 = 사람목소리.
음악 - 사람목소리 = 배경음.
이렇게 되겠죠....
이 이상은 잘 모르겠습니다.
근데 그런 프로그램은 이미 나와있어요;;;
더 알려드리고 싶지만
더 알려드리고 싶지만 프로그래밍을 접어서 더 자세히는 모르겠네요.
입코딩때문에 더 혼란스러우시지 않으셨으면 합니다.
그럼 이만.
음..
이런것도 있습니다. 참고.
https://www.facebook.com/groups/TensorFlowKR/permalink/509349912739405/
소곤소곤
댓글 달기