저작권있는 사전의 발음기호만 수집해서 배포해도 될까요?

xylosper의 이미지

지금 저작권에 문제 없는 사전 데이터를 찾아 해매고 있는 중입니다.

그러다가 stardict용 영한 사전파일을 보니 GPL로 공개되어있더군요.

그래서 다운 받아보니, 발음기호가 없네요...

이번엔 발음기호를 찾아해매었는데, 처음엔 gcide에서 발음기호만 떼올까 생각했는데, 스펠링이 같은 단어들같은 경우 프로그램적으로 구분할수 있는 방법이 없을듯하더군요...

그래서 생각한게, 발음기호만 다른 인터넷 사전(네이버, 야후등)에서 수집해서, 뜻을 비교해서 어느정도 일치하면 맞는걸로 하는 식으로 할까 했는데...

이경우 발음기호만 수집해서 쓰는 것도 저작권 침해가 될까요...?

당연히 배포될 사전은 GPL이므로 발음기호에도 GPL을 적용할수 있어야 할텐데...

사실 발음기호에 GPL을 적용한다는 것 자체가 뭐가뭔지 모르겠네요-_-;;

상황을 정리하자면,

발음 없는 영한 사전(GPL)에, 저작권이 있는 사전에서 발음기호만 수집하여 영한사전에 집어넣어 배포하는게 가능한가요...?

혹은, 발음기호까지 다 들어있는, 저작권 문제없는 영한사전데이터를 구할수 있다면 알려주시면 감사하겠습니다.

keizie의 이미지

어느 분이 stardict 개발자와 한국어 사전 자료의 저작권에 대해 얘기하신 걸 봤는데 (어디였는지는 기억이 안 납니다), 거기 올라와 있는 자료의 저작권이 제대로 된 게 아닙니다. 그냥 전후 사정 무시하고 대차게 올려놓은 거라고 하더군요. (참으로 대국의 풍모입니다)

제가 알기로 '저작권 문제 없는 영한 사전 자료'는 없습니다. 국내에 유통되는 모든 사전은 동아 프라임 등과 라이센스 계약을 맺은 거고, 이전에 engdic에 있던 자료도 출처가 불분명해서 라이센스 문제가 있다는 메일링 리스트 논의를 본 적이 있습니다. (결국 engdic은 배포판에서 슬금슬금 사라졌죠)

제가 잘못 알고 있는 점이 있다면 지적 부탁드립니다.

redneval의 이미지

저도 이번에 사전파일을 찾아보다보니

웹 상에 GPL이라고 돼있어도 100% 믿어서는 안된다는 걸 알게됐습니다.

(나중을 위해 자세히 적어 놓자면,

XDXF 에도 저작권이 잘못 기재된 영영사전이 있습니다.

English explanatory dictionary

이 사전은 출처를 알 수가 없고, GPL이 아닐 가능성이 매우 높습니다.

이 파일을 만든 Alexey Semenov에게 제가 물어봤었습니다.)

아무튼 저도 "저작권 문제없는 영한사전"은 없는 걸로 알고 있기 때문에

지금으로서는 영한사전데이터를 새로 만드는 수 밖에는 없습니다.

xylosper의 이미지

두분 모두 답변 감사드립니다.

그런데, 또 궁금해지는건, '새로운 영한사전 데이터'를 만든다고 치면, 이게 어떻게 해야 되는 건지 감이 안잡히네요..

만약에 단어를 하나하나 스스로 수집해서 스스로 뜻을 생각해서 적어나가는 식이라면 애시당초 불가능할테지만..

사실상 출판되고 있는 사전들도 다른 사전을 참고로하여 작성되는 것같던데...

그럼 다른 사전에서 수집한 자료로 사전데이터를 만들어 배포하여도 저작권에는 문제가 없는건가요...?

여러개의 자료에서 수집해서 만드는거나, 하나를 그대로 배껴서 만드는거나, 다른 사전에서 자료를 수집한다는건 마찬가지니까, 결국엔 이것도 저작권 위반이 될것도 같고...

복잡하군요-_-;

redneval의 이미지

완전히 새로 만드는 건 거의 불가능하니,

기존의 "저작권 문제없는 사전"을 번역해서 만드는 방법이 있습니다.

다음 세 가지 정도를 생각해 볼 수 있습니다.

1. GPL사전인 GCIDE를 번역

(하지만 사전 데이터가 Webster 1913년 버전을 기반으로 하는게 문제입니다.

약 100년전 사전이라니!)

2. CCL사전인 JMDict(영일사전)을 번역

3. GFDL사전인 Wiktionary를 번역

(1,2,3이 라이센스가 모두 다르므로 셋 중 하나만 선택해야 합니다.)

어떤 식으로 하던 free license의 영한 사전 데이터를 만드는 것은 혼자서는 어렵습니다.

여러사람이 참여하는 번역프로젝트 같은게 필요합니다.

한가지 시나리오를 써보자면,

1. 누군가가 영한사전만들기 Project를 시작하고 홈페이지를 개설합니다.

2. Wiktionary 중에서 중요단어를 골라내고 1000등분으로 나눠서 번호를 붙입니다.

3. 우연히 그 Project를 알게된 사람이 그 1000등분 중 하나를 번역합니다.

4. 번역이 모두 끝나면, 누군가가 1000개를 모두 모아서 사전파일을 완성합니다.

5. GFDL로 공개합니다.

xylosper의 이미지

답변 감사합니다.

단순히 수집이 아니라 "번역"이 들어가면 더이상 혼자 할수 있는 것이 아니군요.

마지막으로 한가지 궁금한게 있는데...어째서 한국어로된 사전은 저작권에 걸릴수 있는데, 외국어 사전을 번역하는건 문제가 되지 않는 건가요...?

결국엔 번역될 사전들도 저작권에 문제가 없어야될텐데, 한국어사전은 안전하지 않은데, 외국어 사전은 안전할수 있는 이유가 있는건가요...?

redneval의 이미지

이들 사전들은 라이센스를 명시하고 있기 때문입니다.

GCIDE : http://en.wikipedia.org/wiki/GCIDE

JMDict : http://www.csse.monash.edu.au/~jwb/edrdg/licence.html

Wiktionary : http://en.wiktionary.org/wiki/Main_Page 의 하단부

xylosper의 이미지

자꾸 딴지거는것 같아서 물어보기 죄송한데요; 라이센스가 명시되어있기만 하면 그걸 가져다 써도 아무상관없는건가요?

라이센스가 명시된걸로만 따지자면, engdic이나 그걸 stardict로 변환한 것도 모두 GPL이라고 명시되어있는데, 왜 이것들만 문제가 될수 있다는 건지 모르겠네요...

keizie의 이미지

앞서도 말씀드렸듯이 stardict에 포함된 자료에 GPL이라고 해둔 건 근거가 없다고 합니다. 상식적으로 생각을 해봐도 국내에서 이렇게 문제 없는 자료 찾기가 힘든데 외국 프로젝트에 영한 사전 자료가 GPL로 떡하니 올라와 있는 게 이상한 거죠.

xylosper의 이미지

그렇다면 어느자료를 가져다가 쓰던지, 그냥 그 라이센스를 믿고 쓰는 수밖에 없겠네요...

출처가 명시되어있고 확인이 가능하다면 모르겠지만, wiktionary같은 것도 개개인이 모여서 적는 것이니, 배껴다 쓴다해도 출처를 일일이 관리하는것 자체가 불가능할듯하고...

답변 감사합니다.

redneval의 이미지

제 글을 잘못 이해할 소지가 있었군요.

Stardict에는 딸랑 한 줄에 GPL이라고 써 있지만,

위에서 말한 사전 3개는 "이러저러해서 이런 라이센스다" 라는 식으로 구체적으로 밝히고 있습니다.

출처를 밝혀놨기 때문에 좀 더 신뢰가 가는 겁니다.

사실 제가 아는 것도 이게 끝입니다.

더 의문이 나는 것은 인터넷을 찾아보세요.

사족) 딴지에 답을 하자면,
명시하다 : 분명하게 밝힘
분명 : 틀림없이 확실하게
=> 명시하다 : 틀림없이 확실하게 밝힘

stardict에 딸랑 한 줄 써있는 정도는 "명시"한 것으로 보기는 좀 힘들겠죠?
적어도 왜 GPL이고 출처가 어딘지는 밝혀놔야 "명시"한 것으로 볼 수 있겠죠.

masoris의 이미지

영어 발음기호가 저작권 보호 대상인지 모르겠네요.
저의 추측으로는 발음기호는 사실을 그대로 기록 한것 뿐이니, 저작권 보호 대상에 속하지 않는다고 생각합니다.
이 부분에 관해서는 "저작권 보호 센터"에 전화로 문의해 보시는것이 좋을 것 같습니다.

____
The limits of my language mean the limits of my world. - Ludwig Wittgenstein


____
The limits of my language mean the limits of my world. - Ludwig Wittgenstein

xylosper의 이미지

그렇게 생각할수도 있는건가요...?
그러다보면, 사실상 '언어'나 '말'이란 것 자체가 아무나 다 쓰고 있는 것이니, 그것을 기록한 사전 자체의 저작권이 인정되지 않는 거 아닌가 하는 생각까지 드네요;

일단 말씀하신대로 문의해보도록 해야겠습니다.

답변 감사합니다.

익명 사용자의 이미지

제 생각에는 시중에 유통되는 사전 자료를 통째로 가져오는 것은 문제가 있다고 생각하지만..
가량 eat 의 경우 '먹다'는 뜻이 있으며 발음도 예를 들자면 /이트/라고 발음을 합니다.
그런데 그 발음을 다른 발음으로 발음할 수는 없겠죠. 약속이기 때문입니다.
만약 GPL로 발음기호와 단어의 아주 기본적인 뜻을 배포했을 경우
사전을 만든 측에서 저작권을 주장할 수 있을까...의문입니다.
상용제품의 사전의 경우 그 사전에 들어있는 100%의 모든 데이터에 대해서 저작권을 주장할 수 없을 것 같습니다.
왜냐하면 언어란 대대로 전해내려온 사람들과의 약속이며 누가 한글단어를 영어단어로 번역을 하든지
중복되는 부분이 반드시 있기 때문입니다.
제 생각이지만 상용으로 판매되는 사전의 경우 저작권을 주장할 수 있는 부분은 극히 일부분일 것 같습니다.
예를 들면, eat가 사전에 '먹다'고 되어 있는데, 어느 누군가가 eat를 '먹다'라는 뜻으로 번역해서 사전파일을 만들어 배포를 했다고 할 때
사전에 대한 저작권을 가지고 있는 사람이 저작권 침해이니까 사용하지 말라고 주장할 수는 없겠죠.

제 생각에는 오히려 사전에 저작권이 있다는 것이 더욱 이상하게 느껴집니다.
읽기 쉽게, 이해하기 쉽게 표현한 점 빼고는 저작권을 주장할 수 있는 부분이 없으리라 보입니다.
왜냐하면 누구든지 보편적으로 사용하는 언어의 특성 때문입니다.

slomo의 이미지

예전에 masoris님이 한자 데이터베이스 작업을 하시면서 직접 저작권 보호 센터에
전화를 해서 문의하시 결과 창작성이 없는 목록이나 그 데이터베이스는
저작권의 보호를 받지 못한다는 답변을 받았다고 하셨습니다. 그런 자료는
Public Domain에 속하고 오픈소스에 사용하여도 아무런 문제가 없다고 합니다.

참조: http://kldp.org/node/80530

====
No one asks you for change or directions.
-- Slo-Mo, J. Krokidas

====
No one asks you for change or directions.
-- Slo-Mo, J. Krokidas

익명 사용자의 이미지

engdic 사전에 대해서 좀 더 분석해보았습니다
engdic 사전의 데이터는 GPL이 전혀 아니며, 이 자료를 쓴 stardict-ko도 GPL이 전혀 아닙니다.
http://dumpcookie.tistory.com/entry/engdic-%EC%82%AC%EC%A0%84%EC%9D%98-%EC%A0%80%EC%9E%91%EA%B6%8C

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.