영한사전 저작권 관련 질문드립니다.

lovesigma의 이미지

이번에 영한사전 관련해서 프로젝트를 진행하는 학생입니다.

학생신분에 영한사전 DB를 구할수있는 방법이 없더군요..ㅠ

제가 만약 웹에서 제공하는 naver 다음, YBM 사전을 쿼리를 통하여 HTML 텍스트를 받아 파싱하여

사전 데이터를 사용하게 되면 저희 앱이 상업적 목적이 없고 무료로 배포하게되어도 저작권에 문제가 될까요?

또는 영한사전을 배포, 파는 곳 연락처를 어떻게 알수있는방법이 있을까요

라이센스를 획득하면 로열티 혹은 통으로 디비를 사야할거같은데

로열티면 저희 수입이 %로 지급하게되는건가여..?

말이 좀 이상해졌는데 ㅠ

답변해주시면 감사하겠습니다.

mirheekl의 이미지

StarDict 사전파일이 호환되게 만들면, 사전 데이터를 유저가 알아서 집어넣게 할 수 있습니다. 안드로이드에서는 ColorDict가 유명합니다. 말하자면 프론트엔드만 제공하는 셈이지요.

이해가 잘 안 되시면 안드로이드에서 colordict를 설치한뒤 사전 데이터를 구해서 써보시면 될 듯 합니다. PC용으로는 GoldenDict가 많이 쓰이는 것 같네요. 어쨌든 한번 해보시면 금방 이해가 될 겁니다.

사실상 라이센스 문제를 유저에게 떠넘기는 것이긴 합니다만, 어쨌든 DB와 관련된 문제를 해결하는 하나의 방법입니다. 그리고 직접 확인해본 적은 없지만 무료로 쓸 수 있는 사전 데이터도 존재한다는 것 같네요. 허나 무료라고 해서 재배포 권리가 주어진다는 얘기는 아니니 번들 데이터를 제공하려면 세심하게 살펴보셔야 할겁니다.

--

lovesigma의 이미지

Colordict 도 stardict 데이터를 사용한다는건가요?
Stardict데이터를.핸들링할수잇는 소스도 있는건가요 ? 라이브러리나 api같은....

mirheekl의 이미지

https://code.google.com/p/stardict-3/

다만 GPLv3임에 주의하세요. 일단 stardict 포맷 자체가 그리 복잡한 포맷은 아닌 걸로 보이므로 포맷을 보시고 직접 구현할 수도 있을 걸로 생각이 됩니다. 또는 다른 라이센스 기반의 소스를 구할 수 있을지도.

어쨌든 요지는 사전 데이터를 유저가 알아서 받게 하는 방식으로 해당 문제를 회피할 수 있다는 것입니다. 그리고 그런 포맷들중에 널리 쓰이는 것중 하나가 바로 Stardict라는 얘기였고요. 이미 해당 포맷을 사용하는 앱이 수도 없이 많기 때문에 어떻게든 구현하는 데에는 큰 무리가 없을 걸로 생각됩니다.

참, 네이버와 다음의 OpenAPI를 직접 사용하시면 Stardict를 쓰지 않고 더 쉽게 될 것도 같은데, 이 경우에도 약관을 잘 살펴보실 필요가 있습니다.
http://developer.naver.com/wiki/pages/OpenAPI

http://dna.daum.net/apis/dashboard

--