번역기에 관심들 없으신가요?

k2love의 이미지

이곳저곳을 다녀봐도, 번역프로그램에 대한 관심은 미미한듯 합니다.
아니면, 관심은 많은데, 구하기가 어려워서일까...
그런데 그렇지도 않은것이... 다른 플그램보다 구하기는 오히려 쉬우리라 판단되는데,
유포가 안되는 모양입니다.

제가 요즘 번역프로그램에 관심을 두고 있는데 (그동안 꾸준히 관심을 두긴 했습니다만...)
입맛에 딱 맞는 것이 없더군요.
그래도, 제가 테스트 해본것들 소개좀 해볼까 합니다.

------------------------------------------------------------------------------------
영한번역의 경우는, 거의 알아보기 힘들만큼의 번역수준입니다.
E-Trans 류, 인가이드 류, Click-Q 류, TransMate 등...
여러분들이 쉽게 접하실수 있는 이런 프로그램들의 번역수준은, 몇년째, 제자리걸음 같더군요.
피부로 느껴지는 번역 수준이, 몇년전과 다를바가 없습니다.
TransMate 가 가장 그래도 가능성이 엿보였으나, 출시가 1999년이었죠(?) 그 이후로
버전업을 안하고 있습니다.
최근 SmaTran 이라고 이름을 바꾼것 같은 E-Trans 나, 클릭큐나, 인가이드는 수준이 비슷합니다.
그나마, 자체 프로그램내에서 웹번역등을 해야하는 불편함이 있어서, 비추구요...
그 부분은 TransMate 가 가장 우수합니다. 편리성이죠.
번역수준에 있어서는 다들 도끼니 개끼니구요...
그럼... 대안은...?
대안은 우회하는 방법이 있습니다.
영어를 예로 들자면, 영어-->일어, 영어-->중국어, 이렇게 번역을 한다음에 그것을 한국어로 다시 번역하는
방법이 있습니다. 이것을 테스트해본 결과, 영어-->한국어 로 번역하는 것보다 질면에서 많이 좋았습니다.
영어-->한국어 로 번역할때는, 인가이드나, 이트랜스, 클릭큐, 트랜스메이트를 테스트 했고,
영어-->일어 로 번역은 Systran 정도밖에 테스트를 못해봤습니다. 참고로, Systran 으로도 영어-->한국어로
번역이 되긴하나, 수준이 좀 더 떨어집니다. 고로... 영어-->일어 수준도 만족할만한 수준은 아니라고
여겨집니다.(제가 일어를 못해서 번역수준 판가름을 못합니다.)
하지만, Systran 으로 번역된 웹페이지를 저장해서, ezTrans XP 등으로 일한 번역을 해보면,
영어-->한국어 로 다이렉트 번역 했던것보다, 질이 조금 낫습니다.
창신소프트의 ezTrans XP의 경우는, 일한번역이 상당히 우수하지요.
경쟁 소프트로는 디코소프트(?)의 i.seoul 시리즈가 있는데, 이 프로그램은 일본에서 잘나가더군요.

ezTrans XP의 경우도 웹쪽에는 별로 신경을 안쓴듯 합니다.
오피스 애드인 이 있어서 그런면은 편리한데, 웹브라우져 애드인은 없습니다.
신버전에서는 적용되었는지 모르겠군요. 모... 테스트해볼 기회가 있어야 말이죠...
음... 신버전 구해볼려고 노력을 해봤지만, 트라이얼 조차도 구하기 어렵더군요.
이렇게 폐쇄적이어서야..., 사용자가 비교선택할 기회조차 안준다는건 가혹하기까지 합니다.
참고로, i.seoul 시리지는 3년전 자료 이외에는 존재도 없더군요.
홈페이지 가보면, 꾸준히 신버전 내놓는데 말이죠...
발전적 공유들을 안하시는 것인지, 이런류의 소프트가 인기가 없는것인지 궁금합니다.

한가지 더...
영어-->중국어 번역을 해보았는데요. 이번엔 Systran 을 사용한게 아니고,
금산쾌역 2003 을 사용해봤습니다. 다행히 당나귀에 공유자가 계셔서, 감사히 받았습니다.
설치부터 중국어로 나오니 머리 아픕니다만, 그래도 사용하는데는 지장없더군요.
이 프로그램이 아쉬운것이... 영어-->일어 메뉴가 없다는 겁니다.
중국어-->한국어 번역 프로그램으로는 Trans Cat 이라는 국산 프로그램이 있고,
i.seoul 시리즈에도 있거든요. 그런데, 그것들을 접할 수 있는 기회는, 모험걸고 돈주고 그 프로그램을
사는 방법밖에 없습니다.
금산쾌역의 메뉴에는 영어-->중국어, 중국어-->영어, 일어-->중국어, 이렇게 까지 지원합니다.
중국어-->일어 는 지원하지 않구요. --+
금산쾌역의 성능을 테스트 해봤는데요. 중국어-->영어 수준이 Systran 을 훌쩍 뛰어넘는 수준입니다.
영어-->중국어 의 경우는... 역시 제가 중국어를 못하기 때문에 번역 성능 테스트 불가... -_-
당연히 일어-->중국어 로의 테스트도 알아보기 힘든관계로 테스트 불가... -_-
중국어-->일어 만 되어도, 그 문서를 저장하여, ezTrans 로 번역해보면, 성능 테스트는 될텐데 말이죠...

웹으로 번역해주는 사이트도 있죠? WebLingo 인가 하는 곳인데,
이곳에서, 번역해보면, 수준이 좀 낮습니다. 아마도 Systran 웹버전을 이용하는듯... 아니면 Translate 를
이용하던가... 이곳엔 한국어 메뉴도 있는데, 번역수준은 기대 이하입니다.

아... Translate 라는 번역기도 있습니다.
이것이 최근판은 많은 언어를 지원하는데, 그중에 한국어도 끼워줬더군요.
제가, 7.0 버전은 테스트해봤습니다. 물론, 동양권 언어 지원 안되는 버전으로요.
영어-->스페인어 로 번역할 일이 있어서 해봤는데,
상대방이 알아먹긴 하더군요.
그쪽이야, 어순이 같으니까 별 문제가 없겠지요.
이 Translate 가 한국어 지원을 어느정도까지 해주느냐가 관건이고, 그나마 일어라도 완벽하게 해준다면야...
더 바랄것이 없겠습니다만, 아직까지 이 플그램 릴을 안해주네요.
릴하시는 분들이 그만큼 관심이 없으신건지...

아참 하나더...
Transwhiz 라는 대만산 프로그램이 있습니다. 이곳에 다른분께서 힌트를 주셔서 찾아봤더랍니다.
Chinese to Japanese, Japanese to Chinese, English to Chinese, Chinese to English
이런 기능이 있구요. 150메가 이상 되는 8개의 파일을 받아야 합니다.
트라이얼이죠. 얘네는 트라이얼을 이렇게 제공을 합니다.
국내업체의 마인드하고는 사뭇 다르죠.
제가 일단 한두개 설치해봤는데, MS-SQL 기반으로 돌아가는 녀석이더군요.
음... 충분하리만큼 테스트는 못해봤지만, 금산쾌역 수준은 안되는듯 합니다.
추후에 한국어도 지원 할 예정 같더군요. 귀추가 주목됩니다.

지금 찾으려 하는건, 영어-->일어 를 완벽하게 하는 플그램입니다.
i.seoul 시리즈의 최근버전을 꼭 테스트해보고 싶은데, 그거 눈에도 안띄니 어쩔 수 없고...
일본 사람들 공유 개념이 별로 없으니, 다른 플그램 있다고 해도 찾기 힘들테고...
국산플그램 역시 최신버전 구하는게 하늘의 별따기고...
좀 맥빠지네요.

덧붙여...
비단 번역프로그램만 보더라도, 한국의 기업들은 폐쇄적입니다.
어느정도 리버싱에 대한 피해(?)는 염두해 두셔야 하며, 그것은 오히려 소프트웨어 시장을 질적으로
발전시키는 일이고, 당나귀등이나 이런 P2P 등으로의 개인간의 공유를 부정적으로 바라보는 것은,
매우 편협합니다.
소프트웨어를 가장 빨리 광고하는 것이 무엇이겠습니까?
바로, 수많은 준비된 베타테스터들에 의해 사용되어 지는 것입니다.
이들은, 하지말라고 해도, 비판을 쏟아냅니다.
그리고, 힌트도 줍니다. 개발자의 입장에서의 편협한 생각을 깨게 해주는 것이죠.

물론, 단순히, $ 로만 봤을때는, 손해일수도 있습니다.
하지만, $ 는 기업들에게만 받는다는 생각을 애초에 갖고, 개발에 임해야 하고,
판매정책을 펴야 합니다.
왜냐... 기업은 불법 소프트웨어 쓰라고해도 못쓰는 형편입니다.
개인은, 사서 쓰라고 갖은 제약을 가해도, 사서 쓰는것에 인색합니다.
그런 개인도, 자신이 사업을 하기 위해선, 과감히 사서 씁니다.
왜 하나만 알고, 둘은 모르는지...

답답해서 한소리 해봤습니다.

p.s : 리눅스 관련 원문 문서들을 보다 빨리 접해보고 싶은 마음에 쑈좀
해봤는데 역시나, 우리나라 번역기 수준은 기대이하더군요.
가장 큰 문제들은... 예를 들어 Kernel 을 알갱이 로 번역하는 겁니다.
-_-;

k2love의 이미지

이글을 적고는... 약간 걱정이 되는것이... 주제인 '번역기' 하고는 상반된
주제로 격론이 오갈까 염려스럽습니다. ^^
항상 다른 쓰레드를 봐도 그렇거든요 ^^
PHPBB의 젤 안좋은 점이...
주제와는 다르게 삼천포로 빠진다는거... ㅋㅋㅋ

30센티 나는 슈퍼맨

envia의 이미지

번역기를 만드려면 꽤 많은 학문적인 연구가 뒷받침 되어야 할텐데, 영세한 업체들이 만들다 보니 아주 좋은 것이 없는 것이 아닌가... 라고 생각합니다. 그래서 어느 정도는 이해할 수 있는 일한번역 프로그램 말고는 거의 쓰지 않는 것 같습니다. (네이버의 enjoyjapan만 씁니다.)

대학이나 연구소와 함께 하거나, (네이버 지식인처럼) 일반인들의 참여를 유도하는 방법을 찾을 필요가 있는 것 같습니다.

k2love wrote:

p.s : 리눅스 관련 원문 문서들을 보다 빨리 접해보고 싶은 마음에 쑈좀
해봤는데 역시나, 우리나라 번역기 수준은 기대이하더군요.
가장 큰 문제들은... 예를 들어 Kernel 을 알갱이 로 번역하는 겁니다.
-_-;

번역자 분들 중에서도 Kernel을 알맹이로 번역하신 분이 계시죠. :evil:
(나름대로 의미있는 일이라고는 생각하지만, 읽기 어려운 책을 만들게 되었죠.)

----

It is essential, if man is not to be compelled to have recourse, as a last resort, to rebellion against tyranny and oppression, that human rights should be protected by the rule of law.
[Universal Declaration of Human Rights]

fibonacci의 이미지

사람이 번역해도.. 모르는 사람이 번역한건 장난아닙니다. 예전에 X윈도 관련 문서를 읽다가 geometry를 "기하학"으로 번역한 것을 보고 피식 웃음이 나오더라고요. 문맥에 따라서, 좌표, 창의 크기 등등으로 번역을 해야 할텐데요... 어쨌든 번역기는 문법과 단어만 알지, 문맥은 모르기 때문에 문외한이 전문문서 번역한 것처럼 번역될수밖에 없습니다. 어쩔수 없는 일이긴 하지만요.

No Pain, No Gain.

방준영의 이미지

영어->한국어 직접 번역보다 영어->중국어->일본어->한국어 번역이 더 질이 좋다면, 모든 언어의 공통적인 요소를 추출해서 중간어를 만든 다음 영어->중간어->한국어 식으로 번역하는 건 어떨까 싶네요. 문제는

    1. 이미 그렇게 하고 있다 (윽...) 2. 언어간 공통 요소를 추출하기가 더 힘들다 (윽...)
번역 프로그램의 내부 구조를 아시는 분이 설명해 주시면 감사하겠습니다.[/]
지리즈의 이미지

기술 문서에 대해서는 번역수준이 상당히 향상된 것 같더군요...

하지만, 원어를 작성하는 사람의 수준에 따라
번역 결과물도 차이가 많이 발생합니다.

이렇게 말씀드리는 것은 좀 싫지만,
opensource쪽의 영어를 읽는 것 보다는
msdn쪽의 영어가 이해하기가 쉽습니다.
(당연 번역 결과물도 훨씬 좋구요.)

빈약하긴 하지만, i18n이 중간어 구실을 해주는 것 같은데,
원문서 자체가 중간어를 염두해두고 작성된다면
금상 첨와겠지요. ^^;;

There is no spoon. Neo from the Matrix 1999.

maddie의 이미지

근데...저는 비관적입니다. 번역 프로그램이란 거 절대 믿을만하지 않더군요. 결국에 필요한 문서는 한글로 만드는게 더 낫다라는 생각이 듭니다.제가 다른 언어는 잘 모르겠는데, 제가 알고 있는 영어, 한국어, 불어간의 변환만해도 차라리 원서를 더듬 더듬 보는게 이해가 더 쉬운 경우가 많았습니다.

힘없는자의 슬픔

지리즈의 이미지

흔히 있지요...
번역문 읽다 보면... 읽어도 눈에 안들어 오는 경우...
그럴경우 역으로 다시 영어로 번역해서.. 영어 원문을 유추한 다음...
다시 번역해서 한글로 이해하는 경우도 :(

maddie wrote:
근데...저는 비관적입니다. 번역 프로그램이란 거 절대 믿을만하지 않더군요. 결국에 필요한 문서는 한글로 만드는게 더 낫다라는 생각이 듭니다.제가 다른 언어는 잘 모르겠는데, 제가 알고 있는 영어, 한국어, 불어간의 변환만해도 차라리 원서를 더듬 더듬 보는게 이해가 더 쉬운 경우가 많았습니다.

There is no spoon. Neo from the Matrix 1999.

k2love의 이미지

지리즈님 i18n 이라는 것이 혹시 ^^ 아이.십.팔.놈 을 뜻하는 건가요?
이렇게 상상의 나래를 펼쳐도 되는지 ^^
(정말 몰라서 묻는겁니다. ^^)

envia님께서 소개해주셔서, 네이버의 '인조이재팬' 으로 일본사이트 서핑하고
있는데, 상당히 좋네요. 감사 (__)
약간 구버전을 사용한듯 하지만, 번역에는 문제가 거의 없네요.
일본어에 한해서 -_-

방준영님께서 토론글에 올려주신 링크를 따라 글을 읽어봤는데요.
이 부분이 가슴에 와 닿네요.

Quote:
아주 심각한 문제다. 일단 이바닥에서 뭐라도 할려면 무조건 영어로 해야 한다. 키보드에 칠 자판부터가 그렇고.. 부팅할때부터 눈에 보이는건 다 영어다. 그런면에서 비영어권 아시아국가에 특히 자체적으로 아시아국가중 거의 유일한 체계의 다른 국가와는 전혀 호환 안되는 언어를 만들어 쓰는 위대한! 역사를 가진 우리 한국은 컴퓨터를 만들어낸 미국인들의 영어는 너무도 모국어와 달라서 상당한 걸림돌이다. 근데 좀 이해 안가는것이 그간 kldp의 번역 작업을 보면 참여한 사람들이 거의 모두 영어를 잘 못하는 내국인이란 것이다. 영어권 유학생들이거나, 아니면 2세는 한국어를 모른다쳐도 1.5세 교포라던가 하는 사람들은 영어와 한국어 모두 완벽하게 구사할테이고 번역같은건 그에 비해 영어 못하는 내국인들보단야 아주 쉬울것인데 하지를 않고 있다. 역시 아쉬운 사람이 하는 문제인지 그사람들에게 약간 섭섭한 마음이 있다. 하지만 강요는 못하는법..

에구... 모... 저같은 사람은 섭섭해 할 자격도 없습니다만,
앞으로 방법을 꼭 모색해서, 제가 터득한 것은, 꼭 쬠이라도 돌려드리겠습니다.

음...
IBM이 일본어 번역기는 꾸준히 개발하고 있더군요.
이곳저곳 헤매며 돌아다니다 이런넘을 발견했습니다.
http://j2k.naver.com/j2k_frame.php/korean/www-6.ibm.com/jp/software/internet/king/

찾으면 있군요. -_-

30센티 나는 슈퍼맨

logout의 이미지

k2love wrote:
지리즈님 i18n 이라는 것이 혹시 ^^ 아이.십.팔.놈 을 뜻하는 건가요?
이렇게 상상의 나래를 펼쳐도 되는지 ^^
(정말 몰라서 묻는겁니다. ^^)

i18n이 처음 보면 정말 뭔지 종잡기 힘든 놈이죠. i18n은 internationalization의 약자입니다. 시작하는 i와 끝나는 n사이가 18자라고 하네요. 직접 세어보지는 않았습니다.

비슷한 것으로 l10n도 있죠. 이건 localization의 약자입니다.

참고로 i18n은 국제화라고 번역하고 어떤 소프트웨어를 처음 작성할 때 부터 다국어 환경을 고려해서 제작하는 것을 의미합니다. 그리고 l10n은 지역화라고 번역하고 이미 만들어진 프로그램을 특정 언어로 번역해서 뜯어고치는 것을 의미합니다. hanterm은 l10n의 예가 될 것이고 gnome 어플들은 i18n이 잘 갖추어진 어플이라고 볼 수 있겠죠.

"I conduct to live,
I live to compose."
--- Gustav Mahler

jachin의 이미지

k2love wrote:
i18n 이라는 것이 혹시 ^^ 아이.십.팔.놈 을 뜻하는 건가요?

생각지도 못했던 말이네요. ㅎㅎㅎ 웬지 딱 맞아떨어져서... 순간 당황했어요. ^^

번역기는 역시 믿을만한 수준이 못되는게 현실입니다. 저도 많이 번역기를 써보긴 했지만, 확실히 전공과 관련된 단어라든가, 외래어를 그대로 쓰는 부분은 번역을 잘못하기도 합니다. (외래어의 사전적 의미를 동사로 착각하고 문장을 해석하기 때문에...) 간혹 Technical Dictionary 등을 찾기도 하지만, 이러한 기술 문서에 관련한 단어에 대한 연구도 국문학쪽에서 진행해줘야 한다고 생각합니다.

번역이라는 것이 얼마나 힘든 일인지는 잘 알고 있으니까요. 아직까지 국문학과 언어학, 전산학(?)이 조우하지 못하고 있어서라고 생각하고 싶습니다. 언젠가는 누군가가 정확하고 정밀한 번역기를 만들어 주리라 생각합니다.

(각 나라의 언어와 표기법에 대한 지식이 없다면 번역기를 만들기도 어렵지 않을까요? 이를테면 어떤 특정한 사전적 의미가 아닌 통용되는 단어로서 쓰이는 단어는 볼드체로 표시되는 경우가 많은데 텍스트를 그대로 갔다 쓰면 사전적 의미로 해석되는 경우가 있으니까요.)

codebank의 이미지

번역기까지는 아니지만 한동안 한글 분석쪽 일을 잠시한적이 있었죠.
그당시에 상당히 많은 번역프로그램들이 나와있었고 제가 몸담고 있는 회사에서도
번역은 아니지만 한글을 분석해내는 부분의 엔진을 만들어서 보유하고 있었죠.
(여러사람이 의견을 내고 한사람이 엔진을 만들었습니다. 제가 아닙니다... :oops: )
번역이든 분석이든 결국은 같은 일을 하는것이지만 문제는 단문은 어느정도 해결이
가능합니다만 복문으로 넘어가면 엄청난 노가다가 기다리고 있다는 것이죠.
물론 당시에도 복문을 생각하고는 있었지만 결국 원하는 결과를 얻지는 못했었죠.
번역을하면(물론 분석에도 마찬가지지만...) 가장 문제가 되는것이 조사입니다.
은, 는, 이, 가 정도는 어느정도 해결이 가능했지만 이것도 주격조사가 이상하게 쓰일
때도 있고 생략도 가능하면서 위치에 따라서 후자에 무엇이 오느냐에 따라서 많은 변화가
일어나게 되죠.

좋은 번역기가 있으면 좋겠지만 일단 번역을 전문적으로 하는 사람들은 번역기를
만드는데 별로 호응을 안할테고(밥줄이 걸려있으니...) 문법적으로 접근하는 사람들이
만든 번역기는 오역 투성일거고...

이번참에 누가 kldp.net에 번역기 프로젝트를 만들어 놓으면 어떨까 하는 생각도
드는군요.
아는것은 없지만 그래도 흥미있는 프로젝트가 될법도 할 것 같은데... :)

------------------------------
좋은 하루 되세요.

Together의 이미지

방준영 wrote:
중간어를 만든 다음 영어->중간어->한국어 식으로 번역하는 건 어떨까 싶네요.

에스페란토가 중간어의 대안이 될수 있을것 같습니다.

아래는 에스페란토 소개글을 한국에스페란토협회에서 펀글입니다.
www.esperanto.or.kr

1. 에스페란토란?

1887년에 폴란드 안과 의사 자멘호프 (Ludoviko Lazaro Zamenhof, 1859- 1917) 박사가 창안한 배우기 쉬운 국제 공용어입니다.

2. 에스페란토 창안의 배경

자멘호프가 태어난 폴란드의 비알리스토크는 당시 러시아 지배 아래 있었으며 유태인인 자멘호프는 유태인, 폴란드인, 독일인, 러시아인들이 서로 다른 언어로 씀으로 인해 갈등과 불화가 생긴다고 판단하고, 모든 사람들이 쉽게 배울 수 있는 국제공통어를 고안하게 되었습니다. 유럽의 여러 언어에 능통하였던 그는, 그 언어들의 공통점과 장점만을 모아 예외와 불규칙이 없는 문법과 알기 쉬운 어휘를 기초로 한 언어 에스페란토를 창안하였습니다. Esperanto는 그때 사용하였던 자멘호프의 필명으로 '희망하는 사람'이라는 뜻이며 나중에 이 언어의 이름이 되었습니다.

3. 에스페란토 주의란?

「1민족 2언어 주의」에 입각하여 같은 민족끼리는 모국어를, 다른 민족과는 중립적이고 배우기 쉬운 "에스페란토"의 사용을 주창하는 『 세계 언어 평등권 운동』입니다.

4. 에스페란토의 언어 구조

에스페란토의 문자는 모두 28개로 a, e, i, o, u 등의 5개의 모음과 23개의 자음으로 구성되어 있습니다.

「1자 1음(一字一音)」의 원칙에 따라 모든 문자는 하나의 소리를 내고 또한 소리나지 않는 문자도 없으며, 강세(强勢)는 항상 뒤에서 둘째 음절에 있습니다.

각 어간에 품사 고유의 어미를 붙여 명사는 -o, 형용사는 -a, 부사는 -e, 동사(원형)는 -i로 끝나고, 시제(時制) 또한 동사의 어간에 과거형은 -is, 현재형은 -as, 미래형은 -os를 붙여 나타냅니다 (예: amo 사랑, ama 사랑의, ame 사랑으로, ami 사랑하다, amis 사랑하였다, amas 사랑한다, amos 사랑할 것입니다).

특정한 의미를 갖는 접두어와 접미어를 사용하여 많은 단어를 파생시켜 사용하므로 단어 암기의 노력이 매우 줄어드는 것도 중요한 특징입니다 (예: patro 아버지, patrino 어머니, bopatro 장인, bopatrino 장모). 복수는 어미에 -j, 목적어는 -n을 붙여 나타냅니다.

5. 국내외 에스페란토 단체

▶ 세계 에스페란토 협회 : 세계 에스페란토 운동을 이끌고 있으며 네델란드 로테르담에 본부를 두고 있습니다.

▶ 한국 에스페란토 협회 : 한국에서는 사단법인 한국 에스페란토 협회가 전국에 지부를 두고 보급 운동을 전개하고 있습니다.

▶ 에스페란토 문화원 : 매월 에스페란토 보급을 위한 강습회를 개최하고 있습니다.

▶ 단국대학교 : 현재 단국대학교(서울, 천안 캠퍼스)에서는 1985년부터 에스페란토를 정규 과목으로 개설하여 학점을 인정하고 있습니다.

6. 에스페란토 방송과 문학 작품

중국, 바티칸, 폴란드, 오스트리아, 쿠바 등 11개국에서 단파 및 위성방송을 통하여 매일 수차례씩 에스페란토 국제 방송을 하고 있습니다. 《성경》, 《논어》, 《코란》을 비롯하여《햄릿》등 셰익스피어의 희곡, 《죄와 벌》, 《데카메론》, 《파우스트》, 《돈키호테》, 《설국》 등 동서고금의 작품들이 에스페란토로 번역되었을 뿐만 아니라, 원작 소설과 시의 창작 활동도 활발합니다. 한국의 고전과 문학 선집도 에스페란토로 발간되어있습니다.

7. 에스페란토의 활용

인터넷의 보급 확산으로 세계는 지구촌이 되었고, 언어의 장벽을 극복하는 것이 인류의 최대 관심사인 지금, 에스페란토는 인종, 종교, 이념, 국적을 초월하여 세계 모든 사람들이 특정 민족어를 사용하지 않고 대등한 입장에서 자유로운 대화를 가능케 해주고 있습니다. 실로, 에스페란토는 '인터넷 시대의 국제어'라 할 수 있을 것입니다.

==================

그리고 세종연구원에서도 국제공용어를 개발하고 있네요.
www.unish.org

아래는 empas검색해서 펀 뉴스기사 입니다.

세종연구원, 세계 공용어 개발
(서울=연합뉴스) 국내 학자들이 '에스페란토'와 같은 세계 공용어를 개발, 선포식을 갖고 보급에 적극 나서기로 해 화제가 되고 있다.

세종연구원(이사장 주명건 세종대 이사장) 산하 세계어연구소는 6월 1일 오전 9시 세종대 군자관 집현전에서 지난 6년간에 걸쳐 자체 개발한 세계어 '우니쉬(Unish)' 선포식을 갖고 향후의 세계어 개발 방향에 대해 기념 세미나를 연다.

우니쉬 개발에 참여한 세종연구원 연구위원 9명은 그동안 ▲4천여개의 어휘를선정했으며 ▲세계어 문법을 만들었고 ▲세계어 사전을 한국어와 영어로 출간했다.

주 이사장은 '세계어의 필요성과 개발방향'이라는 소개글에서 "영어를 세계 공용어로 지정함으로써 세계 인구의 불과 5%를 차지할 뿐인 영어권 인구를 특권층으로만드는 것은 어떠한 비영어권 사람들도 원치 않고 있다"며 "공평하고 효율적인 인공언어 제정 필요성이 절실하다"고 말했다.

우니쉬는 전세계 16개 언어에서 어휘를 따왔는데, 어휘의 80% 이상이 차용어로구성돼 있는 영어 자체의 특성상 영어적인 요소가 가장 많이 포함돼 있다.

스페인 이탈리아 독일 등 유럽언어적인 요소가 두 번째로 많으며, 동양어권인중국어 한국어 일본어 힌두어적인 요소가 다음 순이다.

연구진은 우니쉬는 "각종 언어에서 가장 짧고 합리적이고 발음하기 쉬운 단어들만 선별했다"면서 단어 선정의 구체적인 기준으로 보편성, 간결성, 다양성, 차별성,발음의 단순성, 문화적 연관성, 어휘 확장을 위한 복합성을 꼽았다.

연구원은 앞으로 인터넷 홈페이지(www.unish.org)와 관광교류 등을 통해 우선한국 중국 일본 3개국을 중심으로 우니쉬를 보급해 나가는 한편, 각종 고전 시 팝송성경 등을 우니쉬로 번역.출판해 세계 각국에 보급한다는 계획을 세워놓고 있다.

- 험한 세계에서 자주국방 없는 경제력은 경비없는 은행이다. -

Prentice의 이미지

원어(Source language)에서 번역어(target language)로 자동번역(machine translation)을 하는 중간 단계로 언어 중립적인 제3의 언어를 (기존의 언어이든 인위적인 언어이든 언어가 아니든) 활용하는 방법은 interlingua method라고 부르는데, 현재로서는 제대로 된 interlingua를 만들어내기가 너무 어렵기 때문에 그리 바람직한 방법은 아니라고 합니다. 지난 40년간 언어학의 의미론, 통사론 이론이 복잡하게 진화(?)를 거듭했지만 아직 탄탄한 interlingua 모델을 만들기에는 "언어"에 대한 이해가 부족하다고 하네요.

그래서.. 현재는 원어와 번역어가 정해진 것으로 가정하고 중간단계를 밟는다고 합니다. SL 문장 -> SL 풀이 -> TL 풀이 -> TL 문장 순서로 MT를 하나봐요.

덧. 위 내용은 The Ohio State University Press에서 나온 Language Files, File 14.2에서 발췌한 내용입니다. 참고도서로 W. John Hutchins와 Harold Somers의 An Introduction to Machine Translation를 추천하고 있네요.

덧 둘. http://www.essex.ac.uk/linguistics/clmt/MTbook/

saxboy의 이미지

Quote:
대안은 우회하는 방법이 있습니다.
영어를 예로 들자면, 영어-->일어, 영어-->중국어, 이렇게 번역을 한다음에 그것을 한국어로 다시 번역하는
방법이 있습니다. 이것을 테스트해본 결과, 영어-->한국어 로 번역하는 것보다 질면에서 많이 좋았습니다.
영어-->한국어 로 번역할때는, 인가이드나, 이트랜스, 클릭큐, 트랜스메이트를 테스트 했고,
영어-->일어 로 번역은 Systran 정도밖에 테스트를 못해봤습니다. 참고로, Systran 으로도 영어-->한국어로
번역이 되긴하나, 수준이 좀 더 떨어집니다. 고로... 영어-->일어 수준도 만족할만한 수준은 아니라고
여겨집니다.(제가 일어를 못해서 번역수준 판가름을 못합니다.)
하지만, Systran 으로 번역된 웹페이지를 저장해서, ezTrans XP 등으로 일한 번역을 해보면,
영어-->한국어 로 다이렉트 번역 했던것보다, 질이 조금 낫습니다.
창신소프트의 ezTrans XP의 경우는, 일한번역이 상당히 우수하지요.
경쟁 소프트로는 디코소프트(?)의 i.seoul 시리즈가 있는데, 이 프로그램은 일본에서 잘나가더군요.

국내의 번역 엔진 시장은 보통 영한, 일한, 중한으로 구분됩니다. 영한번역쪽은 이미 먹고 살기 힘들고, 그나마 일한 쪽이 일한과 한일 번역을 짬뽕시켜 만든 커뮤니티 따위에 힘입어 간신히 포털에 끼어들어 명맥을 유지하고 있지만, 먹고 살기 힘들기는 마찬가지입니다. 중한쪽은 이제 막 시작되려고 하고, 이미 개발된 알파 내지는 베타수준의 솔루션이 몇개 있지만 상용화 계획이 없거나 상용화를 하지 못하고 있는 실정입니다.
영한 번역은 좀 가혹한 말이지만 쓸모가 없는 수준입니다. 일한 번역은 그나마 조사와 단어 몇개만 바꿔놓으면 반쯤 똑같은 말이다보니 대충 덕지덕지 붙여 만들어도 쓸만한 번역이 되는 덕분에 실용성이 있는 편이고 중한은 영한보다 더 하면 더했지 절대 쓸모가 없는 수준입니다. 물론 영어고 중국어고 내 이름은 철수네 따위의 말은 잘 번역해줍니다. :)

Quote:
ezTrans XP의 경우도 웹쪽에는 별로 신경을 안쓴듯 합니다.
오피스 애드인 이 있어서 그런면은 편리한데, 웹브라우져 애드인은 없습니다.
신버전에서는 적용되었는지 모르겠군요. 모... 테스트해볼 기회가 있어야 말이죠...
음... 신버전 구해볼려고 노력을 해봤지만, 트라이얼 조차도 구하기 어렵더군요.
이렇게 폐쇄적이어서야..., 사용자가 비교선택할 기회조차 안준다는건 가혹하기까지 합니다.
참고로, i.seoul 시리지는 3년전 자료 이외에는 존재도 없더군요.
홈페이지 가보면, 꾸준히 신버전 내놓는데 말이죠...
발전적 공유들을 안하시는 것인지, 이런류의 소프트가 인기가 없는것인지 궁금합니다.

발전적 공유고 뭐고 그 동네는 전부 먹고 살기가 원체 바쁘다보니 사실은 트라이얼따위에 신경쓸 여유가 없답니다. 좀 더 정직하게 말하면 PC에 설치되는 패키지 소프트웨어 따위에 신경쓰고 있으면 굶어죽기 딱 좋습니다. 그것뿐입니다. 공유를 거부한다거나 폐쇄적이기 때문에 그런것은 절대 아닙니다. 적어도 제가 아는 한은 그렇지요.

Quote:
덧붙여...
비단 번역프로그램만 보더라도, 한국의 기업들은 폐쇄적입니다.
어느정도 리버싱에 대한 피해(?)는 염두해 두셔야 하며, 그것은 오히려 소프트웨어 시장을 질적으로
발전시키는 일이고, 당나귀등이나 이런 P2P 등으로의 개인간의 공유를 부정적으로 바라보는 것은,
매우 편협합니다.
소프트웨어를 가장 빨리 광고하는 것이 무엇이겠습니까?
바로, 수많은 준비된 베타테스터들에 의해 사용되어 지는 것입니다.
이들은, 하지말라고 해도, 비판을 쏟아냅니다.
그리고, 힌트도 줍니다. 개발자의 입장에서의 편협한 생각을 깨게 해주는 것이죠.

물론, 단순히, $ 로만 봤을때는, 손해일수도 있습니다.
하지만, $ 는 기업들에게만 받는다는 생각을 애초에 갖고, 개발에 임해야 하고,
판매정책을 펴야 합니다.
왜냐... 기업은 불법 소프트웨어 쓰라고해도 못쓰는 형편입니다.
개인은, 사서 쓰라고 갖은 제약을 가해도, 사서 쓰는것에 인색합니다.
그런 개인도, 자신이 사업을 하기 위해선, 과감히 사서 씁니다.
왜 하나만 알고, 둘은 모르는지...

답답해서 한소리 해봤습니다.

번역 소프트웨어 업체만을 놓고 하신 말씀은 아니겠지만, 번역소프트웨어 업체만을 놓고 대답해보자면 $를 기업에게만 받으려고 생각하기 때문에, 기업에 납품되는 서버 솔루션에 더 신경을 쓰지요. 패키지는... 밝히기는 거시기하지만, 기계번역에 관심있는 분이라면 아실만한 모모소프트웨어의 한쪽 귀퉁이를 만들어서 내보낸 적이 있는데, 솔직히 솔직히 정말 엉망이었습니다. 물론 회사에서도 시간이 됐으니 새버전이나 하나 하는게 어떻겠니... 정도의 입장이었다고만 말씀드리면 될까요.

아울러, 번역 소프트웨어의 사전 업그레이드 따위는 반쯤 거짓말이라는 것도 살짝 풀어놓습니다.

Quote:
번역기를 만드려면 꽤 많은 학문적인 연구가 뒷받침 되어야 할텐데, 영세한 업체들이 만들다 보니 아주 좋은 것이 없는 것이 아닌가... 라고 생각합니다. 그래서 어느 정도는 이해할 수 있는 일한번역 프로그램 말고는 거의 쓰지 않는 것 같습니다. (네이버의 enjoyjapan만 씁니다.)

대학이나 연구소와 함께 하거나, (네이버 지식인처럼) 일반인들의 참여를 유도하는 방법을 찾을 필요가 있는 것 같습니다.

대부분의 업체들이 대학이나 연구소를 어떤 형태로든 끼고 있습니다. 아니면 외국에서 사온 것들도 많이 쓰지요. 흐흐... 국내 영한 번역 업계의 선두에 있는 모모소프트웨어는 일본의 블라블라라는 곳의 일영 번역기를 가져다가 고친 놈이라고 잘 알려져 있습니다. 뭐, 제가 확인한 바 없어 확신은 못하겠습니다만.

그럼 자... 대학의 연구실에서 나온 어쩌고 어쩌고를 상용화하면 과연 좋을까요? 상상에 맡깁니다. 대학원 직접 다니시는 분들, 프로젝트하면서 코딩 어떻게 하는지 가슴에 손을 얹고 한번만 반성해주시면 감사하겠습니다.

Quote:
영어->한국어 직접 번역보다 영어->중국어->일본어->한국어 번역이 더 질이 좋다면, 모든 언어의 공통적인 요소를 추출해서 중간어를 만든 다음 영어->중간어->한국어 식으로 번역하는 건 어떨까 싶네요. 문제는

1. 이미 그렇게 하고 있다 (윽...)
2. 언어간 공통 요소를 추출하기가 더 힘들다 (윽...)

번역 프로그램의 내부 구조를 아시는 분이 설명해 주시면 감사하겠습니다.


두가지 다 맞습니다. 하지만 이미 그렇게 하고 있어도 상용시스템에서는 절대로 그렇게하지 않습니다. :lol:

Quote:
기술 문서에 대해서는 번역수준이 상당히 향상된 것 같더군요...

하지만, 원어를 작성하는 사람의 수준에 따라
번역 결과물도 차이가 많이 발생합니다.

이렇게 말씀드리는 것은 좀 싫지만,
opensource쪽의 영어를 읽는 것 보다는
msdn쪽의 영어가 이해하기가 쉽습니다.
(당연 번역 결과물도 훨씬 좋구요.)

빈약하긴 하지만, i18n이 중간어 구실을 해주는 것 같은데,
원문서 자체가 중간어를 염두해두고 작성된다면
금상 첨와겠지요. ^^;;

기술 문서의 번역이 가장 쉽고, 현재까지 알려진 기계번역의 최고 응용분야는 기술 문서 번역입니다. 왜냐구요... 쓸데없이 어려운 말이 별로 없거든요. 일한 번역같은 경우에는 조금 신경써서 튜닝한 번역엔진이면 한국어 기술문서라고 거짓말해도 속아줄만 합니다.

Quote:
이번참에 누가 kldp.net에 번역기 프로젝트를 만들어 놓으면 어떨까 하는 생각도
드는군요.
아는것은 없지만 그래도 흥미있는 프로젝트가 될법도 할 것 같은데...

저도 한번 해보고 싶은 일이었는데, 역시 시작이 반이라고... 시작이 참 어렵군요.

Quote:
참고도서로 W. John Hutchins와 Harold Somers의 An Introduction to Machine Translation를 추천하고 있네요. [/quote

보통 기계 번역에 대한 입문서로 많이 보게 되는 책중의 한권입니다만, 사실 기계번역 자체에 대한 이론이 그렇게 대단한 것이 있다고는 생각하기 어렵습니다. 이 책의 내용도 반 이상은 case study 에 할당되어 있고... 다른 기계 번역 방법도 몇가지 알려져 있지만 보통 direct, transfer, pivot ( 또는 interlingua) 정도의 단어만 이해한다면 기계 번역의 기본 내용은 대부분 알고 있는 것이라 생각합니다. 물론 진짜로 무언가를 만들어 내는 것은 다른 이야기이지요. 모든 데이터베이스 프로젝트는 ER 다이어그램에서 시작하듯이, 기계번역은 사전의 구조에서 시작한다고 감히 이야기하겠습니다.

indizarm의 이미지

방준영 wrote:
모든 언어의 공통적인 요소를 추출해서 중간어를 만든 다음 ....

중간어 == 개념 ?? then

Wordnet (+ semantic networks)

http://www.cogsci.princeton.edu/~wn/

http://nlp.korea.ac.kr/~hcseo/wordnet.htm

What a Cool Days!!!

eungkyu의 이미지

logout wrote:
참고로 i18n은 국제화라고 번역하고 어떤 소프트웨어를 처음 작성할 때 부터 다국어 환경을 고려해서 제작하는 것을 의미합니다. 그리고 l10n은 지역화라고 번역하고 이미 만들어진 프로그램을 특정 언어로 번역해서 뜯어고치는 것을 의미합니다. hanterm은 l10n의 예가 될 것이고 gnome 어플들은 i18n이 잘 갖추어진 어플이라고 볼 수 있겠죠.

i18n, l10n할 때 l10n은 i18n을 기본 가정으로 하는 말입니다. 즉, 다국어 환경을 고려한 구조로 프로그램을 잘 만드는 것이 i18n이라 한다면, 그렇게 만들 프로그램에 번역 등을 잘 하여 특정 지역에 맞게 만드는 것을 l10n이라고 합니다.

물론 i18n, l10n을 할 때 메시지 번역가지고만 따지지는 않습니다. 그 외에도 숫자를 표시할때 분리를 세자마다 하나 네자마다 하나, 통화기호는 뭔가 등 여러가지가 있습니다. 다만 나머지는 거의 자동으로 처리가 되지만 메시지 번역은 사람의 노고가 필요하죠.

hanterm은 i18n이 되어있지 않으므로 당연히 l10n도 되지 않은 프로그램입니다. 한글화가 잘 된 프로그램이죠.

CY71의 이미지

영어는 번역기 수준을 논할 입장이 안되어서 패스입니다 ㅡㅡ;;

일한 번역은 조금 말할 수 있어서 보자면... ezTRANS XP 의 경우, 좀 아니라고 봅니다. 번역기라는 것이 그렇게 수준이 높지 않더라구요. 어떤 문장은 군더더기 없이 깔끔하게 번역이 되기도 하는데, 대부분의 문장은 황당무계한 번역이 되더군요.

일한 번역용 다른 프로그램으로 바벨탑이란 것이 있는데, 이 소프트는 ezTRANS XP 보다도 떨어진다는 평이 많습니다. 번역 소프트에 대한 기대는 많이 갖지 않는 것이 좋을 것 같군요.

Viz의 이미지

indizarm wrote:
방준영 wrote:
모든 언어의 공통적인 요소를 추출해서 중간어를 만든 다음 ....

중간어 == 개념 ?? then

Wordnet (+ semantic networks)

http://www.cogsci.princeton.edu/~wn/

http://nlp.korea.ac.kr/~hcseo/wordnet.htm

wordnet의 성과를 비주얼하게 보고 싶다면 다음을 추천합니다. ;)

http://www.visualthesaurus.com/online/index.html

이런식으로 언어의 sematic을 분석할 수 있다면 모든 언어의 추상화된 표현을 만드는 것도 불가능하지만은 않아 보이는구요. ^^

관련된 글타래가 다음에 있습니다.
http://bbs.kldp.org/viewtopic.php?t=25234

ps. wordnet 관련된 것 뿐만 아니라 애플릿으로 저런 것을 만드는 것도 대단..

My Passion for the Vision!

saxboy의 이미지

Quote:
이런식으로 언어의 sematic을 분석할 수 있다면 모든 언어의 추상화된 표현을 만드는 것도 불가능하지만은 않아 보이는구요. ^^

quote 된 문장을 한번 wordnet 으로 인코딩해보시면 불가능하지만은 않지만 과연 가능할까 의문을 가지시게 될겁니다. :)