제가 알기로는 ICU쪽 구현과 모질라쪽 구현 2가지가 있는데, ICU쪽은 현재 자바로만 구현되어 있군요. 다음 릴리스에 C++로도 구현 예정이라고 합니다. 모질라쪽은 http://lxr.mozilla.org/mozilla/source/intl/chardet/ 이하에 C++ 소스들이 보이는데, 자세히는 안봤지만 필요한 부분만 따로 빼서 사용하기가 난감해보이는군요. 모질라의 알고리듬을 보고 위 소스 디렉토리의 데이터를 이용해서 구현해봐도 좋을 것 같군요.
XPI 스타일이라서 모질라쪽은 모질라 시스템의 플러그인 아키텍쳐를 좀...
알아야 볼 수 있을것이고, sf.net에서 러시아(?정확치않음.. 가물가물) 사람이
만든것으로, 한글은 빼고 일본, 중국어에 대해 비교적 정확히(??) 구현한 C라이브러리를 본적이 있습니다. Auto detect가 확률적(오판 가능하다는...)이라는 것은 이미 아실것이라고 간주하겠습니다.
제목은 정확히 기억이 안나는 군요. 한 2-3년전에 보았던 링크인데,
지속적 발전했다면 보다 나아졌을듯하군요.
제가 알기로는 ICU쪽 구현과 모질라쪽 구현 2가지가 있는데, ICU쪽은
제가 알기로는 ICU쪽 구현과 모질라쪽 구현 2가지가 있는데, ICU쪽은 현재 자바로만 구현되어 있군요. 다음 릴리스에 C++로도 구현 예정이라고 합니다. 모질라쪽은 http://lxr.mozilla.org/mozilla/source/intl/chardet/ 이하에 C++ 소스들이 보이는데, 자세히는 안봤지만 필요한 부분만 따로 빼서 사용하기가 난감해보이는군요. 모질라의 알고리듬을 보고 위 소스 디렉토리의 데이터를 이용해서 구현해봐도 좋을 것 같군요.
----
http://nohmad.tumblr.com/
XPI 스타일이라서 모질라쪽은 모질라 시스템의 플러그인 아키텍쳐를 좀..
XPI 스타일이라서 모질라쪽은 모질라 시스템의 플러그인 아키텍쳐를 좀...
알아야 볼 수 있을것이고, sf.net에서 러시아(?정확치않음.. 가물가물) 사람이
만든것으로, 한글은 빼고 일본, 중국어에 대해 비교적 정확히(??) 구현한 C라이브러리를 본적이 있습니다. Auto detect가 확률적(오판 가능하다는...)이라는 것은 이미 아실것이라고 간주하겠습니다.
제목은 정확히 기억이 안나는 군요. 한 2-3년전에 보았던 링크인데,
지속적 발전했다면 보다 나아졌을듯하군요.
댓글 달기