KTS 한글 형태소분석기 KLDP.net 입주

wkpark의 이미지
5898
points
9
points

이상호님의 한글 형태소분석기 KTS를 KLDP.net에 입주시켰습니다.

KTS는 1995년 이상호님이 개발한 것으로 논문 및 소스가 인터넷상에 공개되어있던 것을
2002년 GPL 라이센스로 정식으로 전환한 것입니다.

형태소분석기를 개발하시는 분들에게 많은 도움되시길 바랍니다~

KTS의 특징


  • EUC-KR 및 이성진 코드(한글을 영문으로 표현하는 방법중 한가지) 기반
  • 경로기반의 태깅 및 상태기반의 태깅 동시 지원
  • 각종 사전을 만들기위한 툴이 제공된다.
  • 확률기반 처리 및 미등록어 처리 기법 제공
  • corpus 자료 제공 (태깅된 5만5천여 문장, 태깅안된 7천여 문장)

버전 1.0.1 변경점


  • svn으로 소스관리
  • ndbm을 사용하던 것을 db를 사용하도록 고침 (dbm호환모드)
  • 소스트리 정리

개발 사이트


http://kldp.net/projects/kts

M.W.Park의 이미지
6373
points

평소에 관심이 많은

3
points

평소에 관심이 많은 부분이었는데...
좋은 소식이군요.

-----
오늘 나의 취미는 끝없는, 끝없는 인내다. 1973 法頂

정말 관심이 많았는데.

3
points

공부는 끝이 없군요 .

저도 참여해보고 싶습니다.

dormael의 이미지
3482
points

감사합니다. ^_^

2
points

만들어 보고 싶은 툴이었는데
맨땅에서 하기엔 무리가 있고 해서 계속 미뤄왔었는데...

이렇게 알려주셔서 감사합니다.

^_^

wkpark의 이미지
5898
points

KTS 개발을

2
points

KTS 개발을 계속하기위해 프로젝트를 입주시켰다기보다는...

우선은 소스관리차원에서 올린것입니다 :>

대대적으로 소스를 개정하기 보다는.. 기본은 그대로 두고 ispell -a 호환모드를 만든다거나 할 수 있겠습니다.

antz의 이미지
8175
points

오~ 멋집니다.

2
points

오픈소스 형태소 분석기가 있군요.
참 반가운 소식이네요. :-)

---


Blog : http://lum7671.egloos.com

wkpark의 이미지
5898
points

이거 말고도 몇개 더

3
points

이거 말고도 몇개 더 있습니다.

sma4 : GPL (소스 있음)
MoA : GPL (소스 못구함)

phpsearch: public domain (phpschool에 소스 있음)

이곳에서 검색해보시면 관련 정보를 찾으실 수 있습니다.

반가운 소식입니다.

3
points

최근에 원규님 블로그를 리더에 추가했는데 반가운 소식을 접하게 되어 기쁩니다. 오픈오피스 한국어 커뮤니티를 운영하다보니 맞춤법 검사기에 대한 사용자들의 요구사항을 자주 접합니다. (제 이해가 맞는지 모르겠지만) 위에서 언급하신 "ispell -a 호환모드"가 개발되면 ispell을 사용하는 애플리케이션에 한국어 맞춤법 검사 기능을 추가하는 것도 가능해지는 것이죠?

이렇게 좋은 자료와 코드가 있는지 모르고 지냈는데, 서둘러 공부를 시작해야겠습니다. :-)

김정규
http://openoffice.or.kr

phpsearch를 찾을수가 없네요.

1
point

혹시 정확한 링크를 찾을수 있을까요?

검색을 위해 형태소분서까지는 아니더라도 단어추출을 해야 하는데,
마땅히 쓸수 있는게 없네요

wkpark의 이미지
5898
points

이 소스는 제가

1
point

이 소스는 제가 가지고 있던 것인데,
기존 파일이 확장자를 모두 html였던 것을 php로 바꾼 것입니다.

장형석님의 phpsearch 0.52입니다.

참고 링크:

http://www.phpschool.com/gnuboard4/bbs/board.php?bo_table=tipntech&wr_id...

첨부 파일파일 크기
search-0.52.tgz149 KB
dormael의 이미지
3482
points

빌드시 오류

2
points

INSTALL문서를 보고 빌드해 보았는데

aclocal을 실행해 주지 않고 automake, autoconf, ./configure, make시에 문제가 있었습니다.

automake시에

aclocal.m4: 353: `automake requires `AM_CONFIG_HEADER', not `AC_CONFIG_HEADER'
configure.in: 353: required file `./$@)].in' not found

make시에

/bin/bash: -c: line 0: syntax error near unexpected token `)'
/bin/bash: -c: line 0: `if test ! -f )].in; then \'
make: *** [)].in] Error 2

와 같은 에러가 나면서 실패했습니다.

제가 툴 사용법들을 몰라서 원인은 잘 모르겠습니다.. ㅡ,.ㅡ

wkpark의 이미지
5898
points

방금 svn 다운받아서

0
points

방금 svn 다운받아서 테스트해보았습니다.

아무런 에러메시지 없이 무사히 컴파일 되는군요.

에러메시지를 보면 AC_CONFIG_HEADER말고 AM_CONFIG_HEADER쓰라는 말 같은데, configure.in에는 이미 AM_*을 쓰고 있습니다.

automake 버전차이때문이 아닐까 합니다. 저는 Fedora core5입니다..

automake -v를 해보니... 버전 1.9가 쓰이는 것 같고, autoconf -V 해보면 autoconf 버전은 2.59입니다.

dormael의 이미지
3482
points

역시 버전이 낮아서 그랬던것 같습니다.

0
points

확인해 주셔서 감사합니다.

automake의 경우가 1.4-p6이 설치되어 있네요. ㅡ,.ㅡ

워낙 재설치나 업데이트를 안하는 성격이라..

아무튼 automake전에 aclocal을 실행하면 아무런 문제없이 컴파일 됩니다. ^_^

오옷..

0
points

형태소 분석기에 관심을 가지다가 본 적이 있었는데,
오픈 소스로 변경하여 진행을 한다니,
관심을 가지고 지켜보고, 실력이 쌓이면 참여하도록 하겠습니다.

댓글 보기 옵션

원하시는 댓글 전시 방법을 선택한 다음 "설정 저장"을 누르셔서 적용하십시오.