필터링이라고 해야 할지 모르겠는데요...
이명박 바보 -> ㅇㅁㅂ ㅂㅂ
로 자동으로 바꾸게 할 수 없을까요? 저렇게 되면, 그 글의 컨텍스트를 아는 사람은 알것이고, 모르는 사람에게는 필터링의 역할을 하게 되지 않을까요?
저런걸 php 로 구현할 수 있을까요??
조합형 변환+초성만 추출
한글 인코딩과 관련된 라이브러리가 php로만 있다면 크게 어려울만한 것은 아니군요.
iconv를 사용해서 cp949 -> johab으로 바꾸고 첫 바이트의 2번 비트부터 6번 비트까지 떼어 내서 조합형 테이블에 대입해서 바꿔 주면 문제는 없을 것 같네요. :)
아니면 좀 무식하게 완성형 한글의 모든 형태소를 디비에 넣어 두고 하나씩 변환한다는... -ㅅ-;;
그런데 정말 경험이 많은 분들은 좀 더 hacker답게 생각하시는군요. 전 이 문제를 처음 봤을때 위의 방법밖에는 안떠올랐는데.. :oops:
---> 데비안 & 우분투로 대동단결!
나름대로 UTF-8을 사용해도 변환이 쉽습니다. 자음에 대한 글꼴번호가 따로있고 한글에 대한 규칙도 간단해서 쉽게 초성을 얻을 수 있습니다.
------------------------------ 좋은 하루 되세요.
단순히 자음만 뽑는 filtering(?)보다 그냥 문장 대치 식으로 하는게 어떨까요?
필요에 따라 "지랄염병 -> GRYB" 식의 변환도 할 수 있을테고요.
단순히 자음만 뽑는 filtering(?)보다 그냥 문장 대치 식으로 하는게 어떨까요? 필요에 따라 "지랄염병 -> GRYB" 식의 변환도 할 수 있을테고요.
필터링할 양이 많아지면 많아질 수록 귀찮아지겠죠 :)
- 토끼군
초성만 분리하는건 의외로 간단합니다
ㅠ.ㅠ url 이 생각이 안나네요...
암튼 간단했다라고 밖에....
-- 아쉬운 하루 되세요 --
조합형 변환+초성만 추출 한글 인코딩과 관련된 라이브러리가 php
조합형 변환+초성만 추출
한글 인코딩과 관련된 라이브러리가 php로만 있다면 크게 어려울만한 것은 아니군요.
iconv를 사용해서 cp949 -> johab으로 바꾸고 첫 바이
iconv를 사용해서 cp949 -> johab으로 바꾸고 첫 바이트의 2번 비트부터 6번 비트까지 떼어 내서 조합형 테이블에 대입해서 바꿔 주면 문제는 없을 것 같네요. :)
아니면 좀 무식하게 완성형 한글의 모든 형태소를 디비에 넣어 두고하나
아니면 좀 무식하게 완성형 한글의 모든 형태소를 디비에 넣어 두고
하나씩 변환한다는... -ㅅ-;;
그런데 정말 경험이 많은 분들은 좀 더 hacker답게 생각하시는군요.
전 이 문제를 처음 봤을때 위의 방법밖에는 안떠올랐는데.. :oops:
--->
데비안 & 우분투로 대동단결!
나름대로 UTF-8을 사용해도 변환이 쉽습니다.자음에 대한 글꼴번호가
나름대로 UTF-8을 사용해도 변환이 쉽습니다.
자음에 대한 글꼴번호가 따로있고 한글에 대한 규칙도 간단해서 쉽게 초성을
얻을 수 있습니다.
------------------------------
좋은 하루 되세요.
단순히 자음만 뽑는 filtering(?)보다 그냥 문장 대치 식으로 하
단순히 자음만 뽑는 filtering(?)보다 그냥 문장 대치 식으로 하는게 어떨까요?
필요에 따라 "지랄염병 -> GRYB" 식의 변환도 할 수 있을테고요.
[quote="cdpark"]단순히 자음만 뽑는 filtering(?)보
필터링할 양이 많아지면 많아질 수록 귀찮아지겠죠 :)
- 토끼군
초성만 분리하는건 의외로 간단합니다ㅠ.ㅠ url 이 생각이 안나네
초성만 분리하는건 의외로 간단합니다
ㅠ.ㅠ url 이 생각이 안나네요...
암튼 간단했다라고 밖에....
-- 아쉬운 하루 되세요 --