좀 색다른 필터링(?)

jaeswith의 이미지

필터링이라고 해야 할지 모르겠는데요...

이명박 바보 -> ㅇㅁㅂ ㅂㅂ

로 자동으로 바꾸게 할 수 없을까요?
저렇게 되면, 그 글의 컨텍스트를 아는 사람은 알것이고,
모르는 사람에게는 필터링의 역할을 하게 되지 않을까요?

저런걸 php 로 구현할 수 있을까요??

saxboy의 이미지

조합형 변환+초성만 추출

한글 인코딩과 관련된 라이브러리가 php로만 있다면 크게 어려울만한 것은 아니군요.

lifthrasiir의 이미지

iconv를 사용해서 cp949 -> johab으로 바꾸고 첫 바이트의 2번 비트부터 6번 비트까지 떼어 내서 조합형 테이블에 대입해서 바꿔 주면 문제는 없을 것 같네요. :)

kirrie의 이미지

아니면 좀 무식하게 완성형 한글의 모든 형태소를 디비에 넣어 두고
하나씩 변환한다는... -ㅅ-;;

그런데 정말 경험이 많은 분들은 좀 더 hacker답게 생각하시는군요.
전 이 문제를 처음 봤을때 위의 방법밖에는 안떠올랐는데.. :oops:

--->
데비안 & 우분투로 대동단결!

codebank의 이미지

나름대로 UTF-8을 사용해도 변환이 쉽습니다.
자음에 대한 글꼴번호가 따로있고 한글에 대한 규칙도 간단해서 쉽게 초성을
얻을 수 있습니다.

------------------------------
좋은 하루 되세요.

cdpark의 이미지

단순히 자음만 뽑는 filtering(?)보다 그냥 문장 대치 식으로 하는게 어떨까요?

필요에 따라 "지랄염병 -> GRYB" 식의 변환도 할 수 있을테고요.

lifthrasiir의 이미지

cdpark wrote:
단순히 자음만 뽑는 filtering(?)보다 그냥 문장 대치 식으로 하는게 어떨까요?

필요에 따라 "지랄염병 -> GRYB" 식의 변환도 할 수 있을테고요.

필터링할 양이 많아지면 많아질 수록 귀찮아지겠죠 :)

- 토끼군

voider의 이미지

초성만 분리하는건 의외로 간단합니다

ㅠ.ㅠ url 이 생각이 안나네요...

암튼 간단했다라고 밖에....

-- 아쉬운 하루 되세요 --