욕설을 자동으로 차단하는 SW

권순선의 이미지

인터넷 게시판이나 채팅 사이트 등 사이버 공간 상에서 벌어지고 있는 언어폭력.... 어제 오늘의 이야기가 아니지요? 한 벤처기업에서 욕설 등을 자동으로 필터링해주는 소프트웨어를 개발했다고 합니다. 이런게 필요할 정도로 상황이 심각한 수준이란 거겠지요?

ytn 기사입니다. 자세한 내용은 "관련 링크"를 참고하시기 바랍니다.

-------
....(중략)....
정상적인 문장은 입력이 가능하지만, 음란한 표현이나 비속어가 포함되면 입력자체가 되질 않습니다.

음절과 형태소를 분석해 유사한 말을 모두 걸러내기 때문에 말을 바꿔 다른 방식으로 표현해도 비속어는 정확히 구분해냅니다.

[김종민, 아이모션 대표]
"의미를 파악해서 분석을 하기 때문에 필터링을 할 수 있는 효율을 높일수 있다는 특징이....
-------

p.s. 사이버 공간 상에서의 언어폭력.... 사실 이곳 geekforum도 예외는 아니지요? Anonymous로 글 올리시는 분들 중에 몇몇 분들.... 아무리 화가 나시더라도 제발 글쓰기 전에 한번만 생각해 주세요.... :-)

익명 사용자의 이미지

욕이야기가 나와서 뒤늦게나마 한마디 올리는데
정말 우리나라사람 욕잘합니다.
현재 일본에서 2년정도 공부하고 있는데
곰곰히 생각해보니 일본말에 욕이라고는

짐승 바보 얼간이 이정도 수준인것 같습니다.

많아봐야 10개 미만일것 같은데요.
(제 일본어 실력이 짧아서 그렇다면 리플해주십시요 ^^)

우리나라 욕..온갖 상상력을 다 동원한 욕이지요..
수많은 조합과 차마 인격체라고는 말하기 어려운
상상력으로 만들어낸 셀수 없는 욕...

음. 우리의 현실이라고 생각합니다.

요즘 어린 학생들 이야기하면서 욕 안하면 말 못할것 같네요.

익명 사용자의 이미지

몰라~ 욕은 어쩐 나ㅃ 겁니다. 무엇보다 중요한건 네티즌들에 양심이거니와 인간성일 것입니다. 욕을 아무리 막는다 하더라도 할 인간들은 어떻게던 할 겁니다. 예를 들어
볼까요?!
"당신 부모님은 청소부야"라고 하면 어떼 막을 겁니까?! 설령 노골적인 욕따위를 필터링 한다 하더라도 어려울 겁니다."개야!"
라는 글이 안된다 치면 "지금 우리집 개가 아파서 돌보느라 겜을 제대로 못해요 미안해요" 이렇게 긴 문장치고 나면 헛수고가 됩니다. 얼마나 짜증나겠습니까! 이런 경험들은 이미 많은 네티즌들이 온라인 겜을 통해 겪어 보았을 겁니다. 차리리 모 온라인 게임처럼 욕을 하지 말고 바른말 고운말을 쓰도록 하자고 표어를 만들는게 나을 듯... 어차피 씀들은 쓰니까 양심에 맡기죠!
아님 아이에 욕설 10번이상 하는 사람은
적발하던가...
설마 "개나 씹 조..옷 등등" 따위에 말들을 일정기간 동안 많이 쓰지는 않을테니...상습적인 사람들만이라도 잡아보는 게...두서 없는 글...이만 줄입니다.
^^; 내가 먼 소리한거지

익명 사용자의 이미지

문법에 어긋나면 아예 안보여주는 쪽으로 접근한다면 가능할듯요.. 물론 사용가능한 표현은 줄어들겠지만.. 이런건 좀 노이로제인가요? 방화벽이 모든걸 차단하고 하나식 열어주는 식으로 접근하는 것이 좋다는 쪽으로 얘기하던 어떤 책이 있었는데.. 암튼 진짜로 노이로제라면 말입니다..

김윤호의 이미지

이것도 문제를 보는 한 관점이 될 수 있을런지는 모르겠지만...
컴퓨터의 능력을 너무 과장되게 생각하는 경향과도 연관이 있다고 봅니다.
자연어 검색... 형태소 분석...
과연 그러한 것들이 컴퓨터 안에서 가능한 것일까요? 진정한 의미에서?
문자나 기호에서 발음을 유추하고 의미를 파악하는 인간의 지능이 과연 귀와 입, 두뇌가 없는 기계로 대치될 수있을런지...
기계는 어디까지나 기계일 뿐입니다.
가치판단문제까지 기계가 대신해줄 순 없는 것이죠.
기계의 한계를 인식하지 못하면 오히려 어색한 결과만을 빚어내고 말죠.

욕도 때에따라서는 꼭 필요한 표현 수단이 될 수도 있습니다.

'...그러므로 "씹새끼"라는 어원의 뜻은....'

컴퓨터가 이 문장을 읽고, 의미파악을 하고...
허용을 할지 안할지 결정할 능력이 있습니까? 수십조 아니 수경조의 분기문으로도 안될겁니다..
그런 능력을 기계로 구현했다면 정말로 대단한 경사가 되겠지요.. 아마도 노벨상정도로는 치하할 수 없는 인류사를 새로써야할 지대한 업적이 되겠지요.

제발 떠벌이기 좋아하는 실력자님들이여... 솔직해집시다.

익명 사용자의 이미지

맞습니다. 다 떠벌리는 거죠.

근데 그렇게 떠벌리는 걸 진짠 줄 아는 사람이 많습니다. 특히 전자신문에 그런 헛소리가 많이 나오는 데.. 그거 보고 주식 사는 사람들 정말 불쌍합니다 (하긴 그 불쌍한 사람들을 이용해서 차익을 챙길수도 있겠군요 쩝).

과학기술과 관련없는 사람들은 이게 무슨 마법이라도 되는 줄 아나 봅니다.

익명 사용자의 이미지

네 맞아요.

특히 자기회사 자랑하는 기사들 말이죠.

뭘 개발했네라고 하는 것들..

이거 사실은 영업부에서 기사 써가지고 기자한테 주더라구요.

근데 영업하는 사람이 기술에 대해 뭘 알겠습니까.

그 사람들은 뻥이 절반인데.

그렇게 해서 보내면 기자들은 앉아서 신문 사이즈에 맞게 편집만 하죠.

그러니 사실은 이미 부풀려지고, 사라져 버리죠.

그리고, 사실을 확인하려 전화오면 엔지니어 대려다가

설명이나 하라고 하고. 하여간 그런회사들이 넘 많아요.

죄송합니다. 본문 내용하고 관계없는 얘길해서요.

그래도 화가 나서 이렇게

익명 사용자의 이미지

근데 욕이라는것이 나쁘기만 할까요..

혼자 투덜거릴수도 있고.

친한친구끼리 상투적으로 쓰기도 하는데.

그리고 필터링이 제대로 되지도 않아.

올바른 단어를 썼을 경우에도 오류가 나더군요.

그런건 정말 문제인거 같습니다.

익명 사용자의 이미지

네티즌 들이 스스로 각성하기 전까지는 불가능한

일이 아닐까여...아님 발신자 추적 장치를 함 개발을

하던가여...아차 이건 어떨 까여...

게임 서버측에서 이용자의 대화를 로그 남기는것은여

너무 파일이 커질랑가....

암튼 스스로 각성할 수 밖에 없는 듯 싶습니다.

그럼 이만....

익명 사용자의 이미지

글씨요 별 효력이 없을듯..

왜냐하면 길게 써버리면 되니깐요.

예를 들면) 개새끼 <- 이단어를

개이세이끼,객세끼 등등 <-- 이렇게 해버리면 어떻게 될까요?

물론 이런거 까지 DB에 넣으면 되지만, 그러면 SW웨어의 속도 엄청 늦여집니다.

이건 포르노 사이트 다 차단하는 프로그램을 나눠주는 거 하구 같군요.

그런데 쓸데없는 인력을 낭비하지 말구요.

차라리 교육을 통한 올바른 인성을 길러서 욕을 않하게 만들어야죠.

근본적인 대책을 세워야 한다구 봅니다.

익명 사용자의 이미지

그런것 만들어봤자 아무 도움도 안되죠
어차피 프로그래밍이란 일정한 규칙을 끌어내는것인데
그 규칙을 만든것도 사람이고
그 규칙을 피할수 있는것도 사람이죠

컴퓨터가 자기 스스로 생각하고 유추하고 결론을
내리지 않는이상 아무런 의미가 없는거죠

그런걸 왜 만드는지 이해가 안되네..

익명 사용자의 이미지

no!

logout_의 이미지

글쎄요. 꼭 이런 소프트웨어까지 개발할 필요가 있을까...

개인적으로 프리 배틀넷 서버를 운영하고 있는데요... 사실 욕 문제가 심각하기는 합니다. 특히 맨날 치고받고 싸워야 하는 배틀넷에서 욕은 뭐... 맨날 쓰는 단어라고 봐야죠.

실제 중요한 것은 게시판 운영을 할 때 정책을 설정하는 것이라고 봅니다. 입을 꿰멘다고 욕을 하지 않을까요... 그것보다는 게시판마다 성격에 따라 '욕을 했을 경우'에 상응하는 처벌을 내리는게 중요하다고 봅니다. 욕을 하는 것은 자유이지만 욕을 내뱉고 상대방을 기분나쁘게 했다면 그에 대한 책임을 지도록 하는게 중요하다고 봅니다. 욕을 했을 경우, 혹은 욕을 심하게 해서 상대방을 공격했을 경우 해당 아이디의 소유자에게 이를테면 쓰기 금지를 며칠간 적용시킨다든가 하는 정책이 훨씬 나을 것이라고 봅니다.

씨바나 게쉑이라는 황당한 신조어가 생기게 된 것은 사실상 쓸데없이 서버에서 욕 필터링을 하려고 한 까닭이 큽니다. 채팅실에서도 섹시,야한, 혹은 뜨거운과 같은 단어는 못 쓰게 된지 오래이지만 그 덕분에 원조교제가 수그러든 것은 아닙니다. 항상 우리나라 사회를 생각하면 떠오르는 것이지만 좀 더 문제를 솔직하게 접근하고 근원을 파헤치는 것이 중요하다고 봅니다.

그런데... 운영자 입장에서는 욕 필터링을 설치하는 것이 빠르죠. 저도 서버 게시판에는 그냥 속편히 욕 필터링을 넣어서 쓰고 있습니다. 매일 올라오는 글을 모두 모니터링 하는 것도 한계가 있구요. 여유가 나면 사용자 아이디 단위로 욕한 부분을 중점적으로 소팅해주는 기능이나 만들어봐야겠습니다. :)

익명 사용자의 이미지

마치 불건전 사이트 차단 프로그램이나 욕설을 차단한다는 필터기능은 끝없이 새로운 음란사이트, 새로운 욕들을 등록해야겠지요...

그리고... 문제가 될리 없는 글들도 입력이 않되거나...

어쩌면 오히려 새로운 욕들을 탄생시킬지도.......

익명 사용자의 이미지

한글은 정말 좋습니다.

욕은 얼마든지 변형을 가해서 쓸수 있습니다.

포트리스에서 시험을 해봤는데 막지 못하더라구요.

아래분 말씀대로 욕이 아닌 정상적인 표현을 막는 수단이 될것입니다.

괜한짓을 한거 같군요.

익명 사용자의 이미지

바른말 아니 고운말을 생활화하는게 중요하겠지요?

그래서 말인데... 앞으론 컴퓨터 교육도 중요하지만... 예절

교육부터 해야 하지 않을까요!

말 한 마디가 천냥빚을 갚는다.

익명 사용자의 이미지

글쎄요...
잠시나마 효과를 볼진 몰라두
결국 소용없을꺼같은데요
오히려 정상적인 글마저 막아버리지나 않을런지...

jspking의 이미지

글쎄.. 얼마나 정확하게 할 수 있을런지는 모르겠지만...

"엿보다"라는 말을 써서 글이 등록 안되는 일이 없었으면 합니다.

"엿"이라는 말 때문에 글이 등록 안되는 site도 있더라구요.

그리고, 변형된 욕이 너무 많아서 원. 그것까지 다 할 수 있을런지..

이런 소프트웨어를 만들면 국어 발전도 되고 뭐.. 좋지만.

그것에 앞서 올바르고 건전한 언어 생활이 앞서야 할 것 같네요..

잠자는게 보약!

익명 사용자의 이미지

맞습니다.

포트리스같은 게임에서도

대다수의 욕은 막아내지만

그때문에 더 불편하죠

씨x을 싀발이라고 표현하기도 하고

그보다는 먼저 사용자들이 제대로된

표현을 했으면 좋겠네요

육두문자 섞인 말보다도 쏘아붙이는 말이

더욱 보기 싫을때가 많거든요

익명 사용자의 이미지

흴흴..
여긴 아직도 &#숫자; 를 제대로 변형해주지 않는군요. 여기 관리자 분이 정규표현식으로 단 한줄만 추가하면 가볍게 해결될 문제인데.. & 를 & 로 바꾸는 건 좋지만서도..것 때문에 확장 완성형 글자가 깨져서 아예 알아볼 수 없는 건 어케 좀... -_-

종종 보이지요..저렇게 깨진 글자.

익명 사용자의 이미지

MS 통합완성형시로...

MS가 한국시장 저그 맘대로 주무를려구 멋대로 만들어낸 코드..

cdpark의 이미지

그 글자는 KS5601 에 들어있는 글자가 아니라 MS 통합완성형이라 불리는 확장 글자에만 들어있는 글자이기 때문에 그 모양입니다. Unicode나 조합형에서 쓰면야 관계없겠지만요.