음란물 판독기술 개발한 야동잡는 ‘유본좌’

warpdory의 이미지

http://www.hani.co.kr/arti/society/society_general/200962.html

Quote:

[현장] 7년간 포르노 틀어놓은 유성준 교수 연구실
하얀 거탑 “통과” 젖소부인 “컷!…샘플 8500개 프로그래밍
음란물 판독SW 개발 97%의 놀라운 정확도 자랑

“제가 소개할 이미지 판독기술은 원래 교통카메라에 설치돼 번호판을 식별하거나, 로봇에 적용돼 물체를 판별하는 용도로 쓰입니다. 다만 저는 ‘야동’ 잡는 기술로 개발했을 뿐입니다. 자, 주목해 주십시오.”

지난 3일 세종대 컴퓨터공학과 유성준 교수 연구실에서는 주목하기에 다소 민망한 실험이 펼쳐졌다. 5분짜리 포르노가 돌기 시작했고, 유 교수팀이 개발한 음란동영상 판독 소프트웨어가 5초 간격으로 한 장면씩 잡아 음란 여부를 판단해냈다. 소프트웨어가 잡아낸 이미지 60개에 대해 모두 음란 판정이 내려졌다.

... 후략 ...

살색(?) 비율 및 소리를 기준으로 판정한다더군요.
다만, 살색이 우리가 말하는 살색이 아닌 경우.. 는 어떻게 잡을지 궁금합니다.

별게 다 나오는 세상이 되었군요.

ydhoney의 이미지

쓸데가 없어요 쓸데가..
 
====================여기부터 식은어치====================
안녕하세요. 저는 야동 초등학교 2학년 6반 11번입니다!! 제 컴퓨터에 리눅스를 깔아보고 싶습니다. 리눅스라는건 어제 처음 들어 보았습니다.
리눅스에서도 카트라이더는 되겠지요? 설마 안되나요? 안되면 왜 쓰나요? =3=33 리눅스에서는 카트라이더 캐릭터 머리가 너무 커서 못받아들이나요?

sphawk의 이미지

요새 UCC가 많이들 뜨는데, 올리는 음란 동영상을 전부 걸러낼 수 있을까요?
응용 가능성은 찾아보면 많습니다.

ydhoney의 이미지

그걸 왜 걸러내느냐는거죠 -_- 제가 볼때 얘들이 이걸 모아서 별도의 카테고리화해서 활성화하려고 만든것같진 않거든요 -_-a

그러니까 쓸데없..

=3=33
 
====================여기부터 식은어치====================
안녕하세요. 저는 야동 초등학교 2학년 6반 11번입니다!! 제 컴퓨터에 리눅스를 깔아보고 싶습니다. 리눅스라는건 어제 처음 들어 보았습니다.
리눅스에서도 카트라이더는 되겠지요? 설마 안되나요? 안되면 왜 쓰나요? =3=33 리눅스에서는 카트라이더 캐릭터 머리가 너무 커서 못받아들이나요?

iamt의 이미지

전 그렇게 생각안하는데요
---------------------------------------------------------------------------------
C(++)과 php 펄등을 공부하고있습니다.
반갑습니다! 리눅스 :-)

---------------------------------------------------------------------------------
C(++)과 php 펄등을 공부하고있습니다.
반갑습니다! 리눅스 :-)

n0vem6er의 이미지

저 교수 연구실의 연구원들은 야동을 매일 보겠군요.. 헐헐.. ^^;;

mokyj의 이미지

그럼 XX 8500개를 봤다는?

ohhara의 이미지

라텍스옷 입고 채찍을 휘두르는 거는 잡아내지 못할 것 같군요.

Taeho Oh ( ohhara@postech.edu , ohhara@plus.or.kr ) http://ohhara.sarang.net
Postech ( Pohang University of Science and Technology ) http://www.postech.edu
Digital Media Professionals Inc. http://www.dmprof.com

Taeho Oh ( ohhara@postech.edu ) http://ohhara.sarang.net
Postech ( Pohang University of Science and Technology ) http://www.postech.edu
Alticast Corp. http://www.alticast.com

warpdory의 이미지

일본 가더니 이상한 것만 배웠어.. -_-

---------
귓가에 햇살을 받으며 석양까지 행복한 여행을...
웃으며 떠나갔던 것처럼 미소를 띠고 돌아와 마침내 평안하기를...
- 엘프의 인사, 드래곤 라자, 이영도

즐겁게 놀아보자.
http://akpil.egloos.com


---------
귓가에 햇살을 받으며 석양까지 행복한 여행을...
웃으며 떠나갔던 것처럼 미소를 띠고 돌아와 마침내 평안하기를...
- 엘프의 인사, 드래곤 라자, 이영도

즐겁게 놀아보자.

ohhara의 이미지


저는 관심이 없는데 다른 사람들이 관심이 많은거 같아서 연구는 좀 해 뒀죠... 후후후...

Taeho Oh ( ohhara@postech.edu , ohhara@plus.or.kr ) http://ohhara.sarang.net
Postech ( Pohang University of Science and Technology ) http://www.postech.edu
Digital Media Professionals Inc. http://www.dmprof.com

Taeho Oh ( ohhara@postech.edu ) http://ohhara.sarang.net
Postech ( Pohang University of Science and Technology ) http://www.postech.edu
Alticast Corp. http://www.alticast.com

서지훈의 이미지

자세히 다 읽어 보진 않았지만, 이 기술을 지금의 상태로 일반 프로그래밍에 적용하는건 정말 힘든것 같네요.
이런 방법보단 모 업체에서 사용하듯이, 야동의 해쉬값을 저장하고 이걸로 판별하는게 더 나은게 아닌가 합니다.
일단 오탐도 없고, 좀 더 확실한...
근데 문제는 현존하는 야동을 어떻게 계속적으로 등록을 하느냐 하는거죠.
이건 직업병...에 노출이 너무 심할거 같습니다. ㅎㅎ;

<어떠한 역경에도 굴하지 않는 '하양 지훈'>

#include <com.h> <beer.h> <woman.h>
do { if (com) hacking(); if (money) drinking(); if (women) loving(); } while (1);

#include <com.h> <C2H5OH.h> <woman.h>
do { if (com) hacking(); if (money) drinking(); if (women) loving(); } while (1);

익명사용자의 이미지

[공개모집] 해커를 찾습니다.

세종대 컴퓨터 공학과 유성준 교수의 연구실에 있는 컴퓨터를 해킹해서
HDD에 있는 포르노 동영상만 추출해주실 해커를 찾습니다.

일단 포르노 동영상을 구한 후 이 글에 답글을 달아주십시요. - 파닥...

익명사용자의 이미지

푸루나 추천

Darkcircle의 이미지

웃다갑니다. =3
---------------------------------------------------------------
폐인이 되자 (/ㅂ/)

---------------------------------------------------------------
폐인이 되자 (/ㅂ/)

passinger의 이미지

그놈으로 다시 돌아 오세요^^

나는 전기장이 입니다

passinger의 이미지

그놈으로 다시 돌아 오세요^^

나는 전기장이 입니다

lovian의 이미지

살색 판별이라면..
황색인종 것만 잡는건가, 백인은 흑인은??
-----------------
한글을 사랑합니다.

-----------------
한글을 사랑합니다.

ironiris의 이미지

게시판 필터링 기술은 잘모르겠고
스캐닝문서 판독하는 프로그램을 쓸때
인식율 97%는 그냥 쓸만하네.. 수준이던데... 놀라운 정확도는 좀 그렇고..

Dot의 이미지

8500*0.03 == 255

255편은 걸러내지 못했다는 것이군요....

희망을 가져야 하나요?? ....(응??)

jj의 이미지

인식률 97%가 중요한게 아니라, 오탐율이 더 중요할것 같은데요? 야동아닌 영상이 야동으로 분류되는일이 1%라도 있다면, 쓰기 거시기 할텐데요.

차라리 지훈님이 얘기하신 해쉬값을 이용하는게 날것 같네요, 포털업체들이 연합해서, 야동 파일에 대한 해쉬DB를 구축하면 괜찮은 물건이 나올듯...
--
콘쏠의힘

--
Life is short. damn short...

예진아씨의 이미지

베이지안 필터 같은 확률적 필터를 이용하거나 해서
추가 샘플을 학습시킬 수만 있다면 유용하게 쓰일 수 있을 겁니다.

스팸 필터도 (스팸을 못 걸러내거나 엉뚱한 메일을 스팸으로 거르는)
잘못된 분류도 하곤 합니다만 학습시켜 가며 잘 쓰고 있잖습니까?

임예진 팬클럽 ♡예진아씨♡ http://cafe.daum.net/imyejin

임예진 팬클럽 ♡예진아씨♡ http://cafe.daum.net/imyejin

jj의 이미지

'스팸아님'의 정보제공은 믿을만한 개개인의 사용자가 하지만, '야동아님'의 정보제공은 결국 포털이 혼자 해야한다는 점에서 다른듯. 누리꾼을 마냥 믿을 수 없지요.

--
콘쏠의힘

--
Life is short. damn short...

예진아씨의 이미지

UCC를 관리하는 것이 포탈 관리자들이니 관리자들의 모든 것을 수동으로 분류하지 않고 일부 작업을 자동화하는 데는 도움을 줄 수도 있을 겁니다.

임예진 팬클럽 ♡예진아씨♡ http://cafe.daum.net/imyejin

임예진 팬클럽 ♡예진아씨♡ http://cafe.daum.net/imyejin

jj의 이미지

좋은 생각입니다.
--
콘쏠의힘

--
Life is short. damn short...

nthroot의 이미지

지란지교에서 이런게 나온게 있지 않나요. 그게 해쉬를 이용하던가요?.

------식은이 처------
길이 끝나는 저기엔 아무 것도 없어요. 희망이고 나발이고 아무 것도 없어.

kim109의 이미지

네.. 지란지교에서 개발해서 현재 상용화해서 팔고 있죠~

"엑스키퍼" 라는 제품명으로..

제가 일하는 부서에요.. -.-;

으흐흐

아싸~ 오늘도 화이팅!

seoleda의 이미지

궁금해서 그러는데 진짜로 해쉬를 이용해서 음란물을 판별하나요?
언뜻 생각하기에 동일한 동영상이라도 대단히 많은 종류의 해쉬를 만들 수 있을 것 같습니다.
예를들어 30프레임짜리 아주 짧은 영상이 있다고 치면, 거기서 한 프레임만 뺀 29프레임짜리 영상도 원 영상과 별차이가 없지만, 해쉬값은 다르게 나올겁니다.
또한, 어떠한 압축코덱을 사용했느냐, 동일한 압축코덱을 사용했더라도, p-프레임을 어떤식으로 구성했느냐에 따라서도 최종 비트열이 달라지는데 단순하게 해쉬값만 비교했나요?

제 나름대로 생각한 방법은,
1) 미세한 비트열의 변화에 동일한 결과를 내는 해싱 기법이 존재하거나,
2) 영상내부의 특징점을 추출해서 그 정보모아 해싱 하거나 하는 방법
이 떠오릅니다만, 두 방법 모두 쉽지않을 것 같습니다.

7339989b62a014c4ce6e31b3540bc7b5f06455024f22753f6235c935e8e5의 이미지

물론 당연히 그렇지만 필터링을 피하기 위해 재인코딩 할 사람이 있을까요? -_-;;

Raz의 이미지

네 -_-
----------------------------------------------------
DELL XPS M1530
-Intel(R) Core(TM) 2 Duo Processor T7700
-4GB (2x2G) 667MHz Dual Channel DDR2 SDRAM
-NVIDIA(R) GeForce(R) 8600M GT
http://thegarage.tistory.com

'
----------------------------------------------------
DELL XPS M1530
-Intel(R) Core(TM) 2 Duo Processor T7700
-4GB (2x2G) 667MHz Dual Channel DDR2 SDRAM
-NVIDIA(R) GeForce(R) 8600M GT
http://thegarage.tistory.com

송효진의 이미지

일반적으로는 거의 없겠지만,
야구동영상이라면 얘기가 달라집니다. -_-;;;;;
MPEG 보드가 불티나게 팔릴지도 모릅니다.

emerge money
http://wiki.kldp.org/wiki.php/GentooInstallSimple - 명령어도 몇개 안되요~
http://xenosi.de/

ironiris의 이미지

동영상 마지막에 쓸데없는 데이터를 붙이면 hash 값이 달라지겠죠.

alfalf의 이미지

저 기술을 조금 응용하면 이름만 다르고 내용은 같아 귀찮게 하는 동영상을 찾아내 지운다거나 하는데 사용할 수 있지 않겠습니까? ㅋㅋ

superwtk의 이미지

최고 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ

--------------------------------------------------------------------------------
http://blog.superwtk.com

hanbyeol의 이미지

TV, VTR, 셋탑, PMP 등을 개발하시던 분 말씀에 따르면 화질 테스트하는 데는 살색이 많은 영상으로 하는 게 가장 좋다고 하더군요. 그래서 테스트룸에는 늘 노루표 영상이 돌아가고 있다고 합니다.

PMP개발하던 랩에 마실갔더니 소리는 죽여 놓고 테스트 보드를 TV에 연결해서 신나게 AV영상을 틀어 놓고 있더군요. 열심히 일하는 연구원들~.

warpdory의 이미지

3가지 동영상을 틀어 놓습니다.

말씀하신 그 노루표...

또 하나는 스포츠 중계... 또 하나는 드라마.

스포츠 중계 화면은 녹색(축구장이나 야구장 바닥...)이 얼마나 잘 표현되는지를 보기 위해서입니다. 주로 남성 고객층을 공략하기 위해서이고...
드라마는 파스텔톤이나, 빨간색, 파란색 ... 과 색감이 얼마나 잘 표현되느냐를 보기위해서입니다. 이건 주로 여성고객층(아무리 남자들이 요새 드라마를 많이 본다고 해도 드라마의 주 고객층은 여자죠.)을 공략하기 위해서입니다.

그리고 노루표야 뭐 .. 뻔한 거구.

거기에 더불어서 요새는 자연다큐멘타리(주로 열대 바다속)도 많이 봅니다. 얼마나 '화려하게' 표현되는지를 체크하기 위해서이지요.

---------
귓가에 햇살을 받으며 석양까지 행복한 여행을...
웃으며 떠나갔던 것처럼 미소를 띠고 돌아와 마침내 평안하기를...
- 엘프의 인사, 드래곤 라자, 이영도

즐겁게 놀아보자.
http://akpil.egloos.com


---------
귓가에 햇살을 받으며 석양까지 행복한 여행을...
웃으며 떠나갔던 것처럼 미소를 띠고 돌아와 마침내 평안하기를...
- 엘프의 인사, 드래곤 라자, 이영도

즐겁게 놀아보자.

남십자성의 이미지

세종대 실망이다.

jachin의 이미지

남십자성 실망이다.
====
( - -)a 이제는 학생으로 가장한 백수가 아닌 진짜 백수가 되어야겠다.

남십자성의 이미지

포르노를 노루표라고 부르며 저속한 말 쓰는 것보단 낫지, 전 본적 없음

jachin의 이미지

노루표라고 말한적도 없는데, 노루표가 뭔지 설명한 분보단 낫지, 전 말한 적 없음
====
( - -)a 이제는 학생으로 가장한 백수가 아닌 진짜 백수가 되어야겠다.

cogniti의 이미지

대단한 인공지능이네요. 각종 포탈사이트에 채택된다면, 때돈 버시겠네요.
나중에 로봇에도 응용 가능하겠군요.

bookgekgom의 이미지

살색으로 판별하니까 흑인 백인은 어쩌냐는 분들이 있는데...

그...흠흠....말을 못하곘네요. 차마 변태는 될수없기에...

암튼 논점은 다 걸러낼수있는 방법이 있습니다만....

어른이라면 다 아실텐데....

설마...동정들만...ㅇ,.ㅇ;;;

---------------------------------------------------------------------------------------------------------------
루비 온 레일즈로 만들고 있는 홈페이지 입니다.

http://jihwankim.co.nr

여러 프로그램 소스들이 있습니다.

필요하신분은 받아가세요.

superwtk의 이미지

비슷한 기술이 하나 있네요

http://www.yangsky.com/products/porndetect/htm/breastdetecting.htm

--------------------------------------------------------------------------------
http://blog.sumin.us

nahs777의 이미지

YouTube에서도 비슷한 기술을 저작권 보호용으로 사용하는 것으로 알고 있고.(저작권자가 하나를 적발하면 그것과 같거나 비슷한 장면이 나오는 것에 대해서 block 처리하는..)
기술자체는 사실 막 특별한건 아닌데. 야동이라는게 '정형화된 장면' 이 없음에도 97%나 인식률이 된다는것은 대단한 일일지도 모르겠네요..
필터링이라거나, 기술응용으로 초상권 보호등에 활용될 수는 있을것 같지만..

남자로써 저런기술은 반대... 합니다..