음란 동영상 물렀거라!-‘아이스’개발한 세종대학교 컴퓨터공학과 유성준 교수
상태바
음란 동영상 물렀거라!-‘아이스’개발한 세종대학교 컴퓨터공학과 유성준 교수
  • PC사랑
  • 승인 2008.10.23 17:09
  • 댓글 0
이 기사를 공유합니다

일반 동영상에서 프레임 판독 오차가 나타난 것에반해음란동영상에서는 거의완벽하게성인프레임을잡아냈다.
“음란 동영상 사태로 발등에 불이 떨어진 포털들이 대안 찾기에 바쁘다. 외국에서 소프트웨어를 들여온다는 이야기도 들었다. 학계 논문을 보면 현재 우리나라의 판독 기술은 상당한 수준에 있다. 하지만구체적으로 어떤 것이 좋고 나쁘냐를 가리기는 어렵다. 만약 기자에게 네이버나 엠파스, 구글 중에서 어떤 검색이 가장 좋으냐고 물으면 뭐라고 대답할 것인가?
그렇다. 그것은 이용자의 검색 기준에 따라 다른 대답이 나올 수밖에 없는 것이다. 만약 판독에 쓰일표준 데이터셋이 있다면 그것으로 객관적인 판독률을 가릴 수 있겠지만 저마다 자기들이 만든 데이터셋으로 테스트를 하기 때문에 어떤 것이 더 좋다고는 말할 수 없다. 다만 이번 음란 동영상사태에 관련해서는 아이스나 국내 판독기술로도 좋은 성과를거둘수있을것으로본다.”
아이스는 음란물 중 97%를 잡아낸다. 나머지 3%는수치상으로는 아주 적은 숫자지만 음란물의 파급효과를 감안하면 반드시 잡아내야할 부분이다. 지금 단계에서는 3%의 오차를 모니터 요원이 맡는다. 성인 프레임의 섬네일을 쭉 띄워 보여주기 때문에 판독에 드는 시간을훨씬줄일수있다.

음란 동영상 판독률 97%
“동영상업로드는실시간으로올리는것과사이트특성에따라UCC 형태로리코딩하는방법이있다. 실시간업로드는사전판독이불가능하기때문에어려움이많지만리코딩동영상은 훨씬 쉽다. 변환 과정에서 컨버전 서버를 통해 아이스가 키프레임으로음란물인지아닌지를바로가릴수있다.”
유성준 교수팀은 현재 8천500개의 데이터셋을 가지고 있다.
앞으로 스파이캠, 폰카, 색상변조 등 화면 퀄리티가 떨어지는동영상과 갖가지 이미지들을 대상으로 아이스의 판독 능력을강화시킬것이다.
“과거보다 높은 판독률을 실험으로 증명했다. 언론 발표 이후 오디오관련전문가들의의뢰가몇번있었다. 음란물판독에관련해서 연구한 결과가 있으니 시스템을 통합해 모듈을 만들어보자는얘기였다. 화면과사운드를동시에필터링하면거의완벽한판독이가능할것이다. 하지만아직은원론적인단계로봐야한다.”
야후코리아 사건 이후 3월 30일부터 4월 9일까지 한국인터넷기자협회와 언론개혁시민연대는 다음 TV팟 모니터 활동을 벌였다. 관리가 취약한 심야시간과 수시 모니터링 실시 결과를 보면 유해 동영상과 저작권 침해가 12건이었다. 이 수치는 특정 시간대에 특정 사이트만 대상으로 한 것이기 때문에 온라인전체를 놓고 본다면 이보다 훨씬 많은 불법사례가 있을 것으로보인다.
UCC 붐이 일면서 동영상 업로드 수가 급격히 늘고 있지만현재는 이를 완벽하게 관리하지 못하고 있다. 마음만 먹으면 언제 어디서든 음란 동영상을 올릴 수 있다는 이야기다.
이것이필터링과검색에걸리느냐아니냐는중요하지않다.
인터넷에서는유행과붐에사회와도덕의필터가잘통하지않기 때문이다. 소프트웨어 개발은 물론 올바른 인터넷 문화와제도가하루빨리자리를잡아야한다.
 
세종대학교 컴퓨터공학과의 유성준 교수도 음란물판독 소프트웨어를 공개했다. 여러 가지 프로젝트를 병행하느라 개발 기간이 7년이나 걸린 작품이다. 소프트웨어 업그레이드가 우선이다 보니 마땅한 이름을 짓지 못하다가 4월중순에서야‘아이스’(audult image search)라는이름을만들었다.
“오랫동안 정보통신윤리위원회 일을 해왔다. 주로 텍스트 기반 검색으로 성인물과 폭력, 마약, 기타 유해물을 거르는 작업을 했다. 이미지나 영상의 유해성검색 기술은 개선해야할 부분이 많다. 지난 7년은 그것을 보완하는 기간이었다고보면된다.”
아이스를 서둘러 발표한 것은 음란 동영상 문제의 심각성을 지적하고 의식의 전환이 필요하다는 생각에서였다. 미디어 관련 회사와 포털, 제 3의 업체들과 파트너십이 형성되면 기술제휴를 통해 UCC 포털사이트 등에서 음란물을 잡아내는 데 도움을주는 시스템을 만들 계획이다.
아이스가 해당 동영상이음란물인지 아닌지를 판단하는 기준은 동영상의 색깔, 형태, 그리고 얼굴 윤곽 등 3가지다. 편의상 구분을 짓자면 첫째는 사람의 얼굴 판독이다.
 
두 번째단계에서 살색과 살색이 아닌 것을 구분해 음란물 여부를 판단하기 때문에그전에 사람의 얼굴은 제외시키는 것이다.
이것은 음란물에 피부노출이 많은 것에서 착안되었다. 2단계에서는 얼굴을 뺀 다른 부분에 살색이 얼마나많은지를 가린다. 세 번째는 얼굴 외의 살색 중에서 그것이 사람의 피부색인지 배경색 중 하나인지를 판단하는 과정이다. 이 과정들은 각각 분리되거나순서대로가아니라동시에진행된다.
기본 원리 설명을 마친 유성준 교수는 바로 음란물 판독 시연에 들어갔다. 일반영상 테스트에는 의학드라마 <하얀 거탑>을 돌렸다. 화면은 실시간으로 진행되고 5초에 한 번씩 프레임을 뽑아 이것이 성인 프레임인지 일반 프레임인지를 가려 화면에 숫자로 나타낸다. 두 번째는 음란동영상을 돌렸다.
 

일반 동영상에서 프레임 판독 오차가 나타난 것에반해음란동영상에서는 거의완벽하게성인프레임을잡아냈다.
“음란 동영상 사태로 발등에 불이 떨어진 포털들이 대안 찾기에 바쁘다. 외국에서 소프트웨어를 들여온다는 이야기도 들었다. 학계 논문을 보면 현재 우리나라의 판독 기술은 상당한 수준에 있다. 하지만구체적으로 어떤 것이 좋고 나쁘냐를 가리기는 어렵다. 만약 기자에게 네이버나 엠파스, 구글 중에서 어떤 검색이 가장 좋으냐고 물으면 뭐라고 대답할 것인가?
그렇다. 그것은 이용자의 검색 기준에 따라 다른 대답이 나올 수밖에 없는 것이다. 만약 판독에 쓰일표준 데이터셋이 있다면 그것으로 객관적인 판독률을 가릴 수 있겠지만 저마다 자기들이 만든 데이터셋으로 테스트를 하기 때문에 어떤 것이 더 좋다고는 말할 수 없다. 다만 이번 음란 동영상사태에 관련해서는 아이스나 국내 판독기술로도 좋은 성과를거둘수있을것으로본다.”
아이스는 음란물 중 97%를 잡아낸다. 나머지 3%는수치상으로는 아주 적은 숫자지만 음란물의 파급효과를 감안하면 반드시 잡아내야할 부분이다. 지금 단계에서는 3%의 오차를 모니터 요원이 맡는다. 성인 프레임의 섬네일을 쭉 띄워 보여주기 때문에 판독에 드는 시간을훨씬줄일수있다.

음란 동영상 판독률 97%
“동영상업로드는실시간으로올리는것과사이트특성에따라UCC 형태로리코딩하는방법이있다. 실시간업로드는사전판독이불가능하기때문에어려움이많지만리코딩동영상은 훨씬 쉽다. 변환 과정에서 컨버전 서버를 통해 아이스가 키프레임으로음란물인지아닌지를바로가릴수있다.”
유성준 교수팀은 현재 8천500개의 데이터셋을 가지고 있다.
앞으로 스파이캠, 폰카, 색상변조 등 화면 퀄리티가 떨어지는동영상과 갖가지 이미지들을 대상으로 아이스의 판독 능력을강화시킬것이다.
“과거보다 높은 판독률을 실험으로 증명했다. 언론 발표 이후 오디오관련전문가들의의뢰가몇번있었다. 음란물판독에관련해서 연구한 결과가 있으니 시스템을 통합해 모듈을 만들어보자는얘기였다. 화면과사운드를동시에필터링하면거의완벽한판독이가능할것이다. 하지만아직은원론적인단계로봐야한다.”
야후코리아 사건 이후 3월 30일부터 4월 9일까지 한국인터넷기자협회와 언론개혁시민연대는 다음 TV팟 모니터 활동을 벌였다. 관리가 취약한 심야시간과 수시 모니터링 실시 결과를 보면 유해 동영상과 저작권 침해가 12건이었다. 이 수치는 특정 시간대에 특정 사이트만 대상으로 한 것이기 때문에 온라인전체를 놓고 본다면 이보다 훨씬 많은 불법사례가 있을 것으로보인다.
UCC 붐이 일면서 동영상 업로드 수가 급격히 늘고 있지만현재는 이를 완벽하게 관리하지 못하고 있다. 마음만 먹으면 언제 어디서든 음란 동영상을 올릴 수 있다는 이야기다.
이것이필터링과검색에걸리느냐아니냐는중요하지않다.
인터넷에서는유행과붐에사회와도덕의필터가잘통하지않기 때문이다. 소프트웨어 개발은 물론 올바른 인터넷 문화와제도가하루빨리자리를잡아야한다.

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.