온라인에서 욕을 필터링 하는 방법에 대한 아이디어인데...
어디에 올려야 할까 하다 과게에 올립니다.
게임이나 온라인 커뮤니티를 하다보면 한두번쯤...아니 수백만번 욕 드시지 않습니까.
솔직히 한국말은 개인이 욕을 창조(?)할 수 도 있기 때문에 필터링이라는것이 거의 불가능하다고 생각됩니다.
'씨발' 같이 우리가 온라인에서 자주 들을 수 있는 욕으로 예를 들어보죠.
원형은 '씨발' 입니다.
'씨발'이 필터링한다면, 사람들은 씨1발, C발 씨 발, 시발, 슈발, 슈ㅣ발, 쉬발 등등.... 수많은 파생욕(..) 들을 개발해서 씁니다.
글자의 형태만으론 절대 필터링 할 수 없다는 생각에 내본 아이디언데요.
먼저 원형이 되는 '씨발' 이란 단어의 음성을 녹음합니다.
그리고 사용자가 적은 글자를 프로그램이 소리내어 읽습니다.
이 두가지 음성의 유사성을 비교해 음파의 모양이라고 하나요?
그 그래프가 비슷하면 걸러내는 것입니다.
예를 들어 '씨발' 이란 단어가 필터링에 걸렸을때 '슈발'은 전혀 다른 글자기 때문에 일반적인 필터링에는 안걸립니다.
하지만 저의 아이디어 필터링 프로그램에서는 '슈발' 과 '씨발'이 비슷하게 들리기 때문에 필터링으로 걸러내는 것입니다.
말 그대로 소리가 욕으로 들리면 필터링 하는것이죠.
아이디어 단계라서 문제점이 많이 보이긴 합니다.
예를 들어 아저씨발 같은 경우엔 욕이 아니지만 필터링에 걸리겠죠...
또한 위의 예처럼 '슈발' 에서의 '슈' 와 '씨발'에서의 '씨' 를 비슷한 발음으로 보려면 어느선 까지 비슷하게 봐야하는건지..
과게 여러분 이 아이디어 쓸만한가요?