게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
국정원 트위터에 남은 일베 흔적에 관한 뒷 이야기 풀어봅니다
게시물ID : sisa_411539짧은주소 복사하기
작성자 : 자로.
추천 : 18
조회수 : 306회
댓글수 : 1개
등록시간 : 2013/07/04 22:24:12
관련글 - [7차] 국정원 트위터? 일베 트위터? (클릭)
 
뉴스타파가 공개한 237,494개의 트윗에 남은 일베의 흔적을 추적하면서 몇가지 뒷 이야기를 일기처럼 몇자 적어볼까 합니다.
 
1.
다시 작업 하라면 절대 못할 것 같습니다.
 
시간이 오래 걸린 것은 그렇다 쳐도 워낙 더러운 내용의 글들을 지속적으로 보면서 이를 분류하는 작업은 정말이지 쉬운 일이 아니더군요.
 
2.
금칙어 때문에 정말 고생했습니다.
 
그냥 모든 자료를 이미지화해서 올리는 방법도 있지만, 그렇게 될 경우 스마트폰에서의 가독성이 현저하게 떨어지기 때문에 가능하면 최대한 금칙어를 찾아서 텍스트로 올리려고 하였습니다.
 
수도 없이 테스트를 거쳐서 드디어 글이 올라가는 순간은 마치 로또에 당첨된것 같은 기분이 들더군요.
 
이미지로 올린 주제별 검색어와 검색어 순위 이 부분도 정말 손이 많이 갔습니다.
 
알툴바와 같은 화면 캡쳐 프로그램을 활용할 경우 해상도가 떨어지는 단점이 있어서 저는 엑셀에서 파일을 작업한 부분을 최대한 확대 시킨 후에 화면을 캡쳐해서 이어붙이는 작업을 했습니다.
 
눈에 보이는 이미지는 2개이지만 사실 그 파일은 총 12개의 이미지를 붙여서 1px 단위로 세세하게 이미지 보정을 거친 후 만들어낸 이미지입니다.
 
3.
사실 금칙어 말고도 큰 어려움이 있었습니다.
 
막상 엑셀 파일을 첨부하려 하니까 파일 용량이 너무 커서 첨부가 되지 않더군요.
 
엑셀 파일 원본은 약 20메가 가까이 되는데 반해 파일 첨부는 3메가까지 밖에 되지 않더군요.
 
어떻게 해야하나 하고 발을 동동 구르다가 알집 프로그램을 통해 분할 압축을 하면 용량이 확 줄어든다는 정보를 얻었답니다.
 
그런데 ZIP 형식은 분할 압축이 지원되지 않고 EGG 형식만 분할 압축이 지원되더군요.
 
그래서 어쩔 수 없이 EGG 형식으로 파일을 올린 것이랍니다.
 
다른 방법으로 압축하는 방식이 있는지는 저도 더 공부를 해야 할것 같습니다.
 
4.
처음에 저는 작업을 할때 엑셀 2003 프로그램을 통해 분류 작업을 했습니다.
 
그런데 막상 작업을 하다보니 이상하더군요.
 
분명히 전체 트윗의 숫자는 237,494개 인데 검색 되어지는 결과물은 65,536개 까지만 나오더군요.
 
왜 그런가 했더니 엑셀 2003 프로그램의 경우 세로축의 셀이 65,536개가 최대치더군요.
 
그것을 늦게 발견하는 바람에 처음 이틀동안 작업했던 내용들은 모두 쓰레기가 되었답니다. ㅎㅎ
 
그리고 모든 트윗을 분류할수 있는 엑셀 2007 프로그램을 얻기 위해서 마이크로소프트사에서 제공하는 60일 체험판 프로그램을 다운 받아서 썼습니다. ㅎㅎ
 
그런데... 이게 한글 버전이 없더군요. ㅎㅎ ^^
 
처음에는 용어가 생소해서 적응하는데 무지 애를 먹었습니다.
 
5.
그런데 237,494개의 트윗을 분류하는 작업은 정말 힘들었습니다.
 
그 이유는 워낙 방대한 데이터라서 검색어 하나를 입력했을 때 출력까지 걸리는 시간이 거의 1분이 걸립니다.
 
예를 들어서 '일베' 라는 검색어를 입력하면 마치 컴퓨터가 다운이 되는 듯이 '응답 없음' 메시지가 한참을 나오다가 갑자기 결과물이 떡 하고 나오는 식이었습니다.
 
제가 선정한 검색어 100개는 모두 그런 과정을 거쳐서 나온 것들입니다.
 
거기다가 100개의 검색어를 설정하기 위해서 그보다 몇배 이상 되는 검색어를 사실 입력했었답니다.
 
그 이유는 워낙에 교묘하게 욕설을 쓰는 경우도 많고, 띄어쓰기나 기호 하나에도 결과물이 달라지기 때문입니다.
 
중복되는 내용은 합치고, 검색된 내용들 중에서도 일베와 관계 없는 내용들은 일일이 보면서 삭제했습니다.
 
얘를 들어서 '새끼' 라는 단어에서 '새끼 손가락' 과 관계 있거나, '자기 새끼를 사랑한다'는 등의 표현은 일베와는 관계가 없는 것이기 때문에 삭제를 했습니다.
 
6.
제가 검색했던 내용 중에 가장 스스로 흥미롭게 느꼈던 부분이 있습니다.
 
그것은 바로 '전두환'에 대한 검색어에 대한 결과였습니다.
 
공교롭게도 결과물이 29개가 나왔더군요.
 
그분의 전 재산인 29만원이 생각났었답니다. ㅎㅎ ^^
 
7.
욕설과 관련 되는 부분을 정리하면서 참 많은 생각이 들었답니다.
 
저는 어린 자녀들을 키우고 있는 부모의 입장이기에 욕설 만큼은 모두가 자제해야한다고 생각합니다.
 
만약 저의 아이들이 나중에 커서 이런 욕설을 한다고 생각하면 참 아찔하겠다는 생각을 많이 했습니다.
 
욕을 한다고 해서 자신의 주장이 더욱 설득력을 얻는 것은 아니라고 생각합니다.
 
누군가로부터 공감을 얻고 설득하고 자신의 편을 만들기 위한 가장 좋은 방법은 진심과 열정이라고 생각합니다.
 
그리고 이 부분은 비단 일베 뿐만 아니라 모든 인터넷 커뮤니티가 함께 노력해 나가야 할 부분이 아닌가 생각했습니다.
 
지난 주에 촛불집회를 갔을 때 젊은 여대생이 혼잣말 처럼 투덜거리던 말이 생각이 나더군요.
 
"국정원 대선개입 집회 하는 것은 좋은데 왜 이렇게 욕들을 많이 하지? 욕 하는 사람들은 집회에 안나왔으면 좋겠다!"
 
온라인이든 오프라인이든 욕설은 정말 자제했으면 좋겠습니다.
 
제가 이렇게 스스로 고생을 사서 하는 이유도 사실 제 자신을 위해서라기 보다는 제 아이들이 살아갈 세상을 위해서랍니다.
 
우리 아이들에게 더 좋은 세상을 남겨주기 위해서는 우리 기성세대가 먼저 모범적인 언행을 실천하는 것이 중요하다는 생각을 해봤습니다.
 
8.
저는 국정원 트위터에 남아있는 모든 일베의 흔적을 찾아낸 것은 절대 아닙니다.
 
사실 파면 팔수록 새로운 검색어가 계속 튀어나온 답니다.
 
감춰져 있는 진실이 저의 글을 계기로 조금이나마 빛을 볼수 있으면 하는 바램입니다.
 
9.
눈이 막 감기네요...
 
사실 요 며칠동안 작업에 몰입하느라 잠을 별로 이루지 못했습니다.
 
그런데 사실 그렇게까지 피곤함을 느끼지는 않고 있습니다.
 
그 이유는.... 정의로운 일을 하고 있다는 행복감 때문인 것 같습니다.
 
얼마전 표창원 교수님의 강의를 통해서 다음과 같은 내용을 접한 적이 있습니다.
 
"우리 뇌에서는 행복을 느끼게하는 '도파민' 이라는 호르몬이 있습니다. 그런데 이 호르몬은 정의로운 일을 할때 엄청난 양이 쏟아져 나온다고 합니다. 행복해지고 싶으십니까? 그렇다면 정의로운 일을 실천하십시오!"
 
교수님의 말씀이 어떤 뜻인지 저는 이제 알것 같습니다.
 
10.
요즘 너무나도 와닿는 명언 하나 소개하며 숨가빴던 하루를 마감하려 합니다.
 
"Courage is doing what you're afraid to do.
There can be no courage unless you're scared."
 
"용기란 자신이 두려워하는 것을 하는 것이다. 즉 두려움이 없으면 용기도 없다."
 
- 에디 리켄배커(Eddie Rickenbacker)
용기.....
 
두려움 없는 용기는 정말 없는 것 같습니다.....
꼬릿말 보기
전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호