게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
더 플랜, 정규분포와 시간 역주행 현상에 관한 보충 설명.
게시물ID : science_63541짧은주소 복사하기
작성자 : 엘랑™
추천 : 10
조회수 : 895회
댓글수 : 9개
등록시간 : 2017/04/30 18:30:25
지켜보는게 재미있어서, 토론에는 개입 안하는 편인데요...

더 플랜의 K값에 대한 이론적 타당성과 부당성은 뭐 보시는대로.... 반면에 무작정 <정규분포>와 <시간역주행> 거론하시는 분들께 또 한말씀 드리자면...


1. 정규분포

정규분포는 이상적인(실험실적) 조건 하에서, 무작위로 표본을 추출하면 결국 중간값을 놓고 정규분포를 그리게 된다는 통계확률적 현상을 말하기도 합니다. 그래서 더 플랜에서는 그래프값이 한쪽으로 치우친, 비정규분포 형태인 것에 먼저 의심을 던졌고, 샘플이 충분했음을 말하고 있습니다. (샘플이 적으면 정규분포가 안나오기도 하니까요.)

그런데 과게, 일부 비판론자들과, 스브스에서는 표본 자체가 비정상적인 상황을 가정하지 않았으므로 오류가 있을 수 있다는 가능성을 알린거고요. (연령간 대결이라는 초미의 사태를 누가 예상이나 했겠습니까?) 지역별 성향차이는 미리 고려되긴 했지만, 이것도 역시 비슷한 과정을 거쳐서 K값이 비정상적(?)으로 보이는 비정규분포를 그리는데 일조 했습니다. 그나마 지역성향차이는 투표소 분류에 의해서 유추가 가능하지만, 연령은 비밀투표 원칙에 의해서 투표지만 보고는 투표인의 나이를 알 수 없습니다. (이게 핵심이죠!)

선관위는 지난 대선투표에서 노년층의 박근혜 지지율이 높을것이라고 말하는데, 이것도 사실 조금 모순입니다. 선관위는 여론조사를 하지 않거든요. 대신에 투표 결과만 확인합니다. 투표지에는 나이를 쓰지 않습니다. 선관위 스스로는 그런 성향을 알아낼 수 없지만, 대신 여론조사기관, 언론사의 조사 결과를 가지고 유추한 것 뿐입니다.
(선관위는 오로지 재검표만 하는게 스스로의 결백을 입증하는 방법입니다. 태생적 한계지요.)

그럼 누가 나이를 알 수 있느냐??? 바로 법률에 의해서 투표소 사전 출구조사가 가능한 기관들입니다. 지난 대선에서 아마 지상파 3사가 합동 출구조사 했을걸요?? 여기에 포함이 안되는 JTBC나 YTN 등은 거액의 비용을 들여서 따로 했을겁니다. 사전 출구조사는 투표하고 나오는 이들의 성별, 나이를 대충 알수 있죠. (직접 대면하니까!) 그리고 조사원이 그들에게 몇번 찍었나 물어보고, 샘플링 통계조사를 통해서 대략적인 결과를 알 수 있습니다.


2. 시간 역주행

심지어 사전 출구조사 결과가.... 실제 선관위 개표보다 훨씬 빠릅니다. 현장에서 데이터 수집하고 입력하면 즉시 전산처리 되니까요. 선관위는 투표함을 밀봉하고 운반하고, 준비된 개표장소에 물리적 운반 후에 준비절차 거쳐서 복잡한 개표과정을 거쳐야 하기 때문입니다. 

시간 역주행을 말하는데.... 사전 출구조사가 가장 빠른 결과유추 방법이기에, 언론사가 먼저 아는게 맞습니다. 기자들이 그러더라구요. 대충 정확하게 미리 알게 된다고... 다만 발표를 조금 늦출 뿐. 가끔 출구조사 결과와, 실제 개표결과가 뒤바뀌는 경우가 있는데 대선 같은 경우는 워낙 투표자가 많고 샘플링이 많아서 오차가 더 줄어들게 됩니다.



이런 기초적인 사항을 고려하면... 당시 대선 분위기가 지상파 3사는 정권에 협조적이라는 분위기가 팽배했기에 문재인씨를 찍은 젊은 층은 지상파의 사전 출구조사에 비협조적이었을 가능성이 높습니다. 그리고 그나마 jtbc나 ytn에는 협조적이었을 수 있고요. 그래서인지 지상파 3사와 일부 방송사의 출구조사 결과가 달랐던 것으로 알고 있습니다. 당시 대선은 적대적인 분위기에서 긴장감이 높았으니 그럴 수 있을지도 모릅니다. 하지만 지상파 3사 출구조사는 가장 규모가 컸을테고, 적중했습니다. 이걸 놓고 시간 역주행이 거론되는 듯 한데, 뭐 아쉬워도 시간을 되돌릴 수는 없으니 추론상 가능성이 높은 쪽에 가정을 둔다면, 현재로선 개표 부정으로 시간 역주행이 나온건 아니라고 보여집니다. (그럴 수도 있고요)

스브스는 이번에 <더 플랜>을 반박하는 뉴스와 기사를 내보내면서, 정말 중립적으로 행동하려고 노력하더군요. 위에도 말했듯, 방송사들은 당시 샘플 데이터에 연령대까지 가지고 있습니다. 즉, 더 플랜측이 보유하지 못한 추가 데이터가 있다는 뜻이죠. (더 플랜은 선관위 데이터로만 분석했죠??)


저는 더 플랜이 범한 논리적 오류는 이것이라고 봅니다.

"당시 샘플 데이터 자체가 하나의 집단이 아닌, 두개의 서로 다른 집단이 뒤엉킨 상황을 샘플링 했으므로 정규분포가 나올 수 없다." 입니다.

그러나 두 집단을 완벽하게 분리해서 다시 샘플링 하면 두 결과 역시 각각 정규분포에 수렴할 겁니다.

물과 기름을 뒤섞고 중심값을 찾는 투표에서, 단일 액체로 가정하고 정규분포 찾는게 실수였죠. 비중차이를 고려 못한겁니다. 아주 사소한 과학적 실수죠.
이런것은 노벨상 수상자들도 흔히 하는거라서... 뭐 그런걸로 과알못이라고 비난하긴 싫습니다. 대신에... 이미 정해놓은 목적을 위해 과정을 짜맞추는 식의 전개는 매우 불쾌하고 짜증납니다. 심지어 과게에서 더 플랜 반박할때도 그런게 조금 보이는데, 과게의 반박글을 어떻게든 재반박하려는 이들은 이미 종교적 경지에 이르렀다고 보여지기에 굳이 대화할 필요성도 못느끼고요.

기계적 중립이라 비난들 하지만, 그런게 없으면 세상은 예전에 난장판 되었을 겁니다.
전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호