전 문송한 사람이기 때문에 일단 통계적인 부분에 대해서는 무지함을 말씀드립니다.
그런데 더 플랜을 봤을 때에는 확실히 이상한 부분이 있다고 생각을 했었는데 그 근거를 밝히겠습니다.
1. 미분류 표가 3%로 지나치게 높다.
미분류로 분류되는 것들은, 도장 위치가 이상하다던가 여러개를 찍었다던가 아니면 확실하게 인식되지 않기 때문에 빠진 것일 텐데 실제로
전체 표의 3%가 미분류로 분류되는 것은 과도하다라는 것.
2. 미분류로 한번 분류 되었던 것들 중에서 살려낸 표들의 비율이 정상개표 된 표들의 통계에 비해서 박근혜 표의 비율이 높으며, 그 값은 K값을 칭한다.
그리고 그 k 값은 1.5라는 숫자로 표준분포? 그 코끼리가 보아뱀 삼킨 그림을 그린다. 라는 점
3. 그렇다면 미분류 표로 분류되는 것은 나이대가 높으신 분들이 제대로 못찍어서 그런거 아닐까? 라는 생각에 젊은층 비율이 높은 지역의 K 값들을 봤더니 거기서도 K 값은 여전히 높게 나타났다. 라는 점
여기에서 어떤 점이 과학적으로 잘못된 부분이 있는건가요?
진짜 몰라서 여쭤보는 겁니다. 여기에서 유일하게 밝혀지지 않은 알고리즘은 "기계가 미분류로 분류하는 알고리즘"인데, 그건 다른 요건이 동일하다면 (노령인구의 손떨림 등) 랜덤으로 발생한다고 보는 것이 맞지 않나요? 전수조사해서 총 표수가 몇백만이 넘기 때문에 충분한 샘플이 확보되었다고 생각하는데... 혹시 이 논리구조중에 어떤 부분의 개연성이 부족해서 그런건가요?
역으로 생각했을 때, 소위 말하는 기계가 인식 못하는 미분류표가 발생하는 확률이, 박근혜를 지지하는 사람의 표가 더 미분류로 많이 가게 된다는 것을 증명하지 못한다면 표본 수가 많으니 정상개표와 비율이 비슷하다고 생각해야 되는 것이 합리적인 것이 아닌가요?
가르침 부탁드립니다. 스스로 개표부정에 대해서 확신을 가지고 살고싶기 때문에 질문글 올립니다.