게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
[더플랜] k값과 노인가설. 호남을 빼면 어떻게 될까?
게시물ID : science_63464짧은주소 복사하기
작성자 : 치우율무차
추천 : 13
조회수 : 1234회
댓글수 : 63개
등록시간 : 2017/04/26 16:30:28



계산에 사용된 노령지수는 (지역노령지수)=(60대 이상 인구)/(전체인구) 입니다.


김어준 총수는 선관위의 노령설이 틀렸다면서 k-value와 지역별 노인인구의 상관관계가 없다는 자료를 내세웠습니다.
그러나 k-value의 의미에 대해서 잘 따져보면 지역별 k-value는 해당 지역의 노인인구의 성향을 따라가도록 되어 있습니다.
그러므로 전국적인 지역별 k-value는 노인인구 성향을 따라갈 뿐, 노인인구의 비율을 따라가진 않을 것이라고 생각됩니다.

여론조사와 출구조사를 기반으로 봤을 때, 호남에선 노령층도 평균보다는 더 문재인을 지지했습니다
하지만 문재인의 지지도가 박근혜를 넘어서진 못했기 때문에, k값은 1보다 작아지진 못합니다.
하지만 전국 평균인 1.5보다 작았어야 할 것입니다.

연령설이 맞다면 호남에서도 노령 인구가 많은 곳일수록, k값이 더 큰 영향을 받아 더욱 낮아져야 할 것입니다.
영남에서는 반대 경향이 나타나야겠죠.

그럼 그런 경향이 통계적으로 보여지는지 한번 알아봅시다.

https://docs.google.com/spreadsheets/d/17DgUuUW81pmOW2FvCvS8pskmujkz-cIumOAqhuC3BJM/pubhtml#

https://docs.google.com/spreadsheets/d/17DgUuUW81pmOW2FvCvS8pskmujkz-cIumOAqhuC3BJM/pub?output=ods


본문 분석에서 사용된 자료는 위 링크에서 찾으실 수 있습니다.


1. 비교를 위한 전국 데이터

전국 k.png
R-square 0.002
Adj R-square -0.002

그래프 y축에서 에서 0은 대략 k=1.5입니다.

정말 아무런 완전 아무런 상관관계가 없습니다! 지쟈스! 어떻게 이렇게 완벽할 수가 있죠!
이런 완벽에 가까운 숫자들은 해킹이 분명합니다! 거기다가 r2값이 0.00'2'라니! 세밀하게 콩까지 까는걸 보면
이번 해커는 스타크래프트 팬임을 알 수 있습니다! 스타리그 폐지에 앙심을 품고 선거를 망치려 하다니!
이는 좌시할 수 없습니다! 특검을 통해 범법자를 색출하고 조져야합니다!

... 그럴리가요.

이상하게 생각되리만치 깔끔한 숫자에 상관관계이긴 합니다.
하지만 하던 일은 마저 해야겠죠. 이 그래프는 지역별 성향에 따라 영향을 받았을까요?
노령설의 가정에 따라 지역별로 이 그래프가 어떻게 변화할 지 예상해 봅시다.



2. 호남을 뺀다.
 - 호남이 빠지면 저 가운데 보라색 선이 양의 상관관계를 나타낼 것이다. 왜냐하면 '노령지수가 높고 k값이 낮은 지역'이 호남에 포함되어 있기 때문이다. 이는 그래프에서 보자면 '오른쪽 아래'에 해당하는 부분으로 이 부분에서 파란 점들이 없어질 것이다.





호남없음k.png
R-square 0.101
Adj R-square 0.096

오오옷!
예상대로 양의 상관관계를 나타낸다!
그리고 오른쪽 아래 부분에 있던 파란 점들이 많이 줄어들었음을 알 수 있다!
!?!?!?!?

3. 쉴틈이 없다! 바로 영남을 빼보자
 - 고령이면서 k값이 특히 더 높은 부분-> 전국표에서 오른쪽 위 부분이 많이 빠지면서, 음의 상관관계를 나타낸다.
하지만 오른쪽 위에 애초에 점들이 많이 없다... 요놈들이 빠진다고 크게 그래프가 변할지..?
또한 TK와 PK가 같이 빠지게 되기 때문에, 영향을 크게 줄지 어떨지 예상이 잘 안간다.

영남없음k.png
R-square 0.017
Adj R-square 0.011

음... 파란점들이 k가 높은 지역과 왼쪽의 밀집지역에서 '전반적으로 많이'빠진다. 그러면서 약간의 음의 상관관계를 나타내게 되지만 그 경향은 강하지 않다. 영남의 k는 아무래도 일반적인 전국평균과 크게 다르지 않은 양상을 보이는 듯 하다.

영남은 생각보다 중요하지 않았다. TK/PK를 따로 살펴보면 재밌을거같다(하지만 귀찮아서 안했...).


호남만 따로 떼어놓고 보면 어떨까?
호남k.png
R-square 0.148
Adj R-square 0.127

이미 답이야 2번에서 나와있지만.
다른 지역에 비해서 음의 상관관계를 보여준다. 또한 최대 k값이 1.58로, 노령지수가 비교적 낮은 전주 완산구에서 나왔다. 노령인구가 많을 수록 k값이 낮아지는 현상이 발견된다! 이는 당연히 노령인구가 문에게 비교적 많이 투표하기 때문!
이를 통해 우리는 호남이 전반적으로 k가 전국보다 낮았음을 알 수 있다. 노령설이 예측하는 방식 그대로.





대충 얼렁뚱땅 만지작거리던 데이터를 정리하려니까 복잡하네여
여전히 뚝딱뚝딱 만들었다는 흔적이 매우 강력하게 남아있는 데이터지만
잘못된 데이터는 없을 것입니다.

하나하나 살펴보면 재미있는 사실을 더 발견할 수 있을 것이라 생각됩니다.
더 파보고 싶으신 분들을 위해 사용하던 데이터를 오픈했습니다.





그리고 이것도요.
라크쉬르.png

제목 없음.png
아이디 삭제빵. 반론 기다리고 있겠습니다.


전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호