게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
상관계수 0.45가 유의미한 상관관계? 왜 x 축은 박근혜 지지율?
게시물ID : science_63537짧은주소 복사하기
작성자 : Schwarz
추천 : 0
조회수 : 962회
댓글수 : 9개
등록시간 : 2017/04/30 16:47:02
SBS 에서 보도한 더 플랜 반박 보도입니다.

http://news.sbs.co.kr/news/endPage.do?news_id=N1004172251

결론이 이렇더군요.

'분석 결과, 선거구별 박 후보의 득표율과 K 값은 양적 상관관계가 있고, 상관계수는 0.45로 어느정도 상관관계가 있음을 확인하였습니다. 결론적으로 박 후보의 득표율이 높은 지역일수록 K값이 높다고 할 수 있습니다.'

최소한 자연과학계에서는 상관계수가 0.9 미만이면 가설 기각 수준이며, 사회과학계에서도 0.5는 넘어야 한다고 알고 있습니다. 이러한 정도의 상관관계로 더 플랜의 주장이 반박되었다고 보기는 어렵습니다. 

그리고 또 한가지 의문은 이것입니다. 왜 상관도의 x 축이 박근혜 득표율인가요? 이렇게 데이타를 나열하면 (0.45 상관관계가 유의미하다고 가정하더라도) 그래프가 나타내는 상관관계는 '박근혜 지지율이 높은 지역일수록 k값이 높다' 일 뿐입니다. 더울 올바른 데이타 나열은 x축을 노년 인구 비율로 잡는 것입니다. 검증하고자 하는 가설은 '노년층의 기표실수로 인해 미분류가 많이 발생하고, 노년층의 투표 성향에 따라 미분류에 박근혜 지지표 비율이 높아진다'입니다. 그렇다면 독립변인은 노년층의 비율이 되어야지, 박근혜 지지율이 되어서는 안됩니다. 노년층의 비율이 높다면 박근혜 지지율이 높아진다는 것은 하나의 상관관계를 가진 분포일 뿐이지, 일대일 대응이 이루어지는 선형함수가 아니기 때문입니다. 따라서 x(박근혜 지지율) 대 y (노년층 비율) 이라는 약한상관관계 + y (노년층 비율) 대 z (k값) 이라는 약한상관관계라는 이중의 관계의 합이 되므로 결과값에 대한 신뢰도는 떨어지게 됩니다.
반면, 파파이스 팀에서는 노년층 인구 비율 대비 상관 관계를 명확하게 보여주었으며, 그 결과는 거의 상관관계가 없다는 것이었습니다. 이 결과는 보다 직접적이며 따라서 더욱 높은 신빙성을 가질 수 있는 상관분포입니다. 

결론적으로, 저는 SBS 의 분석 결과는 더플랜의 가설을 충분한 신뢰도로 반박하고 있지 못하다는 것입니다.


전체 추천리스트 보기
2017-04-30 16:51:15추천 0
결론 부분 수정합니다.

결론적으로, 저는 SBS 의 분석 결과는 더플랜의 가설을 충분한 신뢰도로 반박하고 있지 못하다고 생각합니다.
댓글 6개 ▲
2017-04-30 17:01:47추천 0
결론이 그게 아닌데... 다시 한번 분석해보세요. 인풋과 아웃풋이 뭔가 바뀐 기분이 듭니다.
2017-04-30 17:09:07추천 0
무슨 말씀이신지... 노령인구 가설에서 독립변인은 노년층의 기표실수입니다. 이 가설의 핵심은 기표실수가 각각의 노인들에 대해 '통계적으로' 무작위성을 가진 상태에서 어떤 확률이 있다는 것으로 따라서 필연적으로 x 축은 이러한 노년층의 기표실수를 반영할 어떤 지표여야 하며 당연히 노년층의 인구비율이어야 합니다. 이것이 독립변인이어야 하며, 이것에 의한 결과, 즉 종속변인은 당연히 k 값이어야 하겠죠.
2017-04-30 17:19:54추천 1
여기도 이해못하신분 하나 추가
[본인삭제]너라면웃겠니
2017-05-02 00:34:52추천 0
[본인삭제]너라면웃겠니
2017-05-02 01:13:12추천 0
2017-05-02 01:40:13추천 0
미분류표(3.6%) = 미분류에 포함된 유효표(3.24%) + 미분류에 포함된 무효표(0.36%)

무효표는 미분류표에서 재검을 통해 무효로 확정된 표이고,
더 플랜이 의문을 갖는 것은 무효표와 유효표가 뒤섞여 있던 미분류표에서
재분류되어 유효가 된 재검 유효표의 박:문 비율입니다.

노령인구가 많은 지역에서 무효표(미분류 재검 후 확정된 무효표)가 많을 수 있겠지요.
아시다시피 미분류표 하나하나가 노령층의 것인지 아닌지 확인할 방법은 없습니다.
지역을 불문하고 박1.5:문1로 나오는 유효 미분류표는 대부분 노령층의 것일 것이다라고
어떤 과정을 통해 어떻게 가정할 수 있을까요?

더 플랜이 말하고자 하는 바는
재검 후 유효로 판정된 미분류 표의 박:문 비율이
대다수 지역(인구통계적 요인과 상관없이)에서 1.5:1로 수렴되고 있으며
이것이 지역별 노령인구의 다소(연령차에 따른 노령지역 등)와는 별반 연관성이 없다는 것입니다.

여기 뜻이 맞는 몇몇분들이나 SBS가 논점을 흐리면서
K=1.5라는 인위적 개입이 없다면 자연계에서 나오기 어려운 값에
물타기를 하는 것 같네요.

박후보의 득표율이 높을 수록 K값이 올라가는 것은
바보가 아닌 이상 굳이 검증을 하지 않더라도 짐작이 가능한 것이지요.
(대체로 미분류표에서 재검한 유효표가 박1.3~1.6:문1인데,
박의 득표율이 많은 지역에서는
미분류표에서 재검한 유효표가 박 1.5~1.7:문1이 되더라)
한마디로 SBS의 반박보도는 부실하게 느껴집니다.
[본인삭제]dacoon
2017-04-30 17:23:48추천 1
댓글 10개 ▲
2017-04-30 17:37:41추천 1
변인 얘기하는거 보니까 동의 안할거 같은데요? ㅋ
[본인삭제]dacoon
2017-04-30 17:42:35추천 1
[본인삭제]dacoon
2017-04-30 17:43:40추천 1
2017-05-01 03:32:23추천 0
변인 얘기하는 게 왜 문제가 될까요? 그리고 다큐 내용에 대한 논의가 아니라 노인 가설에 대한 논의입니다. 조작이라고 우길 근거가 없죠.
[본인삭제]dacoon
2017-05-01 08:05:26추천 0
[본인삭제]dacoon
2017-05-01 08:08:38추천 0
2017-05-01 08:41:58추천 0
무슨 말도 안되는 말씀이신지... R square 가 0.9 보다 작은 데이터는 적어도 자연과학에서는 채택하기 어려운 데이터입니다. 뇌피셜이라니요. 관련업계 종사자로서 어이가 없네요
[본인삭제]dacoon
2017-05-01 08:48:31추천 1
[본인삭제]dacoon
2017-05-01 08:50:46추천 1
[본인삭제]dacoon
2017-05-01 09:32:41추천 1
2017-05-02 00:40:11추천 0
해킹보안전문가, 김현승대표
18대대선개표상황표와개표방송모두조작되었다[20140404]

https://youtu.be/Uo0Qpghhur0
댓글 0개 ▲
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호