게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
상관계수 0.45가 유의미한 상관관계? 왜 x 축은 박근혜 지지율?
게시물ID : science_63537짧은주소 복사하기
작성자 : Schwarz
추천 : 0
조회수 : 915회
댓글수 : 9개
등록시간 : 2017/04/30 16:47:02
SBS 에서 보도한 더 플랜 반박 보도입니다.

http://news.sbs.co.kr/news/endPage.do?news_id=N1004172251

결론이 이렇더군요.

'분석 결과, 선거구별 박 후보의 득표율과 K 값은 양적 상관관계가 있고, 상관계수는 0.45로 어느정도 상관관계가 있음을 확인하였습니다. 결론적으로 박 후보의 득표율이 높은 지역일수록 K값이 높다고 할 수 있습니다.'

최소한 자연과학계에서는 상관계수가 0.9 미만이면 가설 기각 수준이며, 사회과학계에서도 0.5는 넘어야 한다고 알고 있습니다. 이러한 정도의 상관관계로 더 플랜의 주장이 반박되었다고 보기는 어렵습니다. 

그리고 또 한가지 의문은 이것입니다. 왜 상관도의 x 축이 박근혜 득표율인가요? 이렇게 데이타를 나열하면 (0.45 상관관계가 유의미하다고 가정하더라도) 그래프가 나타내는 상관관계는 '박근혜 지지율이 높은 지역일수록 k값이 높다' 일 뿐입니다. 더울 올바른 데이타 나열은 x축을 노년 인구 비율로 잡는 것입니다. 검증하고자 하는 가설은 '노년층의 기표실수로 인해 미분류가 많이 발생하고, 노년층의 투표 성향에 따라 미분류에 박근혜 지지표 비율이 높아진다'입니다. 그렇다면 독립변인은 노년층의 비율이 되어야지, 박근혜 지지율이 되어서는 안됩니다. 노년층의 비율이 높다면 박근혜 지지율이 높아진다는 것은 하나의 상관관계를 가진 분포일 뿐이지, 일대일 대응이 이루어지는 선형함수가 아니기 때문입니다. 따라서 x(박근혜 지지율) 대 y (노년층 비율) 이라는 약한상관관계 + y (노년층 비율) 대 z (k값) 이라는 약한상관관계라는 이중의 관계의 합이 되므로 결과값에 대한 신뢰도는 떨어지게 됩니다.
반면, 파파이스 팀에서는 노년층 인구 비율 대비 상관 관계를 명확하게 보여주었으며, 그 결과는 거의 상관관계가 없다는 것이었습니다. 이 결과는 보다 직접적이며 따라서 더욱 높은 신빙성을 가질 수 있는 상관분포입니다. 

결론적으로, 저는 SBS 의 분석 결과는 더플랜의 가설을 충분한 신뢰도로 반박하고 있지 못하다는 것입니다.


전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호