게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
그루터기추억의 로지스틱 분석은 왜 틀렸는가?
게시물ID : humorbest_595845짧은주소 복사하기
작성자 : 소야곡
추천 : 114
조회수 : 10353회
댓글수 : 12개
베스트 등록시간 : 2012/12/28 00:10:43
원본글 작성시간 : 2012/12/27 23:39:38

(1) 정상적인 로지스틱 분석을 통한 결과(선형 모형을 가정한 로지스틱 회귀의 추정치와 실제치의 비교)



(2) 그루터기추억의 로지스틱분석 방법을 이용해 추정한 값과 실제 값의 비교(Actual vs Dummy Fitted)


(3) 실제 작업 과정



안녕하세요.


짧게 제 소개를 하자면 경제학/응용통계학을 전공하고 있는 학부 4학년을 마친 대학생입니다.



로지스틱 모형에 대한 이야기들이 많았는데요.


결론부터 말하면 틀린 겁니다.



(1)의 그래프와 (3)의 표의 Fitted가 실제 정상적인 과정을 통해 회귀한 로지스틱 회귀의 값입니다.


근데 (3)의 Fitted를 이용하면 실제 수치와 동일하게 결과를 낼 수 있는데요.


(3)의 Fitted를 p(t)로 적용하여 집어넣으면 실제 결과치와 같게 됩니다.


즉 회귀분석한 결과를 다시 데이터에 집어 넣으면 됩니다.



그 결과치는 Actual-Dummy Fitted의 결과에서 보셨듯이..완벽하게 일치합니다.


즉, 이 결과는 실수였던 혹은 고의였던 어찌됐든 간에, 추정한 결과를 이용해 다시 회귀한 모형이며


어떤 의미도 없습니다.



실수였다고하면 그 신중하지 못함을 문제삼아야 할 것이고


고의였다면 통계학으로 사기친거죠.


통계전공자로서 통계로 사기치는 행위는 절대 용납해서는 안되고 용서해서도 안된다고 늘 배웠습니다. 그런 사례가 아니길 바랍니다.



통계학 전공자로서 가장 마음에 와닿는 말 중 하나가


"거짓말, 새빨간 거짓말, 통계"라는 말입니다.


통계는 객관성으로 포장되어 있지만, 무지몽매한 사람에게 그것을 들이대면 거짓을 옹호하는 수단이 될 수 있습니다.


혹은 사람들을 혼란스럽게 하고 객관성이란 포장으로, 혹은 과학이라는 포장으로 사람들이 믿고 싶은 것을 믿게 하는 마력이 있지요.


다들 많이 힘드실 것으로 생각합니다만, 그리고 현실이 별로 믿기시지 않겠지만


마음을 고쳐잡고, 남은 시간들도 잘 버텨내고 희망을 잃지 않으셨으면 좋겠습니다.



예전처럼 쓸데 없이 진지한 선비들이 넘처나는 오유가 되었으면 좋겠습니다.


이상 지나가는 선비가 글을 올립니다.

꼬릿말 보기
전체 추천리스트 보기
2012-12-28 00:17:04추천 0
그리고 저 그래프를 미분해서 나오는 최고점에서 당선 확실이 떴다고 하는부분은 어떻게 해석해야하는지 머리만 아파지는군요 아무나 하는게 아니었어...
댓글 0개 ▲
2012-12-28 00:13:59추천 0
아하 결론적으로는 논리오류라는 것이지요?
원글의 답글을 몇개 더 보니 역방향으로 갔다가 정방향으로 넣으면 당연히 같은 값이 나올거라는 말이 있군요
그럼 소야곡님 어떠한 그래프가 주어져도 다 대입이 가능한건가요?
댓글 0개 ▲
2012-12-28 00:11:23추천 0
그루터기추억이란 사람이 알면서 장난질친거라는 생각이 강하게 드네요.
로지스틱 회귀분석을 통해서 로지스틱 함수의 형태를 띄는 모든 데이터는 정확히 일치하는 식을 만들 수 있다는 얘기죠?
댓글 0개 ▲
2012-12-28 00:11:23추천 0
어떤 질문이 나와도 다 답해드릴께요..용어가 어렵거나 의심가는 부분이 있으신 분은 댓글로 물어봐주세요
댓글 0개 ▲
2012-12-27 23:41:20추천 0
개인적으로 누적투표율로 분탕질 하는분들이 무슨 생각을 하시는건지는 이해가 안가네요
댓글 0개 ▲
2012-12-28 00:02:39추천 0
일단 Actual-Dummy Fitted 등등의 전문적인 용어가 무엇을 뜻하는지부터 설명좀.... 이글도 이해를 좀 했으면 좋겠네요
댓글 0개 ▲
2012-12-28 00:05:15추천 1
이거지

실측값으로 로지스틱 회귀분석을 돌려야지
단순히 그루터기의 예측값에서 역산으로 패러미털 구하는게 오류
댓글 0개 ▲
2012-12-28 00:05:19추천 0
Actual : 실제 데이터
Fitted : 추정치
Dummy Fitted : 실제 데이터에 끼워맞추기 위해서 만든 데이터를 이용한 추정치
댓글 0개 ▲
2012-12-28 00:06:36추천 0
간략하게 설명하자면 알고리즘은 다음과 같습니다.
1. 실제 데이터를 이용해서 로지스틱 회귀 분석
2. 1에서 구한 값을 이용해서 또 로지스틱 회귀 분석
3. 이 과정을 거쳐서 로지스틱 회귀 분석을 하면 실제 데이터와 완벽하게 일치하는 데이터가 나오게 되어 있음
댓글 0개 ▲
2012-12-28 00:07:31추천 0
즉, 그루터기추억님의 추정은 실제 데이터와 완벽하게 일치하는 데이터를 나오게 하기 위한 알고리즘을 썼을 뿐입니다. 정말 간단하게 설명하면
수식으로 확인했고 실제 엑셀로 확인했고..
댓글 0개 ▲
2012-12-28 00:20:35추천 0
@민영화노예
논리 오류로 따지면 순환논증으로 인한 오류입니다.
당선 유력의 알고리즘은 알지 못하지만, 통계적으로 어떤 구간에 이르면, 예를 들어 99.9% 신뢰도로 당선 될 것이라 예측되면 당선 유력
확정은 말그대로 앞으로 표가 가장 불리하게 나와도 역전이 안될 때 당선 확정이 되는 것이지요.
댓글 0개 ▲
2012-12-28 00:42:47추천 0
잘 설명해주셨네요.. 감사합니다.
댓글 0개 ▲
새로운 댓글이 없습니다.
새로운 댓글 확인하기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호