게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
[문장수집-119] <벌거벗은 통계학>
게시물ID : readers_23370짧은주소 복사하기
작성자 : 문장수집가
추천 : 4
조회수 : 561회
댓글수 : 0개
등록시간 : 2015/12/28 19:08:47
L.jpg

1) 나는 숫자를 위한 숫자는 좋아하지 않는다. (5)


2) 연구로 사람 잡지 말자 (363)


3) 판단력이 수학보다 중요하다. (93)


4) 나라가 아닌 사람이 분석 단위여야 한다. (88)


5) 일어날 것 같지 않은 일들은 늘 일어난다. (182)


6) 많은 현상이 단 하나의 통계로 완벽하게 설명될 수는 없다. (67)


7) 통계가 하나의 정확한’ 방법을 제공하는 경우는 거의 없다. (22)


8) 계산을 올바로 했다면 그 다음에는 올바른 해답을 찾아야 한다. (197)


9) 통계의 가장 큰 역할은 시간에 따른 수치의 변화를 기술하는 것이다. (99)


10) 통계적 추론은 무엇이 가능성 있는 답이고 무엇이 그렇지 않은 답인지를 말해준다. (256)


11) 현명한 아이디어만 있으면 중요한 사회적 의의를 갖는 어려운 문제에 대한 답을 찾을 수 있다. (389)


12) 우리가 무엇을 계산하고 있으며 왜 그 계산을 하고 있는지에 대한 생각을 멈추지 말아야 한다. (197)


13) 통계적 부정행위는 수학 기술이 부족하기 때문이 아니다. 오히려 복잡한 계산이 사악한 동기를 숨길 수 있다. (113)


14) 통계적 추론은 입증하는 데 사용되는 것이 아니라, 가설의 상대적인 가능성을 따져 가설을 채택하거나 기각하는 데 사용된다. (258)


15) 사용된 데이터가 부실하거나 통계적 기술을 잘못 사용할 경우 오해를 불러일으키고 더 나아가 잠재적으로 위험한 결론을 도출할 수 있다. (13)


16) 통계학의 주요 기능 중 하나는 정보를 다 갖고 있지 못한 상태에서 현재 가진 데이터를 사용해 큰 물음에 대해 좀 더 잘 추측하는 것이다(29)


17) 통계적 추론은 데이터가 우리에게 단서를 제공하는 과정이며 이를 통해 우리는 의미 있는 결론을 도출할 수 있다

     통계학에서 중요한 것은 대량의 정밀한 수학 계산이 아니라 주요 사회 현상에 대한 통찰을 얻는 데 있다. (257)


18) 통계적 추론의 힘은 입증이 아니라 어떤 패턴이나 결과를 관찰한 뒤 확률을 이용하여 가장 그럴듯한 원인을 찾는 데 있다(255)


19) 물론 가장 그럴듯한 설명이 언제나 옳은 것은 아니다. 매우 드문 일도 일어나곤 하기 때문이다. (255)


20) 모든 지수(index)의 장점은 복잡한 정보를 하나의 숫자로 통합하는 데 있다

     안타깝게도 모든 지수의 단점 역시 수많은 복잡한 정보를 통합해 하나의 숫자로 나타낸다는 데 있다

     지수를 만들기 위해 대충 꿰맞춘 여러 기술 통계와. 통계의 구성 요소 각각에 주어진 가중치에 모든 지수는 굉장히 민감하게 반응한다

     결과적으로 지수는 불완전하지만 유용한 도구일 수 있고, 완벽한 속임수가 될 수도 있다. 

     결국 중요한 질문은 다수의 지표를 하나의 숫자로 줄이는 데에서 비롯되는 단순함과 편리함이 

     그 과정에서 어쩔 수 없이 일어나는 부정확성보다 더 가치가 있는가이다. (67~69, 110)


21) 상관관계와 인과관계의 구분은 통계 결과를 올바로 해석하기 위해 매우 중요하다. (270)


22) 두 변수가 상관관계에 있다고 해서 한 변수에서 일어난 변화가 반드시 다른 변수를 변화시킨다는 뜻은 아니다. (125)


23) 두 사건이 통계적으로 독립적이란 말은 한 사건의 결과가 다른 사건의 결과에 아무런 영향을 끼치지 못한다는 의미다. (187)


24) 상관관계가 가진 강점은 두 변수의 연관성을 상관계수라는 단 하나의 기술 통계로 압축해서 표현할 수 있다는 사실이다. (120)


25) 통계적 분석을 이용하여 두 변수 사이의 강한 연관성을 도출할 수 있지만, 연관성이 존재하는 이유를 항상 설명할 수 있는 것은 아니다. (38)

 


26) 역설적으로 데이터가 많을수록 명료함은 떨어진다. 그래서 단순화가 필요하다. (48)


27) 모집단에 속한 어떤 부류를 구조적으로 배제하는 의견 모집 방법은 편향되기 쉽다. (306)


28) 표본이 모집단을 잘 대표해야 통계학이 보유한 많은 강력한 도구를 사용할 수 있다. (205)


29) 아무리 화려한 분석으로 무장하더라도 데이터에 근본적으로 결함이 있다면 소용이 없다. (203)


30) 잘못된 설문조사 결과는 대부분 편향된 표본이나 잘못된 질문에 의해또는 두 가지 모두에 의해 나온다. (305)


31) 설문조사 결과는 질문을 묻는 방식에 매우 민감할 수 있다질문의 문장 표현이나 단어 선택은 매우 중요하다. (309)


32) 제대로 추출한 적당한 크기의 표본에서 얻은 결과는 전체 모집단으로부터 얻어내려는 것만큼이나 정확할 수 있다. (204)


33) 여론조사의 타당성을 보여주는 한 가지 척도는 응답률이다응답률이 낮다면 표본추출 편향(sampling bias)을 의심해볼 만하다. (308)


34) 모집단에 속하는 구성원 모두가 표본으로 추출될 확률이 동일하지 않다면 그 표본을 사용한 결과로 얻은 결론에도 문제가 있을 것이다. (213)



35) 출판 편향(publication bias)

    긍정적인 연구 결과는 부정적인 연구 결과보다 출판될 가능성이 높고, 그 결과 우리가 접하는 결과물이 왜곡될 수 있다

    무언가가 암을 예방하지 않는다는 사실은 딱히 흥미를 끄는 결과가 아니다

    부정적인 연구 결과는 의학은 물론 다른 분야에서도 그리 매력적이지 않다

    이 때문에 어떤 연구 결과는 보게 하고 어떤 연구 결과는 보지 못하게 만듦으로써 왜곡을 불러일으킨다. (217)

 


36) 회귀분석의 핵심은 두 변수 사이의 관계에 가장 근접한선형 관계를 찾아내는 것이다. (328)


37) 올바른 회귀방정식을 세우는 과정(변수 설정, 데이터 추출)이 통계적 계산 과정보다 더 중요하다. (381)


38) 회귀분석은 다른 변인을 통제한 상태에서 우리가 알고자 하는 어떤 변수와 결과 사이의 연관관계를 수치로 나타낼 수 있게 해준다. (323)


39) 회귀방정식에 서로 관련성이 높은 두 개 이상의 설명변수가 함께 들어 있다면 

     회귀분석을 해도 두 변수 각각과 설명하고자 하는 현상 간의 실제 상관관계를 알아내지 못할 수 있다. (374)


40) 설명하려는 현상으로부터 영향 받을 가능성이 있는 설명변수를 사용해선 안 된다

     회귀분석을 할 때는 종속변수는 설명변수에 영향을 미치지 않는다는 것을 확신할 만한 근거가 있어야 한다. (370, 371)


41) 가장 좋은 연구자는 회귀방정식에 반드시 포함되어야 하는 변수가 무엇인지, 어떤 변수가 누락되었는지

     최종 결과는 어떻게 해석될 수 있고 또 어떻게 해석되어야만 하는지 논리적으로 사고할 수 있는 사람이다. (382)


42) 잘못 다루는 사람 손에 들어가면 회귀분석은 완전히 틀렸거나 오해를 살 만한 결과를 내준다

     회귀분석에 능숙한 사람조차도 잘못된 방향을 향해 돌진할 수 있다

     영악한 사람들이 나쁜 목적을 가지고 방법론적 허점을 악용하는 경우가 있기 때문이다. (365)


43) 모든 회귀분석에는 이론적 기반이 있어야 한다. 회귀방정식에 그 설명변수를 넣은 근거는 무엇인가? (382)


44) 회귀분석에서 정말 어려운 절차는 분석할 때 필수적으로 고려해야 할 변수가 무엇인지 정하는 것과

     어떻게 하면 이런 변수를 가장 잘 정할 수 있는지를 알아내는 것이다

     회귀분석은 사용하기는 쉽지만 제대로 사용하기는 어렵고 잘못 사용하면 위험해질 수도 있다. (324~325)


45) 회귀분석을 사용하면 우리가 관심을 가지고 있는 현상에 다른 여러 요소로부터 받은 영향이 섞여 있을 때 복잡하게 얽힌 관계를 풀 수 있다

     회귀방정식에 변수가 여러 개 있을 때 회귀분석을 사용하면 

     다른 설명변수를 상수로 두고 다른 요소들을 통제한 상태에서 각 설명변수와 종속변수 간 선형 관계를 계산해낼 수 있다. (341)


46) 세상에 대한 지식의 진보를 이끈 훌륭한 사회과학자나 연구 팀은 대부분 통제실험을 할 수 있도록 독창적인 방법을 고안한 사람들이다

     모든 사회과학적 처리나 개입의 효과를 검증하는 데는 효과를 비교할 기준이 필요하다

     명석한 연구자는 어떤 처리를 했을 때의 결과를 그 처리를 하지 않았을 때 일어났을 결과와 비교할 수 있는 방법을 찾아낸다. (385)


47) 어떤 경우든 한 가지 처리가 주는 영향만을 분리해내는 것이 핵심이다

     할 수만 있다면 처리한 집단과 처리는 하지 않았지만 다른 점은 모두 똑같은 집단을 비교하여 그 처리가 미친 영향을 알아내는 것이 가장 좋다.

     (387)


48) 인과관계를 관찰하는 가장 좋은 방법 중 하나는 일단 해보고 나서 무슨 일이 일어나는지 보는 것이다

     어떤 일이 벌어진 후에 다른 일이 일어났다 해서 두 사건 사이에 인과관계가 있는 것이 아니라는 점은 전후 관계분석으로 극복해야 할 문제다.

     (399, 400)

출처 찰스 윌런 지음, 김명철 옮김, <벌거벗은 통계학>, 책읽는수요일, 2013
꼬릿말 보기
전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호