19대 총선일까지 앞으로 한 달 남은 시점에서 무수히 쏟아져 나올 여론조사에 대해 여론조사의 속성을 잘들 숙지하시고 여론조사 결과를 잘 이해하고 활용하시길 바라는 마음에 올려봅니다. 전문은 아래의 링크에 가면 있고
http://www.cbs.co.kr/radio/pgm/board.asp?anum=4420&bcd=007C055E&pgm=1383&pn=read 정관용의 시사자키에 출연한 이택수 리얼미터 대표 연구원의 인터뷰 내용 중 발췌했습니다. ▶정관용> 조사기관마다 다 다른 숫자가 나오는 건 왜 그런 거예요? ▷이택수> 휴대전화 조사를 최근에는 반영하는 조사기관도 있고요, 예전에 전화번호부에 등재된 가구만 사용하는 전화조사 방법이 있었고, 최근에는 RDD 방식이라고 해서 전화번호부 명부에 등재되어 있지 않은 가구까지 포함된, 그래서 무작위로 번호 생성해서 사용하는 방식인데, RDD 방법을 쓰는 조사의 경우에는 또 조사결과가 다르게 나타날 수가 있고요. 여러 가지 변수가 있습니다. ▶정관용> 전화번호부라는 게 마지막 만들어진 게 몇 년도입니까? ▷이택수> 제가 알기로는 2008년도쯤에 공개가 된 게 마지막으로 알고 있고요.
▶정관용> 2008년? 그러면 그 후에 새로 집 전화를 만든 사람은 전화번호부에 아예 없는 거네요? ▷이택수> 그렇습니다. ▶정관용> 전화번호부에 들어있는 가구수가 전체 가구의 몇 퍼센트 정도라고 생각하세요? ▷이택수> 대략 한 40 내지 50% 정도. ▶정관용> 쉽게 말하면 전화번호부만 가지고 한다면 절반의 표본만 가지고 한단 말이군요? ▷이택수> 그렇지요. 절반이 사실 안 되는 거지요. ▶정관용> 절반이 안 되는 표본. 그 전화번호부에 들어있는 표본에 특징이 있나요? ▷이택수> 비교해보면 전화번호부에 등재되어 있는 가구가 좀 보수적인 성향을, 그래서 정당지지도 같은 경우는 한나라당 지지율이 좀 높은 편이고요. 반대로 비등재가구만 또 따로 본다면, 거기에는 또 민주당이나 다른 야권 지지율이 높게 나타납니다.
▶정관용> 그러면 RDD 방식으로 조사했다고 하더라도 그 중에 전화번호부에 들어있는 게 몇 퍼센트입니다, 이것까지 밝혀야 되는 거군요? ▷이택수> 예 ▶정관용> 그나마 정확한 건 RDD 방식으로 했는데 전화번호부 등재가구가 한 40에서 50 사이이다, 그러면 상당히 유사한 거네요? ▷이택수> 예, 맞습니다. ▶정관용> 그런데 그 중에서도 또 휴대전화만 쓰는 사람은 또 빠져있는 거잖아요? ▷이택수> 예, 그렇습니다. ▶정관용> 그런데 저 서울 살아요, 라고 거짓말하면 어떻게 해요? ▷이택수> 뭐 거짓말한다고 전제를 하면 조사를 저희가 할 수가 없습니다. ▶정관용> 거짓말하는 건 가려낼 수가 없는 거잖아요? ▷이택수> 예, 그렇습니다. ▶정관용> 대표가 보시기에는 그나마 좀 표본을 정확하게 하려면 휴대전화 몇 퍼센트, 그 다음에 RDD 중에서 전화번호 등재 몇 퍼센트, 어떻게 하는 게 가장 정확합니까? ▷이택수> 사실 센서스 조사에는 포함되지 않기 때문에 대략 추정만 가능한데요. 말씀드린 대로 휴대전화의 경우에는 휴대전화만 사용하는 가구에 대해서는 사실 정확하게 집계가 안 되어 있기 때문에... ▶정관용> 모르는군요. ▷이택수> 대략 추정컨대 지금 집 전화 쓰는 가구가 한 80%, 그 다음에 집 전화를 안 쓰는 가구가 20% 정도 된다고 추정을 하고 있어요. 그래서 이상적인 모집단을 반영시키려면 휴대전화를 한 20% 정도는 반영을 하고요, 나머지 집 전화의 경우에는 또 RDD 방식으로 비등재 가구도 한 50~60% 포함을 시키고요. ▶정관용> 그렇군요. 그러니까 20, 그 다음에 한 35%, 나머지는 한 45%, 이런 정도로 들어가면? ▷이택수> 예, 그렇습니다. ▶정관용> 대표는 언론보도, 신문이나 이런 데에 여론조사 결과가 나오면 뭐부터 보세요? 우리 청취자분들한테 뭐부터 어떻게 봐라, 좀 알려주세요. ▷이택수> 조사결과를 가장 먼저 보고요. 그 다음에는 조사 시기, 그 다음에 방법, 그 다음에 조사규모 이 세 가지를 일단 먼저 보는데요, 왜냐하면 조사기관별로 지지율 격차가 있을 경우에 여론의 향배가 실제로 바뀌어서 그런 건지, 아니면 조사기관별로 방법이나 시기, 규모가 달라서 그랬는지를 좀 파악해야 되기 때문인데요, 가령 어제 발표된 여론조사 결과에서 나경원 후보의 지지율로만 봤을 때 한겨레신문에서는 51.3%, 매일경제에서는 37.1%로 두 조사에서 동일한 나경원 후보 지지율임에도 불구하고 14% 포인트 가량 격차가 있는데요, 이게 말씀드린 대로 방법이나 또 조사 시기, 규모가 달라서 그렇기 때문에 이런 부분을 좀 꼼꼼하게 봐야 될 것 같습니다.
▶정관용> 그러니까요. 오차범위 이내이면 누가 앞섰다, 뒤졌다가 아니잖아요? ▷이택수> 그렇지요. ▶정관용> ±3.7%라고 하면 7.4% 차이가 나도 그거는 오차범위 내군요? ▷이택수> 그렇지요, 맞습니다. ▶정관용> 그리고 RDD 방식으로 하더라도 야권 쪽 일각에서는 야권 쪽에 숨은 몇 퍼센트가 있다, 이런 말을 하던데 그건 무슨 이야기예요? ▷이택수> 지난 6.2지방선거 때 사실 처음 격차가 크게 예측이 벗어났는데요, 6.2지방선거 전까지는 전화번호부 등재가구만 해도 별 차이가 없었습니다, 그 투표 결과와. 그런데 그때부터 좀 격차가 많이 벌어졌기 때문에 RDD 방식을 쓰고 있는 건데, 그 RDD 방식으로 해도 아까 말씀드린 대로 집 전화 안 쓰는... ▶정관용> 휴대전화만 쓰는? ▷이택수> 예, 휴대전화만 쓰는 가구가 있을 수가 있고, 또 하나는 두 가지 다 저희가 커버한다고 해도 야권 지지층이 예전에 미네르바 효과라고 했지요. 자기가 야권 후보를 지지한다는 것을 밝히기를 꺼려하는 분들이 분명히 있습니다. ▶정관용> 아, 말을 안 한다? ▷이택수> 이분들은 원천적으로 조사에 포함이 될 수가 없기 때문에 저희가 커버리지 에러(coverage error)라고 그러거든요. 그래서 그 부분 때문에 좀 오차가 있을 수가 있다는 거지요.