Q. 대략 1만명당 1명의 꼴로 감염되는 바이러스가 있다. 한 사람이 이 바이러스 감염 검사를 받았을 때 양성이라고 판명되었다. 이 검사의 정확도는 99.9%인데, 이때 정말 이 사람이 감염되었을 확률은 얼마인가?
간단하게 생각할 경우, 검사의 정확도가 99.9%이므로 바이러스에 감염된 것이 거의 확실시하다고 생각할 것입니다. 그러나, 실제로 계산해 봅시다.
통계적 오류에는 1종 오류와 2종 오류라는 2가지 종류의 오류가 있습니다. 1종 오류란 거짓인데 참이라고 받아들이는 것, 즉 거짓 양성이라고 하며 2종 오류란 참인데 거짓이라고 받아들이는 것, 즉 거짓 음성이라고 하는 것이 있습니다. 통계에서 가설을 검증할 때에는 두 가지 오류를 고려하여 생각해야 합니다.
위의 문제를 풀어 봅시다. 천만명의 사람이 이 검사를 받는다고 가정하면, 천만명 중 1000명이 이 바이러스에 감염되었을 것입니다. 그러면, 감염 검사를 받았을 때 1,000명 중 99.9%인 999명은 양성이라고 나오고, 1명은 음성이라고 나올 것입니다(거짓 음성). 반대로, 999만 9000명은 감염되지 않은 사람인데 이 중 99.9%에 해당하는 989만 9001명은 올바르게 음성이라고 나올 것입니다. 그러나, 나머지 99,999명은 양성이라고 잘못 나올 것입니다(거짓 양성). 즉, 양성이라고 나온 사람 100,998명 중 실제 바이러스에 감염된 999명이 차지하는 비율은 대략 0.98%정도 밖에 되지 않습니다.
결론적으로, 감염 검사에서 알려주는 것은 0.01%였던 감염 확률을 0.98%까지밖에 올려주지 못하는 역할을 하는 것입니다. 또한, 아무리 정확한 검사더라도 사람 수가 많은 경우에는 거짓 음성이 나온 1명처럼 감염되었는데도 불구하고 감염되지 않았다는 결과가 나오게 되는 것입니다. 그러므로, 감염되었는지 여부를 여러 차례 검사하는 이유는 이러한 통계적 오차가 매우 크기 때문에 수 차례 검사를 하게 되는 것입니다.