UPDATE : 2022.8.15 월 14:08
상단여백
HOME 여론 아주책방
통계를 통한 조작에 넘어가지 않는 방법
  • 김동윤(소프트웨어) 교수
  • 승인 2016.03.24 20:01
  • 댓글 0

책이름: 새빨간 거짓말, 통계(How to lie with Statistics)

저자: 더렐 허프, 박영훈 옮김

가격: 10,000원

2015년 5월 빌 게이츠의 여름에 읽어야할 필독서 여섯 권 중 하나로 1954년에 발간된 이 책이 추천되면서 2004년 번역 출판된 “새빨간 거짓말, 통계”가 갑자기 유명한 책이 되었다. 필자는 1986년 물리학자 김정흠 교수에 의해 번역 출판되었던 “통계의 마술”로 이 책을 처음 접하였었다.

기본적으로 이 책은 통계로 사람들을 속이는 방법들을 열거한 책이다. 실제 우리나라의 많은 언론사에서 여기에 열거된 많은 방법들을 동원하여 의도적이든 의도적이 아니든 국민들을 오도하는 기사를 작성하는 경우가 많이 있었다. 그래서 이 책에서 제시한 몇 가지 예를 통하여, 필자는 우리 학생들이 언론 기사나 국가나 기업의 홍보 자료 등을 냉철하게 분석하는 능력을 키우게 되기를 기대한다.

통계를 이용하여 사람들을 오도하는 첫 번째 예는 “해군은 안전하다”이다. 미국과 스페인과의 전쟁 중 미 해군의 사망률은 1천명 당 9명이었는데, 같은 기간 중 뉴욕 시민의 사망률은 1천명 당 16명이었다. 이 자료는 해군이 뉴욕 보다 안전하니 젊은이들에게 해군에 입대하라는 홍보자료로 사용되었다. 일견 뉴욕에 사는 것보다 해군으로 있는 것이 더 안전한 것으로 보이지만 여기에는 큰 함정이 있다. 해군은 건강상태가 우수한 젊은이들이 대부분인데 반하여 뉴욕 시민은 갓난아이, 노인, 환자 등이 모두 포함되어 있기 때문에 비교 자체가 되는 않는 사망률을 비교한데에 불과한 것이다.

두 번째 예는 타임지에 소개된 25년 전 예일 대학을 졸업한 사람들의 평균 연봉이 2만5천1백11달러(1949년 자료로 당시에는 엄청나게 높은 연봉 임)라는 자료이다. 어느 학교든 졸업 25주년에 연락이 되는 졸업생들은 사회적으로 어떤 수준에 도달하여 있는 사람들이다. 전체 졸업생 수에 비하여 연락이 되는 졸업생은 많아야 70% 정도일 것이고, 그중 연봉을 물어 보았을 때, 회신하는 사람의 비율은 전체에 50%에 미치지 못할 것이다. 따라서 평균 연봉은 진실에 비하여 상당히 과장되었을 것으로 판단된다.

이제 이 책에서 언급한 통계의 거짓을 간파하는 다섯 가지 열쇄에 대해 살펴보기로 하자.

첫째 열쇄는 “누가 그런 말을 하였는가?” 이다. 통계의 출처를 확인하여 어떤 의도로 발표를 하였는지를 알아야 한다는 것이다. 예를 들면 경영자 측에서 회사의 평균 연봉을 발표할 때 모든 임원진을 포함하고 각종 수당 등을 전액 포함한 평균을 발표하여 임금 수준이 높다고 하는데 비하여, 노조 측에서는 노조 소속 직원들만의 초과근무 수당 등을 제외한 평균을 발표하여 임금 수준이 낮다고 발표한다는 것이다. 둘째 열쇄는 “어떤 방법으로 알게 되었나?”로 표본 의 추출 방법 등 조사 방법에 대하여 알아야 한다는 것이다. 지난해에 제품가격을 인상하였다는 회사에 비하여 인상하지 않았다는 회사가 1.8배라는 보도가 있었는데 실상은 1천2백개 회사 중 회답을 보낸 회사가 14%에 불과하고 그중 5%가 인상이 있었던 회사이고, 인상이 없었던 회사가 9%라는 조사 결과를 가지고 위와 같은 결론을 내린 것은 적절하지 않은 것이다. 대답하지 않은 많은 회사들이 대체적으로 제품가격을 인상 하였을 가능성이 크다고 보아야 할 것이다. 셋째 열쇄는 “모자라는 데이터는 없는가?”로 숨겨진 자료가 없는지 파악하여야 된다는 것이다. 최근 전체 이혼 비율 중 황혼 이혼의 비율이 높아졌다는 보도에 동의하려면 결혼한 세대들 중 높은 수명과 만혼 경향으로 인하여 노인 부부가 전체 부부 중 차지하는 비율이 상당히 높아졌다는 것에 대한 데이터를 알아야 한다는 것이다. 넷째 열쇄는 “내용이 뒤 바뀐 것이 아닐까?”로 쟁점의 바꿔치기에 유의하여야 한다는 것이다. 남태평양의 어떤 섬에 사는 사람들은 그들의 몸이나 옷에 이가 많이 있어야 건강하다고 믿고 있는데, 사람들이 열병에 걸리는 경우(이 병의 원인이 이라는 것이 확실함) 체온이 올라가서 이가 모두 떠나 버리기 때문이었다. 원인과 결과가 뒤 엉켜 엉뚱한 결론에 이른 경우이다. 다섯째 열쇄는 “통계 숫자에 제 뜻이 있는가?”로 무언가 이상한 점이 없는지 확인하라는 것이다. 1947년에서 1952년 까지 5년간 미국의 TV 대수가 1백배 늘어난 것으로 보아 5년 후인 1957년이 되면 TV 대수가 수 십 억대가 될 것이라는 결론은 추세가 계속 될 것 이라는 가정에서 나온 엉뚱한 결론이다.

필자의 바람은 학생들이 이 책을 통하여 각종 통계자료를 판단할 수 있는 안목을 키우는 것이며, 혹시라도 이 책을 통하여 “어떻게 통계로 사람들을 속이는가?”를 배우는 계기가 되지 않기를 바란다.

김동윤(소프트웨어) 교수  .

<저작권자 © 아주대학보, 무단 전재 및 재배포 금지>

icon인기기사
기사 댓글 0
전체보기
첫번째 댓글을 남겨주세요.
주요뉴스
여백
여백
여백
Back to Top