Posted at

“문제는 통계 확률이 아니라고”“문제는 통계 확률이 아니라고”

Posted at 2016.07.11 01:16 | Posted in 박성환의 [진지빨고 세상보기]

얼마 전 벌어진 강남역 여성 피살 사건과 작년의 메르스 사태는 묘하게 닮은 구석이 있다. 위험에 대해 사람들이 받아들이는 심리적 불안감의 크기가 위험이 일어날 현실적 확률의 크기를 압도했다는 점이다. 메르스 발병 기간 동안 국내 감염자 수는 186명이었고 이 중 사망자는 38명이니 치사율은 약 20%였다. 하지만 대한민국 총인구수를 대상으로 하면 메르스에 걸려 사망한 비율은 고작 약 0.00007%에 지나지 않는다. 천만 명 당 7명 수준이다.

 

하지만 사회가 받아들이는 공포의 크기는 이와는 대조적이었다. 강남역 여성 살인사건도 마찬가지였다. 대체로 연간 한국의 10만 명당 살해당할 확률은 1명이 채 되지 않는다. 세계 평균에 비해서도 분명 압도적으로 낮은 수치이다. 하지만 통계적 수치는 이번 사건에 대해 국민들, 특히 여성들의 불안감을 전혀 상쇄할 수 없었다. 현실과 괴리된 통계와 확률을 우리는 어떻게 받아들여야 하는 것일까?

 

“한국전쟁 때 미군 사망률보다 낮은 확률로 불안에 떠는 한국인들”

김진 씨는 작년 6월 10일 자 중앙일보에 게재된 “두려워할 것은 두려움 그 자체‘라는 논설에서 한국전쟁 때 미군의 사망확률은 50분의 1인데 반해, 광우병 파동 때 미국산 쇠고기를 먹고 인간 광우병에 걸릴 확률은 1억분의 1이었음에도 불구하고 미국산 쇠고기를 막고 정부를 때려 부쉈으니 한국 사회가 근거 없는 소문에 패한 것이라고 주장했다. 그는 자신이 동의하지 않은 비자발적 위험에 대해 인간이 느끼는 불안의 크기가 위험이 발생할 ’기수적 확률‘을 초월한다는 사실을 모르는 모양이다.

 

통계와 확률은 오늘날 현대인들에게 필요한 도구이긴 하다. 정치가와 관료들은 더 이상 이념 논리나 오랜 ‘실무적 육감’만으로 국가 정책을 세울 필요가 없다. 숫자가 빽빽하게 들어 찬 통계로 정책의 타당성 여부를 판단할 수 있게 되었고, 통계와 확률로 무장한 데이터는 지극히 가치중립적인 하나의 척도로 인정받게 되었다. 기업가들 역시 더 이상 ‘야성적 충동’에 따라 매출 전망을 예측하거나 설비 투자 계획을 세우지 않아도 되는 한편, 좀 더 엄밀한 경영 계획 수립이 가능하게 되었다.

 

통계와 확률은 거시경제정책이나 기업 경영 같은 정량적 가치를 판단하는 기준으로만 국한되지 않는다. 인간의 기호나 유행, 역사, 법 제도 등 사회문화적 기준에서도 유효한 바로미터로 활용할 수 있다는 믿음이 확산되었다. 바야흐로 데이터 만능주의가 횡행하게 되었다. 더 나아가 불안에 쉽게 동요하는 집단 과민반응에서 탈피하고 과학적 데이터를 바탕으로 냉철한 이성을 가지고 행동할 것을 요구한다. 하지만 통계와 확률만으로 모든 사회 현상을 예측하고 가치를 판단할 수 있다는 착각은 사람이 오직 이성으로만 상황을 인식하는 존재가 아니라는 사실을 간과하고 있다.

 

전망 이론가들에 따르면 사람이 위험을 인식하는 태도가 확률적 수치보다는 ‘위험의 형태’나 ‘심리적 상태’에 따라 좌우된다고 한다. 예를 들어 비자발적으로 노출된 위험, 그리고 그 성격과 대처 방법이 불분명한 위험에 대해 느끼는 집단적 불안감을 위험이 발생할 확률적 근거만으로 완전히 해소할 수는 없다는 것이다(미시경제학 제5판, 이준구).

 

메르스 사태의 경우, 정보 부족과 보건당국의 미흡한 초동대처가 사태를 악화시켰고 투명하지 못한 정보 비공개 방침, 정부 발표의 번복은 불신을 초래해 사회적 신뢰를 약화시켰다. 총인구 대비 약 0.00007%에 불과한 결과적인 사망률과 별개로 확률 데이터가 현실에서 우리 사회가 느꼈던 불안의 정도를 제대로 반영하지 못함을 보여주는 예이다.

 

어떤 논객은 메르스의 감염률과 사망률이 결핵보다 낮은 수준이므로 국민들에게 호들갑떨지 말 것을 주문했는데 이러한 주장은 메르스의 감염 메커니즘에 대한 무지함을 방증한다. 모두가 알다시피 메르스 같은 전염병은 사람과의 접촉을 통해 확산되는 특성을 가지고 있다. 그렇다고 전염병이 국내로 유입된다는 이유로 세계화 시대에 출, 입국 자체를 덜컥 금지할 수는 없는 노릇이다.

 

또한 일상생활을 위해 버스나 전철같이 밀폐되고 고도로 밀집된 공간에서 불가피하게 불특정 다수와 접촉할 수밖에 없는 현대 도시인의 생활 패턴 상, 메르스에 대한 공포는 ‘비자발적’이고 ‘일상적’일 수밖에 없었다. 더구나 메르스의 경우 결핵과 달리 백신을 통한 완치 방법도 전무했으니 사람들이 실질적으로 느끼는 불안감은 배가될 수밖에 없었다.

 

강남역 여성 살인 사건도 이와 크게 다르지 않다. 단순히 10만 명당 살해당할 확률이 1명도 안 된다는 확률적 확신보다는 유동인구가 많은 강남역 한복판에서, 그것도 공중 화장실이라는, 누구나 일상적으로 마주하는 장소에서 불특정 여성을 대상으로 벌어진 강력 범죄에 대해 일반 여성들이 심리적으로 자기대입을 할 수 밖에 없었던 ‘정황적 특징’에 더 주목할 필요가 있다.

 

큰 상자에 수만 개의 검은 콩 중 흰 콩 하나를 섞은 뒤 눈을 감고 콩을 하나씩 꺼내어 몇 번째 만에 흰 콩이 나오는 지 실험을 한다고 가정하자. 확률 상 거의 불가능하지만 분명 첫 순번에 흰 콩이 나오지 말라는 법은 없다. 확률의 크기와 상관없이 그 희박한 확률에 뽑힐 가능성은 누구에게나 항상 동등하다. 바꾸어 말하면 확률의 이면에 숨겨진 이 ‘동등성’은 결과적 확률과 별개로 그 누구도 심리적 불안에서 자유로울 수 없는 집단 심리 기제를 촉발한다. 그리고 확률이 아예 '0'이 아닌 이상, ‘동등성에 따른 불안감’은 위험이 발생할 ‘확률의 기수적 크기’와는 상관없이 항시 존재한다.

 

그렇다면 통계는 어떠한가? 오늘날 대다수의 국가는 GDP나 실업률, 유아사망률, 흡연율, 범죄율, 조혼인율 등 여러 사회지표를 통계로 내어 국가 정책의 방향을 설정하거나 사회 발전의 척도로 대중에게 홍보한다. 연일 미디어에서 발표하는 통계적 기준에 따라 시민들도 정치나 사회, 경제에 대해 나름대로 평가를 내린다. 확률과 마찬가지로 통계도 수치에 국한된 가치중립적이라는 다수의 인식 덕분에 높은 신뢰성을 얻고 있다.

 

하지만 통계 역시 결국 사람이 작성하는 결과물이다. 그 이면에는 ‘비통계적 의의’와 의도적인 통계치 누락, 비교 대상 선정 기준의 비객관성, 평균값과 중위값의 갭이 발생하는 등 ‘불안정한 주관성’을 내포하고 있다는 사실을 간과해선 안 된다. 실제로 우리가 접하는 통계는 대부분 이와 대동소이한 오류를 내포하고 있다.

 

"GDP(혹은 GNP)를 과연 ‘생활 개선의 척도’로 간주할 수 있을까?"

“삼나무 숲이 파괴되고, 무분별한 도시의 확장 속에서 자연의 경이로움이 사라지는 것도 GNP에 포함됩니다. 네이팜탄도 계산에 넣고 핵탄두도 계산에 넣으며 도시 폭동을 진압할 경찰 장갑차도 계산에 넣습니다. 하지만 GNP에는 우리 아이들의 건강, 그들이 받는 교육의 질, 그들의 놀이가 들어갈 자리는 없습니다. GNP는 모든 것을 간단히 계산해 냅니다. 우리의 삶을 가치 있게 만드는 것만 제외하고 말입니다.”

-로버트 케네디Robert F. Kennedy, (캔자스 대학 연설 中, 1968)-

 

예를 들어 한 사회의 치안 수준을 나타내는 ‘살인 사건 사망률’은 보통 ‘10만 명 당 살해당한 사람 수’로 파악한다. 이런 측정 방식은 ‘총인구수의 변화’에 의해 왜곡되기 쉽다. 가령 t년도의 총인구수가 3000만 명인 A국의 10만 명당 살해당한 사람 수는 4명이라고 가정해보자. 30년 후, A국의 10만 명당 살해당한 사람 수가 2명으로 떨어진다면 A국의 치안은 명백히 개선되었다고 단정할 수 있을까?

 

하지만 여기서 주어진 통계치는 십만 명 당 살해당한 사람 수이지, ‘A국의 총인구수 증감 추이’는 주어지지 않았다는 것을 알 수 있다. 30년 후 A국의 총인구수가 t년도에 비해 2배를 초과한다면 실제 살해당한 사람 수(살인 건수)는 t년도에 비해 증가함을 알 수 있다.

 

물론 10만 명 당 살해당한 사람 수는 줄었기 때문에 ‘살해당할 확률’은 적어졌지만 살인 동기나 범행 형태에 따라 인간이 느끼는 살인에 대한 위험의 크기가 반드시 통계와 일치하지 않을 수도 있다. 불특정 다수를 상대로 한 묻지마 범죄나 흉악한 범행 수법을 구사하는 연쇄 살인범의 출몰은 사회가 인식하는 치안 수준을 통계 그 이상으로 악화시키기 때문이다.

 

이외에도 ‘평균의 함정’에 빠진 1인당 GDP와 직장인 평균 연봉, 전업 주부의 가사 노동은 제외하면서 환경오염을 발생시키는 생산 활동과 범죄율 증가에 따른 교도소 신축비용 증가를 경제성장 변수로 포함시키는 ‘GDP의 이상한 계산방식’, 사실상의 실업 상태인 비경제활동인구(만15세 이상 취준생, 공시생)를 실업자에 포함시키지 않은 한국의 실업률 통계, 체감물가와 따로 노는 소비자 물가지수 등을 살펴본다면 통계는 객관적 지표라기보다 무엇을 측정하고 무엇을 계산에서 제외할 것인지 결정하는 권력이 작동한 결과물로 보는 것이 더 정확할 것이다.

 

"소비자 물가지수와 소비자 체감물가 간의 괴리"

임금상승이 정체되어 있는 반면, 국내 휘발유와 생필품 값은 오르고 있다. 하지만 경제 당국은 소비자 물가상승률을 근거로 ‘지나친 디플레이션’이 우려된다고 한다. 과연 얼마나 많은 국민들이 이에 공감하고 있을까?

 

물론 통계와 확률은 사회의 역동적인 수요에 맞게 정책을 설계할 수 있는 탁월한 도구임에 틀림없다. 통계적 예측을 통해 지역주의에 따른 소모적인 정쟁을 최소화하면서 지하철 노선이나 고속도로, 공항 등 국가 인프라를 효과적으로 배치하고 교육, 노인, 노동 정책의 개선을 꾀할 수도 있다. 하지만 통계와 확률과 같은 데이터 역시 정치적 이념과 권력 관계에서 완전히 자유롭지 못하다. 또한 비자발적이고 불투명한 의사 결정 과정 때문에 촉발된 집단적 불안을 ‘객관적’ 통계와 확률적 수치를 근거로 무시하려는 비민주적 정치 문화를 야기하기도 한다.

 

가령, 최신 통계 기법과 위험 발생 확률을 엄밀히 계산하는 방식을 이용하여 최적의 핵발전소 부지를 결정한다 하더라도 해당 지역 주민들이 ‘비자발적으로 직면한 심리적 불안감’까지 정확하게 측정하는 것은 불가능하다. 또한 기피 시설을 짓는 대신 해당 지역에 대해 정부에서 지원하는 여러 보상 대책을 마련한다 해도 그것이 시민들의 불안감 내지 심리적 박탈감 등 음(-)의 효과와 완벽히 등가교환 할 수는 없다.

 

통계와 확률도 결국 사회 현상을 설명하기 위해 고안된 인위적 도구에 불과하다. 통계와 확률에 근거한 데이터가 대중의 집단 심리를 제대로 설명하는 데 실패한다면 그 측정 방식의 재고를 요구하는 건 정당하다. ‘수학적 중립성’이라는 미명하에 인간의 감성적 사고와 행동을 억지로 통계 결과에 끼워 맞추라고 강요하는 것은 또 다른 ‘비이성적 폭력’에 불과하다. 수정이 필요한 건 집단 심리를 반영하지 못하는 데이터이지, 불확실한 상황에 불안해하는 대중의 본성이 아니다.

Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기