우연을 길들이다

이언 해킹, 『우연을 길들이다 : 통계는 어떻게 우연을 과학으로 만들었는가?』, 정혜경 옮김 (바다출판사, 2012).

요약

13장. 표준적인 가슴둘레(Regimental Chests)

아돌프 케틀레(Lambert Adolphe Jacques Quetelet, 1796-1874)는 벨기에의 왕실 천문학자이자 "평균인"(l'homme moyen, the average man)이라는 개념을 창안한 통계학자이다. 1835년 『인간론』에서 그는 사회에 대한 통계가 보여주는 분포 곡선을 (동전 던지기의) 이항 분포 또는 (천문 관측의) 오차 곡선에 빗댐으로써, 통계적 평균값을 편리한 요약이 아닌 실재하는 양으로 탈바꿈시켰다. 동전에는 앞면이 나올 객관적 성향이 내재되어 있고, 천체의 위치는 객관적으로 실재하는 점으로 간주될 수 있다. 실제 동전을 여러 차례 던져 만들어지는 앞면 수의 분포와 천체 위치의 측정값들의 분포는 실재하는 값이 오차들과 함께 나타난 결과로 간주될 수 있는 것처럼, 케틀레는 인간에 대한 통계치 역시 집단의 실재하는 성향이나 특징을 보여주는 값으로 해석될 수 있다고 주장했다. (단, 케틀레의 '평균인'은 인류 전체가 아닌 민족이나 국가에 적용되는 개념이었다.)

1844년 논문에서 케틀레는 이를 좀더 자세하게 논증한다. 그는 확률 오차가 있는 측정값들로부터 물리량을 측정하는 이론이 집단의 특징들을 측정하는 데도 적용될 수 있다고 논증했는데, 집단의 특징들 역시 물리량과 형식적으로 동일한 기법에 의해 계산될 수 있기 때문이며(양쪽 모두 반복 측정, 다양한 측정값들이 평균을 중심으로 한 정규분포를 이룸), 따라서 집단의 특징들 역시 실재적인 양으로 간주되어야 한다. 다시 말해, 측정 대상이 실재하는 양인지 여부를 모르는 경우, 측정값들이 한 명의 개인에 대한 측정들로부터 도출된 수치의 분포와 충분히 유사한 경우 그리고 오직 그러한 경우, 그 측정 대상이 되는 실재하는 양이 존재한다. 이로써 "이전에는 거대한 규모의 질서에 대해서만 묘사하던 통계적 법칙은 자연과 사회의 기저에 내재된 진실과 원인을 다루는 법칙으로 변모하기 시작했다."(223쪽)

이러한 사고의 전환이 어떻게 정당화될 수 있었을까? 케틀레의 비유는 다음과 같다. 스코틀랜드 군인 5738명의 가슴둘레 분포의 평균은 약 40인치인데, 그에 따르면, 이는 가슴둘레가 거의 40인치에 해당하는 한 명의 스코틀랜드인을 '인체 측정에 대해 숙달이 거의 되지 않은 사람'이 측정한 것이나 다름 없다. 그러나 해킹의 논평에 따르면, 이러한 초보 재단사의 비유는 설득력이 없다(227쪽). 어떻게 여러 명에 대한 정교한 측정 결과들의 분포가 한 명에 대한 어설픈 측정 결과들의 분포와 동일한 것으로 간주될 수 있는가?

이에 대한 해답은 제시된 적이 없지만, 해킹은 개념 상의 불편함을 완화시키는 일종의 진통제 같은 설명은 있다고 소개한다. 그 설명은 라플라스적 결정론을 가정하되 미지의 기저 원인들을 도입한다. 동전 던지기의 결과가 앞면 또는 뒷면이 나오도록 촉진하는 미지의 개별 원인들의 총합에 의존한다면, 앞면이 나올 확률은 전체 원인들 중에서 앞면을 촉진하는 원인들이 차지하는 비율이 될 것이고, 그 분포는 그 비율을 중심으로 한 이항분포의 형태를 띨 것이다. 천문 관측의 결과들이 +/- 오차를 촉진하는 미지의 개별 원인들의 총합으로 산출된다면, 그 오차 곡선은 이항분포의 형태를 띨 것이다. 이제 인간의 질병, 자살, 신체적, 사회적 특징 역시 수많은 미미한 원인들의 결과로 간주한다면, 이로부터 케틀레의 결론이 도출되는 듯하다. 각 병사의 가슴둘레는 모종의 미지의 원인들로 인해 결정된다. 샘플의 크기가 큰 상황에서, 독립적인 원인들의 총합에 따른 결과는 가우스 곡선을 낳는 경향이 있다. 이로써 인간의 정신적, 육체적 특성도 오차 법칙과 같이 분포되어 있는 이유를 '이해'할 수 있다.

오차 법칙은 케틀레의 '평균인' 개념 창안 과정에서 중요한 역할을 했지만, 나중에 골턴은 이러한 이해방식에서 평균으로부터의 편차(deviation)를 '오차'(error)로 이해할 수 없음을 깨달았다. 평균으로부터의 편차 역시 자연적 편차일 뿐 오차는 아니기 때문이다. 오차 법칙은 주로 천문학자들에게나 중요했다. 케틀레는 이를 미세한 기저 원인이라는 모호한 체계로 포장하여 인문사회과학에 전파한 셈이었다.

케틀레는 이 체계에 천문학적 인과관계가 지닌 또 하나의 요소를 추가했다. 천체 운동은 엄격한 법칙을 따르지만 근접한 천체에 의해 교란될 수 있고, 근접했던 천체가 멀어지면 원래의 안정적 패턴이 회복된다. 케틀레는 이 아이디어를 통계적 규칙성이 가끔 깨지는 경우를 설명하는 데 활용했다. 프랑스의 유죄 판결률 변동(1832년) 및 같은 시기 벨기에의 더 극심했던 유죄 판결률 변동에 대해, 케틀레는 심각한 정치적 사건으로 인한 간섭으로 통계적 안정성이 깨진 일로 해석했다. 또한 그에게 문명의 정도는 통계적 불변성의 이탈의 정도가 낮을수록 높았다.

해킹의 총평 : 위의 설명들은 조리있지 않다. "결정론적 세계관은 새로운 통계학이 제시하는 현상들에 의해 다방면에서 위협을 받았으며, 급증하는 현상들에 대해 이해할 수 있는 일관된 방법은 당시로서는 존재하지 않았다. 기저 원인에 대한 담론은 개념상의 결함을 감추기 위한 하나의 요소일 뿐이었다."(234-235쪽) 개념상 불안요소 중 하나는 통계적 숙명론과 자유의지의 문제였다. 만약 통계학이 범죄에 미리 할당된 총량이 있다고 이야기한다면, 그리고 그 결과 범죄자는 단지 도구일 뿐이라는 것을 알게 한다면, 범죄자의 자유의지란 어디에 있으며, 그가 저지른 범죄에 책임을 져야 하는 이유는 무엇일까?

14장. 사회가 범죄를 예비한다

1930년대 확률적인 자연 법칙은 자유의지의 실재성을 보여주는 것으로 여겨진 반면, 1830년대 확률과 통계 법칙은 자유의지의 부재를 보여주었다. 케틀레는 "사회가 범죄를 예비하며 범죄인은 도구일 뿐"이라고 편지를 썼고(1832년), "도덕적 질서는 통계학의 영역에 들어오게 된다. ... 이는 인간 본성의 완벽성을 믿는 이들에게는 낙담스러운 사실일 것이다. 자유의지란 오로지 이론 속에서만 존재할 것처럼 보인다."라고 썼다(1836년). 즉 범죄와 자살을 관장하는 통계적 법칙이 있다면 범죄인들의 범죄를 막을 수 없다는 것이다. 당대의 사람들은 인간의 행위가 확률 법칙의 영역에 속한다면 인간의 행위는 자유로울 수 없다고 생각했다. 이러한 통계적 숙명론에 따른 자유의지의 문제에는 크게 두 가지 반응이 나타났다. 하나는 개인과 집단의 분리, 다른 하나는 지배와 피지배의 분리이다.

첫째, 법칙은 집단에만 적용될 뿐, 개인은 여전히 자유롭다는 반응(디킨스). 그러나 개인과 집단을 간단히 분리하긴 어렵다. 오늘날 범죄자의 환경에 기초한 정상참작은 통계적 법칙을 통해 개인의 책임을 일부 면제해주는 것 아닌가? 디킨스의 반공리주의적, 반통계적 소설 『어려운 시절』에서는 통계적 법칙을 설교하던 교사 그랜드그린드의 아들 톰은 도둑으로 발각되며 다음과 같이 말한다. "제가 어떻게 법칙을 막을 수 있겠어요? 다른 이들에게 그렇게 말해 오셨잖아요? 아버지, 마음을 편하게 가지셔요." 디킨스는 소설에서 통계적 일반화의 타당성을 불신했고, 그에 따른 책임 회피를 조롱했다. 사실 지금도 "우리는 통계에 내재된 정상참작의 당위성과 그것이 책임 소재에 미치는 영향을 어떻게 풀어야 할지 여전히 알지 못한다."(242쪽)

둘째, 우리는 피지배 집단에 적용되는 법칙을 바꿀 수 있다는 반응(윌리엄 파 William Farr, 1807-1883). 화재 발생에 관한 법칙이 있더라도 소방관의 배치, 건축 법규와 도시계획을 통해 위험을 줄일 수 있는 것처럼, 지배 계층에 해당하는 우리는 피지배자인 그들에게 적용되는 법칙을 바꿀 수 있다. 케틀레, 파와 같은 공리주의적 개혁가들은 통계학에 의한 통제를 이용할 수 있었다. 연간 범죄율은 사회 질서의 '필연적 결과'이기에 입법가들은 이를 개선시키기 위해 변화를 도입해야 한다. 선의를 가지고, 식견이 뛰어난 우리가 그들에게 영향을 미치는 통계적 법칙을 바꾼다. 물론 이러한 정책을 통해 지배 계층도 이득을 얻긴 했지만, 통계적 법칙은 기본적으로 계층에 관한 것이었고, 주로 측정된 것은 피지배계층인 '그들'이었다. '레미제라블'은 통계학자들이 애용했던 표준적인 전문 용어였다. 통계적 법칙의 또 다른 대상은 인종이었고, 여기서 우생학이 기원했다. 우생학의 동기는 공리주의적 개혁가들의 동기와 동일한 것이었고, 그 뿌리는 알려진 것보다 일찍 확립됐다. 1860년 파의 연설이 이를 입증하며, 그의 관심사는 화재 관리로부터 계층 관리, 나아가 인종 관리로 옮아갔다.

통계적 숙명론과 자유의지 사이의 충돌 문제는 1820년대 이후에나 등장한 새로운 문제였다. 왜냐하면 그 전에는 통계적 법칙이 없었기 때문이다. 그러나 이와 유사한 문제가 이미 있긴 했는데, 바로 골상학 논쟁이다. 로버트 영은 "골상학이 질병은 특정 기관으로부터 비롯됨을 인식한 거대한 개혁의 일부였음"을 설득력있게 보여준 바 있다. 그런데 만약 형질이 뇌 속의 기관에 의해 결정된다면, 개인의 이러저러한 성향에 대해 책임을 물을 수 없게 되는 것일까?

골상학자 스푸르츠하임은 숙명론이란 비난에 대응하여 '성향'(propensity)이라는 개념을 사용했다. 그는 여러 신체적 특징이 선천적으로 결정되듯, 정신적, 도덕적 특징 역시 부여받는 것이 무슨 문제냐며 반문한다. 그런데 그의 고찰 중 일부는 법칙에 대한 새로운 전체론적 해석을 보여준다. 물리적 법칙은 화학적 법칙의 지배를 받고, 화학적 법칙은 유기체의 법칙에 종속적이며, 후자는 인간 능력의 법칙에 종속된다. 그에게 자유로운 사람이란 자신의 성향과 동기를 알고, 그것들에 대해 고민하여 스스로의 행동을 결정하는 사람이다. 즉 그의 골상학에서 성향은 결정 요인과 분리되었는데, 이는 통계적 숙명론에서도 필요로 하는 것이었다. 통계학자들은 비슷한 논조를 폈다. "범죄의 성향은 분명 존재하지만, 개개인은 스스로를 도울 수 있는 도덕적 힘을 지니고 있다는 것이다. 그러나 통계학에서 자유 선택은 독립적인 미미미한 원인처럼 간주되었고, 따라서 개인들이 많이 모일수록 개인의 의지가 미치는 영향은 서로 상쇄되고, 통계적 법칙이 성립하게 된다. 즉 개인의 자유의지는 배제되지 않지만, 하찮은 원인이 되었다.

15장. 사회에 대한 천문학적 시각

케틀레식 통계적 숙명론을 대중적으로 유행시킨 것은 헨리 토머스 버클(Henry Thomas Buckle, 1821-1862)의 『잉글랜드 문명사』(1857)이었다. 그는 자살 사례를 통해 통계적 숙명론을 묘사한 후, 역사의 궤도를 결정하는 것은 행위자의 자유선택보다 기후와 땅이라는 역사적 결정론을 주장했다. 버클은 세부적 법칙과 개괄적 법칙을 대립시킨 뒤, 세부적 법칙이 개괄적 법칙에 종속되어 있다고 말한다. 버클은 케틀레에 근거하여 학설을 내놓았고, 케틀레는 후에 다시 버클을 인용했다. 많은 학자들은 이러한 무분별한 숙명론이 통계에 오명을 안겨준다고 불평했다. 이에 대응하여 벤(빈도주의)과 드모르간(베이즈주의)은 확률에 대한 고도로 정교한 개념적 분석을 제시하기 위해 노력한 반면, 독일에서는 그러한 정교한 분석적 접근이 없었던 듯하다.

버클의 책은 1860년대 독일어로 번역된 후, 통계적 숙명론에 대한 격한 공격을 촉발했다. 표준적인 반대 논리에 따르면, 통계적 규칙성은 법칙이 아니며, 심지어 규칙도 아니라는 것이다. 인간의 자유는 통계적 규칙성으로부터 제약받지 않는다. 따라서 칸트의 후계자들은 케틀레에 맞섰다.

작센 출신의 엥겔은 『잉글랜드 문명사』 출판에 앞서 숙명론에 대한 반대를 촉구한 바 있다. 통계적 규칙성은 법칙이 아니라는 것이다. 사람들은 자유의지로 결혼하고, 아이를 낳고, 집을 옮긴다. 그렇다면 왜 규칙성이 존재하는가? 버클의 영향으로 엥겔은 자살에 초점을 맞추었는데, 아마도 숙명론의 문제를 다루기 위해 자살에 대한 통계적 연구를 시작한 듯하다. 엥겔에 따르면, 자살 비율이 매년 거의 일정하긴 하지만, 결과에 대한 원인이 정확하기 않다는 점에서, 이는 단순한 습관적 현상일 뿐, 법칙은 아니다. 그리고 그 사실이 자연이나 사회의 법칙이 아니라면, 의지의 자유를 침해할 수 없다. 즉 원인에 대한 규명 없이는 법칙이라 부를 수 없다는 것이다.

엥겔이 숙명론에 관심을 가진 이유는 무엇이었을까? 엥겔은 자본주의적 문제에 대해 온정주의적 자력 구제 제도를 만들어야 한다고 생각했고, 구제은행, 담보보험, 기타 사회안전망 제도들을 창안했다. 그는 사회정책학회의 창립 회원이었고, 그 학회 회원들은 강단사회주의자로 불렸다(혁명적인 사회주의자들과는 달리 제도적 보완을 통해 질서 보전 추구). 그들은 국가가 우선한다고 생각했고, 국가 없이 개인이 있을 수는 없다고 생각했다. 개인이 훌륭한 국민으로 도야할 수 있도록 국가 자체와 제도를 다듬는 것은 국가의 책무라고 생각했고, 엥겔이 지휘하던 프로이센의 통계국은 이러한 전일주의적 정치 철학의 대변자였다.

반면 독일의 경제학자 바그너는 케틀레주의에 찬동했다. 1864년 그는 통계적 규칙성은 존재하며, 그것 자체가 '법칙'은 아니라 해도 결정론적 법칙이 작동하고 있음을 보여주는 것이라고 했다. 인간의 활동에는 원인들이 존재하며, 따라서 자유에 대한 제약은 실재했다. 그는 대수의 법칙은 엉터리라고 주장했다. 통계적 동질성은 수학이 아닌 인과관계에만 기인했다. 이는 그러한 헌법이 집행되는 나라와 같다. 물론 그 인과관계를 모르기 때문에, 어떤 독재자도 그와 같은 법을 집행할 수는 없지만, 그 인과관계를 통해 사회가 그러한 법을 집행하고 있는 것이나 마찬가지였다. 이러한 바그너의 견해에 독일인들은 대체로 적대적이었다.

크나프는 케틀레에 대한 전형적인 동유럽적 분석을 보여준다. 그에 따르면, (1) 케틀레가 사회적 법칙이 물리학의 법칙과 같아야 한다고 생각한 것은 그가 받은 천문학적 교육 때문이며, (2) 케틀레는 사회과학을 인간과학과 혼동했다. 그러나 크나프에 따르면, 사회과학은 개인들에 대한 과학이 아니라, 문화에 대한 과학이다. 개인들의 의존하는 문화를 무시한 케틀레의 사회에 대한 천문학적 관점은 타당하지 않다. 이러한 크나프의 진단은 사람들에게 작용하는 '천체간의 힘'을 언급하는 뒤르켐에도 그대로 적용될 수 있다.

16장. 사회에 대한 광물학적 시각

바르데슈에 따르면, 발자크는 통계에 대한 흥미로부터 다양한 부르주아 인간 군상에 대한 파노라마로 나아갔다. 발자크의 『결혼의 생리학』(1826/1829)의 도입부에는 '부부 통계'란 제목의 고찰이 있었는데, 1826년 "정실부인"은 "사륜마차를 보유하고 있다"는 것이 전부였으나, 1829년에는 "남편의 소득, 교육수준, 주거지 위치, 사회적 위치 및 삶의 스타일"이 구체적으로 등장한다. 그 사이에 통계가 세밀해진 덕분이다. 그리고 바르데슈는 통계 출판물에 대한 관심이 발자크로 하여음 『인간 희극』을 저술하도록 이끌었다고 암시한다. 1842년 『인간 희극』 서문에는 "동물학적인 관점의 종이 있는 것처럼 일련의 사회적 종이라는 것도 항상 존재한다"고 적었다. 그리고 인간 종은 한 권에 담을 수가 없었는데, 왜냐하면 개개의 인간이 저마다 독특하기 때문이며, 그래서 20권이나 내놓은 것이다.

르 플레는 발자크처럼 인간 다양한 유형들에 대한 파노라마식 연구를 1829년 시작했다. 그는 인간을 혼인 상태, 가족 관계, 주거지, 가계 생활비 규모에 따라 다양한 유형으로 분류하는 아이디어에서 출발했다. 다만 부유계층 대신 유럽의 노동자들을 대상으로 삼아, 소설이 아닌 개별 가족의 지출 규모에 대한 계량적 연구의 형태로 출판했다. 또한 평균치 대신 박물학자들의 암석 또는 식물 표본처럼 대표성을 때는 구체적 개인을 묘사했다. 우랄 산맥의 유목민, 셰필드의 칼장수, 스웨덴의 대장장이, 카스티야의 소작농, 모로코의 목수들을 상세하게 묘사하는 모노그래피를 작성했다. 그의 작업은 가정의 소득과 지출 등의 수치로 가득했지만, 오늘날 우리는 그의 작업을 통계적 저술로 인정하기 주저할 것이다.

르 플레는 자신을 콩트의 후계자로 보았다. 다만 도덕을 자연과학에 동화시킨 것은 우리 시대의 가장 큰 실수라고 지적했다. 그는 도덕을 되살리고자 하는 비전을 지녔으며, 유산 강제 분할에 비판적이었다. 그는 재산을 장자에게 대물림하는 가부장적 가족제를 높이 평가하며, 다양한 지역의 가족제도에 관심을 보였다. 특히 유럽의 직계가족 제도에 탄복했다. 그의 가족 유형에 대한 파노라마식 연구의 동기는 여기서 온 것일 수 있다.

르 플레의 현대적 기여는? 그의 대표 가구 추출 방법론? 혹시 그의 방법이 베버의 이상형 이론의 효시라고 보아야 할까? 그런데 르 플레의 확실한 기여는 바로 가구당 경비로, 이는 오늘날 생활비 지수의 기원이다. 그리고 이는 엥겔의 법칙으로 발전한다. "개인, 가구 또는 국민이 가난하면 가난할수록 물리적 생계의 유지를 위해 필요한 비용이 소득에서 차지하는 비율은 높아지기 마련이고, 이 비용 중에서도 대다수는 식료품비에 할당된다."

원래 르 플레의 가구 경비는 한 지역을 대표할 수 있는 개별 가구들에 대한 묘사였다. 이 수치는 해당 가구의 삶의 방식, 욕구, 즐거움, 가능성에 대해 많은 것을 알려준다. 르 플레는 가구 경비로부터 해당 가구의 현재 상태와 앞으로의 전망을 추론할 수 있다고 생각했다. 그러나 엥겔의 경비는 이와 완젼히 달랐다. 그것은 '사회적 종'이 아니라 집단에 대한 측정치였다. 즉 누군가 개별성을 반영하고 우주의 확률화에 저항하기 위해 반통계적인 아이디어를 제시하더라도, 그러한 아이디어는 다음 세대에 정보와 통제에 대한 표준적인 통계 절차의 일부로 흡수되고 마는 듯 보인다.

관련 항목