과학적 증거

PhiLoSci Wiki
둘러보기로 가기 검색하러 가기
수업을 듣는 학생들이 함께 작업 중인 문서로, 내용상에 오류가 있을 수 있다는 점에 유의할 것.

가설-연역주의와 입증의 정도

가설은 가설의 귀결과 관찰을 비교함으로써 시험된다. 칼 포퍼는 긍정적인 시험 결과는 아무런 역할을 하지 못하고 부정적인 시험 결과만이 가설을 반증하는 역할을 한다고 주장했지만, 대부분의 가설-연역주의자들은 시험 결과 긍정적인 결과가 나타나면 가설이 입증된다고 주장했다. 즉 증거에 의해 가설의 개연성이 높아지거나 낮아질 수 있는 것이다.

"가설은 […] 결코 관찰 증거에 의해 완전히 검증될 수 없다. 따라서 나는 우리가 검증 개념을 포기해야 한다고 제안했으며, 대신 가설은 증거에 의해 더 혹은 덜 입증되거나 반입증된다고 말하고자 한다." - 루돌프 카르납

이를 위해 카르납은 "입증의 정도(degree of confirmation)"라는 개념을 제안했는데, 헴펠은 "Criteria of Confirmation and Acceptability"[1]에서 증거의 입증 강도를 좌우하는 여러 가지 특징을 다음과 같이 정리했다.

첫째, 입증의 강도는 증거의 양과 다양성과 정확성이 증가할수록 커진다. 단, 증거의 양이 증가할수록 일반적으로 입증도의 증가율은 떨어진다. 또한 다양한 증거는 가설(S)의 다양한 하위 가설들(S1, S2, S3...)을 뒷받침해주거나, 다양한 조건의 무관함을 보여주는 역할을 하기 때문에 단일 종류의 증거보다 더 좋은 증거를 제공한다.

둘째, 가설은 "새로운" 시험보다 가설을 구성할 때 이미 알고 있던 자료에 의해 더 약하게 입증되는 것 같지만 여기에 대해서는 논란의 여지가 있다. 4개의 스펙트럼선 자료를 이용해 만든 발머의 가설이 만들어내는 예측이 35개의 스펙트럼선을 모두 만족한 경우(예측)와 만약 35개의 스펙트럼선을 모두 이용해 신중하게 똑같은 가설을 얻은 가상의 경우(설명)를 비교해보자. 유한한 점이 주어지면 그 점을 지나는 곡선은 어떻게든 (무한히) 만들어낼 수 있으므로, 그렇게 만들어낸 가설이 35개의 스펙트럼선과 일치한다는 것은 "놀랄만한 일은 아무것도 없을 것이다." 그러나 그 가설은 제멋대로 꾸며진 가설이 아니라 "기막힌 단순성"을 지닌 가설이라는 점에 의해 우리의 확신을 강화시켜줄 것이라는 대응이 가능하다. 게다가 논리적인 관점에서 볼 때, 입증의 강도는 오직 가설과 자료에만 의존해야 한다. 가설과 자료의 순서는 순전히 역사 문제이기 때문에 가설의 입증에 영향을 끼치는 요인으로 간주하여서는 안 된다. 결국, 이에 대해서는 추가적인 논의가 필요해 보인다.

셋째, 다른 증거에 의해 잘 확립된 이론에 의해 도출되는 가설은 이론적 뒷받침을 받는다고 할 수 있다. 즉 기존 이론에 의해 도출될 수 있는 가설은 수용되기 쉽고, 기존 이론과 충돌하는 새로운 가설은 수용되기 불리하다. 그러나 이 원리는 자칫하면 기존 이론을 뒤집을 새로운 가설이나 발견으로부터 기존 이론을 방어하는 수단으로 사용될 수 있기 때문에 신중하게 조심해서 적용해야 한다.

넷째, 단순한 가설을 복잡한 가설보다 선호할만하다는 의견이 많지만, 단순성을 비교할 수 있는 명확한 기준을 정하는 일과 단순한 가설이 더 믿을 만하다는 것을 정당화하는 일은 쉬운 일이 아니다.

까마귀의 역설

한 가설의 증거가 되는 어떤 사실은 그 가설과 동치인 가설의 증거도 될 것이다. 너무나도 당연해 보이는 이 원리는 반직관적인 결과를 가져온다. 예를 들어 "모든 까마귀는 검다"(h)는 가설은 "검지 않은 모든 것은 까마귀가 아니다"(g)라는 가설을 생각해보자. 두 가설은 동치이다.

그렇다면 "검지 않으면서 까마귀가 아닌" 사례들, 예를 들어 하얀 분필의 발견()은 가설 g로부터 도출되는 귀결이므로 가설 g의 증거가 된다. 그리고 이 사례는 g와 동치인 가설 h의 증거도 될 것이다. 그러나 하얀 분필을 발견한 것이 "모든 까마귀는 검다"라는 가설을 뒷받침한다는 것은 반직관적이다. 무엇이 잘못된 것일까?

무차별적 입증의 문제

이론 체계가 계층적인 구조를 갖는다고 하자. 예컨대, 뉴턴의 운동 법칙과 중력 법칙(N)은 케플러의 법칙(K)이나 갈릴레오의 낙하법칙(G)보다 상위에 있다. (N에서 K와 G가 연역적으로 도출된다.) 그리고 경험과 직접 맞닿아 있는 부분은 경험적 일반화에 가까운 케플러나 갈릴레오 법칙이다. 즉, 뉴턴의 법칙도 경험적 자료를 통해 시험되기 위해서는 K 혹은 G에 의존해야 하는 것이다. K는 자신의 증거들(e1)을 갖고, G도 자신의 증거들(e2)를 갖는다고 하자.

가설연역론자들에 따르면, K가 예측하는 개별적 사실들(e1)은 K에 대한 직접적인 증거가 된다. 뿐만 아니라 그 증거(e1)은 G를 위한 간접적인 증거로도 기능한다. 이런 주장을 일반화해보면, 다음과 같다.

(CC) 증거 e가 가설 h를 입증하고, 가설 g가 가설 h를 논리적으로 함축하면, e는 g를 입증한다.
(SC) 증거 e가 가설 g를 입증하고, 가설 g가 가설 h를 논리적으로 함축하면, e는 h를 입증한다.

(CC)를 역귀결 조건(converse consequence condition)이라 하고, (SC)를 특수귀결 조건(special consequence condition)이라고 한다. 두 조건은 과학 활동에서 일상적으로 활용되는 주장으로 보이는데, 문제는 두 조건을 결합할 때 나타난다. 역귀결 조건과 특수귀결 조건을 모두 받아들이면, 어떤(some) 진술을 입증하는 어떠한(any) 진술이라도 모든 진술을 입증한다는 문제가 발생한다. 이를 “무차별적 입증의 문제”라고 한다. e가 가설 h를 입증하면, (CC)에 의해 h&h'도 입증하는데, 다시 (SC)에 의해 h'도 입증하게 된다. 이는 우리가 h'에 임의의 가설을 붙여도 마찬가지이다. 그러므로 한 가설을 입증하는 증거는 임의의 가설을 입증한다는 결론에 도달하는 것이다.

이러한 문제를 방지하기 위해서는, 입증이 선택적으로 이루어져야 한다. 무차별적 입증의 문제가 발생한 이유는 임의의 가설 h’이 증거 e를 논리적으로 도출하는데 아무런 기여를 하지 않으면서, h의 지위에 무임승차하기 때문이다. 그래서 문제를 피하려면, h가 e를 논리적으로 도출하면서 그 도출과정에 실질적으로 기여하는 경우에만, e가 h를 입증한다고 해야한다. h를 함축하는 상위 가설의 경우에도 e와 입증관계를 맺으려면, h 경우만 마찬가지여야 할 것이다. 이러한 직관을 구현하는 한 가지 방식은 다음과 같다.

(제안1) e가 h를 입증한다. iff
(i) e가 (h&b)로부터 연역적으로 도출된다. 그리고
(ii) e는 b로부터 연역적으로 도출되지 않는다. (b는 배경신념들의 집합)

그러나 조건의 h를 h&h'으로 대체하면, e가 h&h'을 입증하는 것을 허용한다. 즉, 무차별적 입증은 막았지만 h'의 무임승차를 허용함으로써 “무관한 연언의 문제”를 발생시킨다. 즉, e와는 무관한 가설 h'이 h와 동등한 입증의 지위를 누리게 된다는 것이다. 그래서 더욱 강화된 제안을 제시할 수 있다.

(제안2) e가 h를 입증한다. iff
(i) e가 (h&b)로부터 연역적으로 도출된다.
(ii) e는 b로부터 연역적으로 도출되지 않는다.
(iii) e를 도출하는 h의 진부분집합 h*이 존재하지 않는다.

이 제안은 무관한 연언의 문제가 발생하는 것을 막는다. 그렇지만 지나치게 강한 조건으로 보인다. 예를 들어, h' 없이도 h가 e를 연역적으로 도출한다고 하자. 그러면 e로 인해 h&h'과 h&-h'에 대한 믿음은 증가하고, -h&h'과 -h&-h'에 대한 믿음은 감소할 것이다. 따라서 e가 h&h'에 대해 아무런 증거도 제공하지 않는다는 것은 과도해 보인다. 결국 이 문제를 해결하기 위해서는 '입증의 정도'를 정량적으로 다룰 수 있는 틀이 필요해 보인다.

무차별적 입증의 문제에 대해 질문이 있어서 이곳에 답변을 올려드립니다.

무차별적 입증의 문제는 h를 입증하는 e가 그와 무관한 임의의 h’ 또는 h&h’도 입증하게 되는 문제입니다. 이 문제를 해결하기 위한 제안을 활용하는 방법은 h의 자리에 문제가 되는 가설을 대입해 보는 것입니다.

첫 번째 제안의 입증 조건을 만족하는 e와 h가 있다고 가정해 봅시다. 여기에 h와 무관한 h’을 상상해 보세요. 그러면 h’은 첫 번째 제안의 입증 조건을 만족하지 못할 것입니다. 왜냐하면 h’&b로부터 e가 도출되지 않을 것이기 때문입니다. 그러나 (h&h’)은 그 조건을 만족할 수 있습니다. 왜나하면 (h&h’&b)로부터 e가 도출되지만, b로부터는 e가 도출되지 않을 것이기 때문입니다.

두 번째 제안에서, e를 도출하는 h의 진부분집합 h*가 존재하지 않는다는 뜻은 아래와 같은 경우를 없애기 위한 것입니다. 예를 들어, h가 h1&h2&h3로 이루어져 있다고 생각해 봅시다. 그런데 h1&h2만으로도 e가 도출된다고 가정해 봅시다. 즉 h3는 e를 도출하는 데 불필요한 상황입니다. 이런 경우 두 번째 제안은 e가 h를 입증하지 않는 것으로 판단합니다. 왜냐하면 e를 도출하는 h의 진부분집합 h1&h2가 존재하기 때문입니다.

그러나 이런 결정은 너무 과도한 것으로 보일 수 있습니다. 스넬의 법칙의 경우를 한 번 생각해보시기 바랍니다. 두 번째 제안을 받아들일 경우, 강의 때 다루었던 첫 번째 실험은 스넬의 법칙을 입증한다고 볼 수 없게 됩니다.

또한 두 번째 제안은 거의 모든 입증을 불가능하게 만들 우려가 있습니다. 예를 들어, 100마리의 까마귀가 검다(e)는 것을 확인한 후, 그 증거가 "모든 까마귀는 검다”(h)는 가설을 입증한다고 말하고 싶다고 해봅시다. 이때 h로부터 e가 도출되지만, h의 진부분집합인 e도 e를 도출하게 됩니다. 그러면 두 번째 제안은 e가 h를 입증하는 것을 막습니다. 그러나 이러한 결정은 너무 과도해 보이죠?

임시방편적 가설의 문제

가설 h에 대해 반례 e가 나타났을 때 이를 구제하기 위해 사후적으로 도입된 보조가설 a가 있다고 하자. 이 때 e는 h&a를 입증한다고 할 수 있을까? 대상 a가 아직 관측조차 되지 않은 대상이라면 e가 이를 갑자기 입증한다는 것은 어색할 수 있다.

제거주의

제거주의의 의미

자료를 설명할 수 있는 대안 가설이 존재한다면 그 자료는 가설에 그다지 좋은 증거를 제공하지 못한다는 사상이다.

증거 판단이 가설과 자료 뿐 아니라 인간의 상상력에 의존할 수 있다는 사상으로, e를 설명하는 것이 h&a 대신 다른 가설 h'로도 가능할 수 있으므로 h&a를 입증할 수 없다고 본다.

제거주의의 문제점

대안가설을 생각해내지 못했을 경우 e가 h&a의 좋은 증거라고 착각할 수 있게 되는 점과, e를 설명할 수 있는 가설이 여러 개 존재할 때(h'1, h'2 등이 존재할 경우) 이를 어떻게 차별화할 수 있는지에 대해서는 반드시 고려가 되어야 할 것이다.

또한 h&a와 h' 중 어떤 가설이 더 좋은 것인지에 대해서도 가치 판단을 이 단계에서는 할 수 없다는 점도 한계로 볼 수 있다.

예측주의

예측주의의 의미

새로운 사실을 예측하는 데 성공한 것은 기존 사실을 설명하는 것보다 가설에 더 좋은 증거를 제공한다는 사상이다. 기존 사실을 설명하는 것은 관찰에 가설을 끼워 맞추게 될 수 있지만 새로운 사실의 예측은 그렇지 않다는 것이다.

예측주의의 문제점

이미 알려진 사실도 좋은 증거 역할을 많이 해왔다는 사실을 설명할 수 없다. 대표적으로 케플러의 법칙은 케플러 이후에 나온 법칙인 만유인력의 법칙에 대한 좋은 증거이다. 또한, 아인슈타인 이전에 나왔던 문제인 수성의 근일점 운동에 관한 문제도 일반 상대성 이론에 대한 증거가 된다. 즉, 예측주의의 생각과는 달리 기존의 사실을 설명하는 것도 좋은 증거가 될 수 있다. 이에 가설 구성 과정에서 사용되지 않은 사실들은 예측된 증거라고 바라보는 것이 한 해결 방법이 될 수 있을 것이다. 또한, 실제로 예측주의에 반하는 실천들이 실제로 유용하게 쓰인다는 것도 설명할 수 없다. 통계학에서 표본자료로부터 모집단의 실제 비율에 대한 가설을 세우는 것, X선 회절 사진을 보고 단백질의 구조를 예측하는 연구 등은 모두 예측주의와 맞지 않지만, 실제로 아주 빈번하게 쓰인다.

베이즈주의 입증 이론

베이즈의 확률론

베이즈 확률론(Bayesian probability)은 확률을 '지식의 상태를 측정'하는 것이라고 해석하는 확률론이다.[1] 확률을 발생 빈도(frequency)나 어떤 시스템의 물리적 속성이라고 여기는 것과는 다른 해석이다. 이 분야의 선구자였던 18세기 통계학자 토머스 베이즈의 이름을 따서 명명되었다.

베이즈 정리

확률론과 통계학에서, 베이즈 정리는 두 확률 변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리다. 즉, 확률변수의 조건부 확률분포와 주변부 확률분포를 연관 짓는 확률이론을 말한다.

베이즈 정리는 확률에 대한 곱의 법칙의 단순한 결과이다. 그러나 경우의 종류를 정의하는 것은 단순치가 않으며, 그 이유는 사전확률에 대한 판단이 자주 흐려지기 때문이다. 철학자와 통계학자들 중 개인주의학파(personalist school)는 베이즈정리에 주목할 만하게 의존하는 경향이 있는데, 왜냐하면 처음에는 확률판단이 발산적으로 흐르는 경우에 확증을 수렴시키는 쪽으로 사용이 되기 때문이다. [2]

주석

  1. Hempel (1966), “Criteria of Confirmation and Acceptability”, Philosophy of Natural Science. Pearson Education, Inc..
  2. 과학사사전, 2011. 2. 1., 이호중

위키 참여 프로젝트

위의 항목들은 과학의 철학적 이해 : 2017년 1학기에피소드 과학철학 : 2017년 1학기 수업에서 학생들과 함께 만들어가는 항목입니다.