Comments and Criticism: Measuring Confirmation and Evidence

Eells & Fitelson (2000), "Comments and Criticism: Measuring Confirmation and Evidence", The Journal of Philosophy 97 (2000), pp. 663-672.
media:Eells&Fitelson(2000).hwp

베이즈주의에서 가장 표준적인 입증도 측정 방식은 차이 측정이며, 그 외에도 로그-비율 측정, 로그-가능도 측정도 제안된 바 있다. 이는 아래와 같다.

차이 측정(difference measure) :

d(h,e)=p(h|e)-p(h)

로그-비율 측정(log-ratio measure) :

r(h,e)=\log \left[p(h|e)/p(h)\right]

로그-가능도-비율 측정(log-likelihood-ratio measure) :

l(h,e)=\log \left[p(e|h)/p(e|\neg h)\right]

크리스텐슨(David Christensen, 1999)은 오래된 증거의 문제( $p(e)\simeq 1$ )와 거의 확립된 가설의 문제( $p(h)\simeq 1$ )를 통해 위의 측정 방식을 비판하고, 그에 대한 해법으로 규격화된 차이 측정 $S$ 를 제안한다.

규격화된 차이 측정(normalized difference measure) :

S(h,e)={1 \over p(\neg e)}d(h,e)=p(h|e)-p(h|\neg e),\quad p(e)\neq 1

^[1]

그러나 그는 그것마저도 완벽하지 않다면서 입증도 측정을 정의하는 문제에 대해 회의주의적인 결론에 도달한다. 엘즈(Ellery Eells)와 피텔슨(Branden Fitelson)은 크리스텐슨이 제기한 문제들이 베이즈주의의 표준적인 측정 방식을 이용해서도 해결 가능하며, 크리스텐슨의 개선책 $S$ 는 오래된 증거의 문제도 완벽히 해결하지 못할 뿐 아니라 그 자체의 약점도 가지고 있다고 말한다. 그들이 보기에 오래된 증거 또는 확립된 가설의 문제는 입증도 측정 방식에서 기인한 것이 아니라 배경지식을 다루는 방법에 기인한다.

오래된 증거와 가설에 대한 지지

오래된 증거의 문제는 $p(e)=1$ 인 상황에서 등장한다. $p(e)=1$ 일 때 세 가지 입증도 측정( $d,r,l$ )은 모두 $0$ 이 된다. 크리스텐슨은 이 오래된 증거의 문제를 $p(e)$ 가 1로 근접할수록 입증도가 $0$ 에 가까워지는 문제로 변경한 후,^[2] 자신의 입증도 측정 방식 $S$ 가 그에 대한 부분적인 해결책이 될 수 있다고 말한다. 왜냐하면 $S$ 는 오래된 증거 $e$ 의 입증도를 $0$ 으로 만들지 않기 때문이다.^[3]

크리스텐슨은 오래된 증거의 문제를 통시적/역사적(diachronic) 문제와 공시적/현재적(synchronic) 문제로 구분한다. 다시 말하자면, 증거 $e$ 가 가설 $h$ 를 실제로 입증하게 된 역사적 사건(historical accident confirming $h$ )은 $e$ 가 현재 $h$ 의 증거가 되는 것(being evidence for $h$ )과 구분된다. 예컨대 어떤 증거 $D$ 와 $A$ 가 순차적으로 들어왔다고 할 때 가설 $h$ 는 순차적으로 증가할 텐데, 만약 $D$ 에 의해 $h$ 가 이미 1에 근접해버렸다면 $A$ 는 $h$ 의 신임도를 별로 증가시키지 못할 것이다. 그러나 직관적으로 볼 때 $A$ 는 분명 $h$ 에 대한 중요한 증거가 될 수 있다. 현재적(공시적) 관점에서 어떤 증거가 가설에 대한 중요한 증거냐 아니냐의 문제는 그 증거의 순서와는 상관이 없기 때문이다. 크리스텐슨이 보기에, 증거의 (현재적) 중요도 문제는 증거의 역사적 입증도 문제와 별개로 다루어져야 한다. 즉 후자는 표준적인 입증도 측정 방식 $d$ 에 의해 측정될 수 있을지 모르지만, 전자를 측정하기 위해서는 다른 측정 방식(e.g., $S$ )이 필요하다는 것이 크리스텐슨의 주장이다.

엘즈와 피텔슨은 크리스텐슨의 문제를 배경지식의 문제로 돌려서 풀고자 한다. 그들이 보기에, 통시적 입증도와 공시적 증거도는 측정방식의 차이가 아니라 배경지식의 차이이다. 증거가 $e_{1},e_{2},e_{3},\cdots ,e_{i},\cdots ,e_{N}$ 순서로 들어온다고 할 때, $e_{i}$ 에 의한 “입증”과 “입증도”는 다음과 같이 정의될 수 있다.

정의 :

e_{i}

는

h

를 입증한다 iff

p_{i}(h)(=p_{i-1}(h|e_{i}))>p_{i-1}(h)

; 시점

t_{i}

에

e_{i}

가

h

를 입증하는 정도는 두 확률의 차이, 즉

p_{i}(h)-p_{i-1}(h)

이다.

증거의 (역사적) “입증도”는 “그 시점의” (실제) 배경지식에 의존한다. 위에서 언급했던 사례에서, 증거 A가 들어온 시점에는 이미 D에 대한 배경지식이 있었기 때문에 (즉, 그 배경지식으로 이미 p(h)가 1에 근접해 버렸기 때문에) 그 시점에서 증거 A는 가설 h를 그다지 입증해주지 못한다.

증거의 (현재적) “중요도” 문제를 다룰 때 배경지식은 약간 다른 방식으로 다루어질 수 있다. 우리는 이렇게 말할 수 있다. 배경지식을 지운 상태에서라면 D와 A는 모두 h에 대한 중요한 증거가 될 수 있다. 또 배경지식 D에 상대적으로, A는 h에 대한 사소한 증거이다. 또 배경지식 A에 상대적으로, D는 h에 대한 사소한 증거이다. 즉 증거의 중요도 문제는 증거가 들어온 실제 순서와는 무관하며, 우리의 배경지식 “선택”에 의존한다. 이를 일반화하면 다음과 같다. 배경지식 B를 증거 $e_{i}$ 를 제외한 나머지 증거 집합 $\{e_{1},\cdots ,e_{i-1},e_{i+1},\cdots ,e_{N}\}$ 의 임의의 부분집합이라고 할 때, $e_{i}$ 의 “증거됨”과 “증거적 지지도”는 다음과 같이 정의될 수 있다.

정의 : B에 상대적으로

e_{i}

는

h

에 대한 증거이다. iff

p_{0}(h|B\&e_{i})>p_{0}(h|B)

; B에 상대적으로

e_{i}

의

h

에 대한 증거적 지지도는 두 확률의 차이, 즉

p_{0}(h|B\&e_{i})-p_{0}(h|B)

이다.

어떤 증거 e가 가설 h를 입증하는지를 물을 때, 이 질문은 증거의 (역사적) 입증도를 묻는 것일 수도 있고, 증거의 지지도를 묻는 것일 수도 있다. 전자의 경우 그 입증도는 그 시점의 실제 배경지식에 의해 결정되지만, 후자의 경우 그 지지도는 배경지식의 선택에 따라 달라질 수 있다.

이렇게 입증(입증도)와 증거(지지도)를 구분하고 후자의 측정을 배경지식의 선택 문제로 돌림으로써, 엘즈와 피텔슨은 크리스텐슨의 새로운 입증도 측정법 S를 사용하지 않고서도 오래된 증거의 문제를 어느 정도 해결한 셈이다. 이 해결방식은 크리스텐슨의 “그럴듯한 가설의 문제”, 즉 p(h)가 1에 근접할수록 e의 입증 위력이 소멸하는 문제도 쉽게 해결할 수 있다. 이들의 해법에 따르면, p(h)가 1에 근접할수록 소멸되는 것은 e의 (역사적) 입증도일 뿐, e의 증거적 지지도가 아니다. 증거적 지지도는 실제 역사적 사실에 구애받지 않으며, 그 값은 배경지식의 자유로운 선택에 달려 있다.

측정방식 $S$ 와 크리스텐슨의 회의적 결론에 대한 평가

앞의 절에서는 크리스텐슨의 $S$ 를 쓰지 않고도 가설에 대한 증거의 (공시적) 지지도를 측정할 수 있음을 보였다. 이 절에서는 $S$ 에 대해 직접적인 평가를 시도한다. 크리스텐슨은 가설과 증거 사이의 증거적 관계 측정에서 배경지식의 영향을 끊는 방법을 찾고자 했다. 기본적으로 크리스텐슨은 다음의 두 기준을 이용하여 $d$ 와 $r$ 을 비판하고 $S$ 를 제안했다고 할 수 있다.

{\rm {D_{1}}}

:

p(e)

가 1에 가까워진다고 꼭

c(h,e)

가

0

에 근접해서는 안 된다.

{\rm {D_{2}}}

:

p(h)

가

1

에 가까워진다고 꼭

c(h,e)

가 0에 근접해서는 안 된다.

$d$ 와 $r$ 은 위의 두 기준을 만족하지 못 한다. 그러나 크리스텐슨도 인정했듯이, $S$ 뿐 아니라 $l$ 도 위의 기준을 만족시킨다.(정말?)^[4] 이에 대해 크리스텐슨은 다음 세 번째 기준을 이용하여 $S$ 를 옹호한다.

{\rm {D_{3}}}

:

p(h)

가

1

에 근접하지 않은 경우,

p(e)

가 1에 근접한다고 꼭

c(h,e)

가 0에 근접해서는 안 된다.

$l$ 은 위의 기준 ${\rm {D_{3}}}$ 를 만족시키지 못하지만, $S$ 는 이를 만족시킨다. 그러나 엘즈와 피텔슨은 이를 근거로 $S$ 를 옹호하는 것은 성급한 결론이라고 말한다. $d$ 를 $p(\neg e)$ 로 나누어 규격화시켜서 $S$ 를 만들었듯이, $l$ 도 규격화시켜 아래와 같은 $lN$ 을 만들어 사용할 수도 있는 것 아니냐고 반문할 수 있기 때문이다.

lN(h,e)={1 \over p(\neg e)}l(h,e)

엘즈와 피텔슨에 따르면, $lN$ 은 크리스텐슨의 기준 D₁~D₃를 모두 만족시키며, 더구나 $p(h)$ 나 $p(e)$ 의 변화에 $S$ 보다도 덜 민감하다. 특히 $lN$ 은 다음의 기준을 만족시키지만, $S$ 는 만족시키지 못한다.^[5]

{\rm {D_{4}}}

:

p(h)

가

0

에 근접하고,

p(e)

가

1

에 근접한다고 필연적으로

c(h,e)

가 0에 근접해서는 안 된다.

엘즈와 피텔슨은 이 경우 $lN$ 이 $S$ 보다 훨씬 큰 값을 가질 수 있다고 주장하면서 $lN$ 을 옹호하는데, 내가 보기에 둘의 단순비교는 위험해 보인다. 그럼에도 엘즈와 피텔슨의 주장에는 일리가 있는데, $lN$ 은 ${\rm {D_{4}}}$ 의 경우 $0$ 이 아닌 양수로 수렴하게 되기 때문이다.^[6]

규격화는 위와 같은 장점을 가지는 동시에 단점도 가지고 있다. 많은 (거의 대부분의) 베이즈주의자들은 까마귀 역설과 다양한 증거의 문제를 푸는 데 아래의 가정에 의존한다. 이 때 $d,r,l$ 은 아래를 만족시키는 반면, 규격화된 측정 방식인 $S$ 와 $lN$ 은 아래의 가정을 만족시키지 못한다.

{\rm {D_{5}}}{\text{ : If }}p(h|e_{1})>p(h|e_{2}),{\text{ then }}c(h,e_{1})>c(h,e_{2}).

크리스텐슨이 종국에 $S$ 를 포기하고 회의적 입장을 취한 이유는, 여전히 $S$ 가 자신이 제기한 조건(증거의 순서와 무관한 입증도의 측정)을 완전히 만족시키지 못하기 때문이었다. 예컨대 $D$ 이후에 등장한 $A$ 의 가설 지지도는, $S$ 를 이용해 계산해도 ( $D$ 이전에 등장한 $A$ 의 지지도에 비해) 작아진다.^[7] 배경지식으로서의 과거 증거 $D$ 는 여전히 증거 $A$ 의 증거적 지지도에 영향을 주고 있다. 크리스텐슨은 배경지식의 영향을 배제하고 증거와 가설 사이의 증거적 관계만 포착할 수 있는 측정 방식을 고안해내려 했지만, 그럴 수 없을 것으로 결론 짓고 자신의 시도를 포기하고 만다.

엘즈와 피텔슨은 이와 같은 크리스텐슨의 결론에 대해, 공시적 증거적 지지도를 “순수히 공시적 방법”으로 측정하려고 했던 시도 자체가 잘못이라고 평가한다. 배경지식은 증거적 관계에서 완전히 배제될 수 없다. 그렇다면 오히려 문제는 (1절에서 제시했듯이) 증거적 지지도를 “언제나 배경지식에 상대적으로” 측정될 수밖에 없는 것으로 간주함으로써 해결될 수 있을지 모른다. “입증”은 실제 역사적 배경지식에 의해, “증거”는 우리가 선택한 배경지식에 의해 서로 다르게 결정된다고 함으로써 말이다.

주석

↑ 이에 대한 증명은 다음과 같다.
구문 분석 실패 (알 수 없는 함수 "\begin{split}"): {\displaystyle \begin{split} \displaystyle S(h,e) &= {1 \over p(\neg e)} d(h,e) \quad (\rm {where}\quad p(e) \neq 1 )\\ \displaystyle &= {1 \over p(\neg e)} \left[ p(h|e) - p(h) \right] \\ \displaystyle &= {1 \over p(\neg e)} \left[ p(h|e) - \left( p(h|e)p(e) + p(h| \neg e) p(\neg e) \right) \right] \\ \displaystyle &= {1 \over p(\neg e)} \left[ p(h|e)(1-p(e)) - p(h|\neg e)p(\neg e) \right] \\ \displaystyle &= {1 \over p(\neg e)} \left[ p(h|e)p(\neg e) - p(h|\neg e)p(\neg e) \right] \\ \displaystyle &= {p(\neg e) \over p(\neg e)} \left[ p(h|e) - p(h|\neg e) \right] \\ \displaystyle &= p(h|e) - p(h|\neg e) \end{split}}
↑ 토톨로지가 아닌 명제에 대해서는 확률값을 $1$ 로 줄 수 없다는 원칙 하에서, 이는 정당화될 수 있다.
↑ 이는 다음과 같이 증명될 수 있다. 만약 $e$ 가 $h$ 에 대한 연역적인 증거로 $p(e|h)=1$ 이라고 하면,
구문 분석 실패 (알 수 없는 함수 "\begin{split}"): {\displaystyle \begin{split} \displaystyle S(h,e) &= {1 \over p(\neg e)} \left[ p(h|e) - p(h) \right] \\ \displaystyle &= {1 \over p(\neg e)} \left[ {p(e|h) \over p(e)} p(h) - p(h) \right] \\ \displaystyle &= {p(h) \over {p(e)p(\neg e)}} \left[ p(e|h) - p(e) \right] \\ \displaystyle &= {p(h) (1-p(e)) \over p(e)(1-p(e))} \\ \displaystyle &= {p(h) \over p(e)} \\ \displaystyle &\neq 0 \end{split}}
↑ 아래의 증명에 의하면 $l$ 은 ${\rm {D_{1}}}$ 을 만족시키지 못한다.
구문 분석 실패 (MathML을 사용하되 미지원 시 SVG나 PNG 사용 (최신 브라우저나 접근성 도구에 권장): "https://en.wikipedia.org/api/rest_v1/" 서버에서 잘못된 응답 ('Math extension cannot connect to Restbase.'):): {\displaystyle \begin{split} \displaystyle l(h,e) &= \log \left[ {p(e|h) \over p(e| \neg h)} \right] \\ \displaystyle &= \log \left[ p(e|h) {p(\neg h) \over p(e) - p(e|h)p(h) } \right] \\ \displaystyle &= \log \left[ p(e|h) {1-p(h) \over p(e) - p(e|h)p(h)} \right] \\ \displaystyle &\leq \log \left[ {1-p(h) \over p(e) - p(h)} \right] \\ \displaystyle &\to \log 1 = 0 \text{ (where } p(e) \to 1 ) \end{split}}
사실 이 결과는 $p(e)$ 가 $1$ 로 수렴할 때, $0<p(h)<1$ 인 조건 하에서 $p(e|h)$ 와 $p(e|\neg h)$ 모두 1에 수렴해야 한다는 원리에 의해 간단하게 추론될 수도 있다.
↑ 각주 7에서 보였듯이, $h$ 가 $e$ 를 함축하는 경우 $S(h,e)=p(h)/p(e)$ 가 된다. 이는 $D_{4}$ 를 위배하게 된다.
↑ 이에 대한 증명은 다음과 같다. $p(e|h)=1$ 인 경우로 한정시켜 보면,
구문 분석 실패 (알 수 없는 함수 "\begin{split}"): {\displaystyle \begin{split} \displaystyle \lim_{p(h) \to 0, p(e) \to 1} lN (h,e) &= \lim_{p(h) \to 0, p(e) \to 1} {1 \over p(\neg e) } \log \left[ {1-p(h) \over p(e) -p(h) } \right] \\ \displaystyle &= \lim_{p(\neg h) \to 1, p(\neg e) \to 0} {1 \over p(\neg e)} \log \left[ {p(\neg h) \over p(\neg h) - p(\neg e) } \right] \\ \displaystyle &= \lim_{p(\neg e) \to 0} {1 \over p(\neg e)} \log \left[ {1 \over 1-p(\neg e)} \right] \\ \displaystyle &= \lim_{x \to 0} {1 \over x} \log \left[ {1 \over 1-x} \right] \quad ( \text{where } x=p( \neg e))\\ \displaystyle &= \lim_{x \to 0} \log \left[ { 1 \over 1-x} \right]^{1 \over x} \\ \displaystyle &= \lim_{y \to \infty} \log \left[ {y \over y-1} \right]^y \quad \left( \text{where } y=1/x \right) \\ \displaystyle &= \lim_{z \to \infty} \log \left[ 1 + {1 \over z} \right]^{z+1} \quad (\text{where } z=y-1 ) \\ \displaystyle &= \lim_{z \to \infty} \log \left[ \left( 1 + {1 \over z} \right)^z \cdot \left( 1 + {1 \over z} \right) \right] \\ \displaystyle &= \log e \\ \displaystyle &= 1 \end{split}}
↑ 이 경우 $p(h|A)$ 는 $1$ 에 근접하게 된다.

Comments and Criticism: Measuring Confirmation and Evidence

목차

오래된 증거와 가설에 대한 지지

측정방식 $S$ 와 크리스텐슨의 회의적 결론에 대한 평가

주석

관련 항목

둘러보기 메뉴

검색

Comments and Criticism: Measuring Confirmation and Evidence

오래된 증거와 가설에 대한 지지

측정방식 S {\displaystyle S} 와 크리스텐슨의 회의적 결론에 대한 평가

주석

관련 항목

둘러보기 메뉴

검색

측정방식 $S$ 와 크리스텐슨의 회의적 결론에 대한 평가