"Signals: Evolution, Learning, & Information"의 두 판 사이의 차이

Signals: Evolution, Learning, & Information (원본 보기)

2025년 2월 10일 (월) 10:26 판

2,842 바이트 추가됨 , 2025년 2월 10일 (월) 10:26

→‎9. 신호 게임의 일반화 : 동의어, 병목 등

Zolaist

사무관, 인터페이스 관리자, 관리자

편집

1,153

번

@@ 21번째 줄: / 21번째 줄: @@
 == 9. 신호 게임의 일반화 : 동의어, 병목 등 ==
-이 장에서 스컴스는 송신사-수신자 신호 게임의 상태, 행위, 신호의 수가 같은 특수한 경우를 넘어서는 일반화를 시도한다. 상태가 신호/행위에 비해 많거나, 신호의 개수가 상태/행위에 비해 너무 적거나 많은 경우에는 어떤 일이 벌어질까? 일단, 적절한 상태-행위에 따라 송신자와 수신자가 받는 보상이 같다는 조건은 유지한다
+이 장에서 스컴스는 송신사-수신자 신호 게임의 상태, 행위, 신호의 수가 같은 특수한 경우를 넘어서는 일반화를 시도한다. 상태가 신호/행위에 비해 많거나, 신호의 개수가 상태/행위에 비해 너무 적거나 많은 경우에는 어떤 일이 벌어질까? (일단, 적절한 상태-행위에 따라 송신자와 수신자가 받는 보상이 같다는 조건은 유지한다.) 결론만 말하자면, (1) 상태가 많은 경우, (하나의 신호가 여러 상태에 대한 정보를 전달하는) 범주 체계가 형성되고, (2) 신호가 많은 경우, (여러 신호가 하나의 상태에 대한 정보를 전달하는) 동의어가 만들어지고, (3) 신호가 적은 경우, 병목이 발생함에 따라 (여러 상태와 행위가 하나의 신호로 매개되는) 범주 체계가 형성된다.
 [[파일:상태가 많은 신호 체계.jpg|섬네일|신호 및 행위보다 상태가 많은 경우, 하나의 신호가 여러 상태를 전달하는 범주 체계가 형성된다.]]
-'''상태가 많은 경우 :''' 상태 3개, 신호 2개, 행위 2개로 이루어진 게임을 가정하자. (1) 3번 상태에 대해 확실히 더 나은 행위가 있는 경우, 진화적으로 안정적인 전략(ESS)은 하나의 신호가 두 개의 상태를 마치 하나의 상태처럼 취급하는 것이다. (2) 3번 상태에 대해 더 나은 행위가 없는 경우, 진화적으로 안정적인 전략은 없다. (3) 3번 상태에 대한 두 행위의 보상에 약간의 차이가 있는 경우, 이 경우에도 진화적으로 안정적인 전략은 하나의 신호가 두 개의 상태를 마치 하나의 상태처럼 취급하는 것이다. 결국, 일반화하면, 상태가 많은 신호 체계에서, 신호 체계는 상태들의 분할하게 되고, 결국 범주 체계를 만들어낸다.
+'''(1) 상태가 많은 경우 :''' 상태 3개, 신호 2개, 행위 2개로 이루어진 게임을 가정하자. 1번 상태는 1번 행위로만 보상받고, 2번 상태는 2번 행위로만 보상받는다고 하자. 이때 3번 상태에 대해 더 나은 행위가 없는 경우, 3번 상태에 대해서는 무엇이든 허용된다. 그러나 3번 상태에 대해, 1번 행위에 따른 보상이 2번 행위에 따른 보상보다 조금이라도 높다면, 이때의 진화적으로 안정적인 전략은 1번 신호가 1,3번 상태를 마치 하나의 상태처럼 취급하는 것이다. 결국, 일반화하면, 상태가 많은 신호 체계에서, 신호 체계는 하나의 신호가 여러 상태에 대한 정보를 전달하는 범주 체계를 만들어낸다.
-신호가 많은 경우 :
+'''(2) 신호가 많은 경우 :''' 여러 신호가 하나의 상태에 대한 정보를 전달하는 동의어가 만들어진다. 이때, 신호 분배 비율은 임의적이다. (물론 상태에 대한 송신자의 신호가 하나씩 정해지는 경우도 가능하다. 이때 수신자는 나머지 한 신호에 대한 다양한 행위 성향을 가질 수 있지만, 이러한 행위 성향은 발현되지 않는다.) 신호가 많은 경우, 최종적으로 어떤 체계를 얻게 될지 평형 분석은 답해주지 않는다. 이는 동역학적으로만 답해질 수 있으며, 즉 그 답은 초기 조건과 동역학적 법칙에 의존한다. 강화 학습이 이용된다면? '''혹시 강화 학습이 동의어를 제거하지 않을까? No.''' '''동의어는 형성되고 계속 유지된다.''' 다른 동역학 모형에서는 다른 결과가 나올 수 있지만, 이에 대한 완전한 분석은 아직 이루어지지 않았다.
+[[파일:상태-행위 보상의 사례.jpg|섬네일|3개의 상태와 3개의 행위 각각에 대한 보상들. 각 상태마다 최적의 행위가 있기 때문에, 3개의 신호가 있다면, 각 행위와 상태를 1:!로 매개해줄 수 있었을 것이다.]]
-신호가 적은 경우 :
+'''(3) 신호가 적은 경우 :''' 신호가 상태와 행위를 매개하기에 적은 경우, 이는 정보적 병목의 경우이다. 병목은 준-최적의 진화적 안정 전략을 만들어낼 수 있다. 상태와 행위에 따른 보상이 다음의 표와 같다고 가정하고, 세 상태는 동일한 확률로 발생한다고 한다고 가정하자. 세 개의 신호가 있을 경우, 세 상태는 세 신호를 통해 세 행위와 매개될 수 있다. 그러나 2개의 신호만 있다면 어떤 신호 체계가 만들어질까? 한 가지 가능한 결과는 1,2번 상태가 하나의 신호를 통해 1번 행위와 매개되고, 3번 상태가 다른 하나의 신호를 통해 3번 행위와 매개되는 것으로, 꽤 괜찮은 (평균 보상 7의) 진화적 안정 전략이다. 그러나 다른 ESS도 있다. 1번 상태가 하나의 신호를 통해 1번 행위와 매개되고, 2,3번 상태는 다른 하나의 신호를 통해 2번 행위와 매개된는 것으로, 이는 평균 보상 6의 준-최적의 전략이다. 이러한 두 가지 평형은 신호 체계가 세계를 범주화하는 두 가지 방식을 표상하며, 이는 범주 체계가 항상 최적 상태로 진화하진 않을 수 있음을 보여준다.
 범주 체계
 . 새 신호의 발명