"From Deep Learning to Rational Machines/Imagination"의 두 판 사이의 차이

PhiLoSci Wiki
둘러보기로 가기 검색하러 가기
(새 문서: Cameron J. Buckner, ''From Deep Learning to Rational Machines: What the History of Philosophy Can Teach Us about the Future of Artificial Intelligence''. Oxford University Press, Ch....)
 
26번째 줄: 26번째 줄:
책 전반의 논제 : 마음이 명시적 추론에서 개별 범주 표본을 의식적으로 표상하고, 변형된 범주 매니폴드 형태로 로크적 일반 관념과 같은 것을 무의식적으로 표상한다.
책 전반의 논제 : 마음이 명시적 추론에서 개별 범주 표본을 의식적으로 표상하고, 변형된 범주 매니폴드 형태로 로크적 일반 관념과 같은 것을 무의식적으로 표상한다.


우리 또는 인공 모델은 어떻게 새로운 (구체적인) 관념을 합성할 수 있는가? 이는 추상화와 반대 방향의 과정으로, "변형된 범주 매니폴드"에서 "완전한 렌더링된 특정 항목"으로 돌아가는 과정, 일반적인 범주 표상에서 특정한 관념으로 돌아가는 과정이다.
우리 또는 인공 모델은 어떻게 새로운 (구체적인) 관념을 합성할 수 있는가? 이는 추상화와 반대 방향의 과정으로, "변형된 범주 매니폴드"에서 "완전한 렌더링된 특정 항목"으로 돌아가는 과정, 일반적인 범주 표상에서 특정한 관념으로 돌아가는 과정이다. 이를 위해 버크너는 적대적 생성 신경망에서부터 시작한다.


생성적 적대 신경망(GAN) : 생성망 + 판정망
적대적 생성 신경망(GAN : 생성 신경망 + 판별 신경망) : 생성 신경망이 가짜 입력을 만들고, 생성 신경망은 그것이 진짜인지 가짜인지 판별함으로써, 생성 신경망 훈련시킨다. 그러면 GAN은 어떤 구조로 구체적인 가짜 입력을 만들어내고, 진짜 같은 가짜를 만들어내는 데 성공할 수 있을까?
 
생성 신경망은 기본적으로 DCNN과 유사하지만, 첫째, GAN의 입력은 (DCNN의 고차원 정보와 반대로) 저차원의 특징 공간(잠재 공간이라 부름)의 벡터이며, GAN의 작동 과정은 (DCNN의 합성과 풀링의 반대로) 전치 합성곱과 언풀링으로 이루어지며, 이를 통해 생성 신경망은 저차원의 잠재 공간 벡터로부터 고해상도의 표본을 생성한다. 물론 처음에는 엉터리 표본을 생성하지만,판별 신경망의 판별 결과에 따른 훈련을 통해, 생성 신경망은 잠재 공간의 의미있는 특징들에 대한 풍부한 정보들을 활용할 수 있는 방식으로 진화하여, 판별 신경망을 속일 수 있는 표본을 생성하게 된다. 이를 위해 생성 신경망은 잠재 공간을 효율적으로 그룹화하는 방법을 학습해야 하며, 입력의 차원이 출력의 차원보다 작으므로, 생성 신경망은 판별 신경망의 영역에서 가장 넓은 범위의 분산을 설명하는 소수의 잠재 공간 차원으로 특징 공간을 압축하는 방법을 학습해야 하며, 잠재 공간 벡터에 명시되지 않은 일부 세부 사항을 그럴듯한 값으로 채워야 한다. 이 그럴듯한 추정치 역시 적대적 훈련 과정을 통해 점진적으로 조정된다.


[[분류:과학철학]]
[[분류:과학철학]]

2024년 6월 25일 (화) 13:50 판

Cameron J. Buckner, From Deep Learning to Rational Machines: What the History of Philosophy Can Teach Us about the Future of Artificial Intelligence. Oxford University Press, Ch. 5.

경험한 적이 없는 새로운 표상을 산출하는 상상력은 경험주의적 접근에 큰 도전이었다. 흄은 연합 법칙 등을 이용해 상상력에 대해 꽤 많은 얘기를 했지만, 포더는 이에 만족하지 않았다. 버크너는 흄에 대한 포더의 반론들을 검토하면서, 딥러닝의 "생성" 모델들의 성공이 경험주의의 난점들을 해결해줄 수 있음을 보이고자 한다.

포더의 비판

연합주의에 대한 포더의 비판

첫째, 구체적 표상의 합성 문제 : 흄의 세 가지 연합 법칙(근접성, 유사성, 인과성)만으로는 구체적인 관념 토큰을 합성할 수 있는 능력을 설명하지 못한다. 엽합 법칙은 어떤 유형의 관념이 어떤 상황에서 호출되어야 하는지 말해주지만, 그 유형의 토큰이 어떻게 생성되는지 설명하지 않는다. 이를 위해 흄은 일반 범주의 적절하고 대표적인 표본(토큰)을 합성하는 능력이 필요하다고 말하지만, 그런 능력이 어떻게 작동하는지, 그러한 능력의 개인차가 왜 생겨나는지 설명하지 못하고 있다. 딥러닝은 바로 일반 범주의 적절한 토큰을 합성하는 능력에 대해 설명할 수 있을까?

둘째, 사고의 생산성 문제 : 경험주의적 마음은 과거에 한 번도 경험해 본 적 없는 새로운 복합 관념을 어떻게 형성할 수 있는가? 포더는 경험을 통해 획득한 관념의 분해와 자유로운 재합성에 호소하는 흄의 설명이 겉보기에만 훌륭할 뿐, 세부사항이 없는 빈 설명이라고 불평한다.

셋째, 사고 간의 인과적 관계와 의도적 관계 구별하기의 문제 : 흄은 연합된 이미지는 경험에서 복사된 것이 아니라 상상력에 의해 종합된 것이며, 그 연합된 이미지의 강도를 통해 신뢰성을 검토한다고 얘기한 바 있는데, 이는 오늘날의 확률적 추론에 대한 휴리스틱 접근의 전신이라 할 수 있다.

흄의 상상력 설명에 대한 포더의 비판

첫째, 흄은 상상력의 작동을 설명하지 않는다. 흄은 상상력의 "모방적" 모드와 "생산적" 모드를 구분했고, "생산적" 모드에 대해 흄은 "관념 간의 쉬운 전환을 통해 결합을 형성하거나 전체를 완성하여 쾌락을 얻으려 한다", "노 젓는 배처럼 움직이기 시작하면, 그 객체들 사이의 일관성을 관찰하는 일련의 과정을 계속하며, 자연스럽게 일관성을 가능한 한 완벽하게 만들 때까지 계속된다", "다른 배경 세부 사항을 채워 넣어 명백한 모순을 완화하고 복합체를 더 그럴듯하게 만들기 위해" 노력한다는 점을 지적하며, 연합 원리의 제약 하에서 일관된 전체를 완성하려는 경향 및 그로 인한 쾌락을 지적한 바 있으며, 상상력에 대한 이러한 흄의 특성화는 오늘날 신경망 모델의 작동 원리인 "이전 경험을 바탕으로 주관적 확률을 최대화하는 방식으로 패턴을 재구성하려는 경향"과 직결된다. 따라서 포더의 비판은 다소 지나치다.

둘째, 상상력에 대한 흄의 설명이 모종의 순환이나 퇴행에 빠진다. 흄에 따르면 인간의 사고와 추론은 상상력에 의존하며, 이 상상력은 일반적 관념 대신 구체적 관념들 사이의 유사성을 고려한다. 그러나 상상력은 어떻게 무한한 유사성 중에서 어느 하나에 집중할 수 있는가? 예를 들어, 형태와 색상의 개념을 가지고 있지 않다면, 어떻게 우리는 흰 공과 검은 공이 형태는 유사하지만, 색상은 다르다고 인식할 수 있겠는가? 이러한 포더의 비판은 상상력에 대한 흄의 설명에 로크적 추상적 관념의 재도입할 필요성을 보여주며, 그것이 시스템 내에서 어떻게 구현될 수 있을지에 대한 현대적인 설명이 필요하다.

셋째, 새로운 복합 관념을 결합하는 접착제는 무엇인가? 이에 답하기 위해 버크너는 흄이 상상력에 귀속시킨 "완성주의" 원칙과 관련이 있다고 제안하려고 한다. 이 문제는 결국 딥페이크와 같은 그럴듯한 인공 표상을 생성하는 시스템을 만들어낼 때 직면하는 문제와 정확히 일치한다.

생물학적 타당성에 대한 주의사항 : 인공 모델이 생물학적 구조와 정확히 일치한다는 보장은 없으며, 기능주의를 채택하면 정확한 구조적 대응이 없다는 점이 별 문제가 안 될 수도 있다. 그럼에도 인공 모델과 생물학적 뇌는 다음과 같은 유사성이 있을 수 있다. (1) 계층적으로 구조화되고 추상화된 정보의 필요성 (2) 이전 경험에서 파생된 배경 확률 가정을 바탕으로 한 표상 구조의 새로운 결합의 가능성. 결국 인공 모델은 경험주의적 방식과 유사한 방식으로 추론과 표상의 문제를 해결할 수 있다는 "개념 증명"으로 작용할 것.

인공 모델의 상상력

책 전반의 논제 : 마음이 명시적 추론에서 개별 범주 표본을 의식적으로 표상하고, 변형된 범주 매니폴드 형태로 로크적 일반 관념과 같은 것을 무의식적으로 표상한다.

우리 또는 인공 모델은 어떻게 새로운 (구체적인) 관념을 합성할 수 있는가? 이는 추상화와 반대 방향의 과정으로, "변형된 범주 매니폴드"에서 "완전한 렌더링된 특정 항목"으로 돌아가는 과정, 일반적인 범주 표상에서 특정한 관념으로 돌아가는 과정이다. 이를 위해 버크너는 적대적 생성 신경망에서부터 시작한다.

적대적 생성 신경망(GAN : 생성 신경망 + 판별 신경망) : 생성 신경망이 가짜 입력을 만들고, 생성 신경망은 그것이 진짜인지 가짜인지 판별함으로써, 생성 신경망 훈련시킨다. 그러면 GAN은 어떤 구조로 구체적인 가짜 입력을 만들어내고, 진짜 같은 가짜를 만들어내는 데 성공할 수 있을까?

생성 신경망은 기본적으로 DCNN과 유사하지만, 첫째, GAN의 입력은 (DCNN의 고차원 정보와 반대로) 저차원의 특징 공간(잠재 공간이라 부름)의 벡터이며, GAN의 작동 과정은 (DCNN의 합성과 풀링의 반대로) 전치 합성곱과 언풀링으로 이루어지며, 이를 통해 생성 신경망은 저차원의 잠재 공간 벡터로부터 고해상도의 표본을 생성한다. 물론 처음에는 엉터리 표본을 생성하지만,판별 신경망의 판별 결과에 따른 훈련을 통해, 생성 신경망은 잠재 공간의 의미있는 특징들에 대한 풍부한 정보들을 활용할 수 있는 방식으로 진화하여, 판별 신경망을 속일 수 있는 표본을 생성하게 된다. 이를 위해 생성 신경망은 잠재 공간을 효율적으로 그룹화하는 방법을 학습해야 하며, 입력의 차원이 출력의 차원보다 작으므로, 생성 신경망은 판별 신경망의 영역에서 가장 넓은 범위의 분산을 설명하는 소수의 잠재 공간 차원으로 특징 공간을 압축하는 방법을 학습해야 하며, 잠재 공간 벡터에 명시되지 않은 일부 세부 사항을 그럴듯한 값으로 채워야 한다. 이 그럴듯한 추정치 역시 적대적 훈련 과정을 통해 점진적으로 조정된다.