2017년 11월 4일 토요일

더치북 논증 이해하기:어떻게 믿음의 정도를 확률로 표현할 수 있는가?

※ 일러두기
좀 더 정교하고 제대로 된 설명을 원한다면, 스탠포드철학백과사전의 "Dutch Book Argument(https://plato.stanford.edu/entries/dutch-book/)"를 참고할 것. 지금 올리는 내용은 예전에 도저히 더치북 논증이 이해되지 않아, 어떻게든 이해하려고 했던 고난의 흔적이다. ≪붉은털 원숭이도 이해할 수 있는 더치북 정리≫.

더치북 논증 이해하기

과학방법론자 중 매우 큰 비중을 차지하는 확률주의자(Probabilist)들은 행위자의 합리적 믿음의 정도는 확률 공리를 만족하여야 한다고 여긴다. 오해를 무릅쓰고 쉽게 말하자면 확률은 어떤 행위자의 합리적 믿음의 정도를 뜻한다. 일단 이러한 주장에 동의하건 동의하지 않건, 왜 그렇게 이야기 할 수 있는지 알아볼 필요는 있다. 나야 처음에는 이에 동의하지 않았지만, '확률'이라는 용어가 사용되는 어떤 맥락에서는 확률이 사실 믿음의 정도를 뜻한다고 해도 될 것 같다는 생각이 든다.

행위자의 합리적 믿음의 정도가 확률 공리를 만족하여야 한다는 점을 보여주기 위하여, 확률주의자들이 제시하는 논증이 바로 더치북 논증(Dutch Book Argument)이다. 그렇다면 더치북 논증은 어떻게 합리적 믿음의 정도를 확률과 연결하나? 여기서 확률주의자들은 "행위자가 합리적이라면 자신이 확실히 손해를 보는 행위를 피하려 한다"는, 많은 사람들이 쉽게 받아들일 수 있는 가정으로부터 출발한다. 다시 말해 당신이 도박판에 끼어들었는데, 결과가 어떻게 나오건 무조건 손해를 보는 게임을 한다면 당신은 비합리적이라는 것이다. 이를테면 어떤 동전 던지기 게임을 하는데 앞면이 나오면 당신이 10만원을 잃고, 뒷면이 나오면 당신이 5만원을 잃는 게임이라고 하자.[1] 그렇다면 당신은 그 게임을 하겠는가? 이러한 게임을 계속한다면 당신은 비합리적이라 할 수 있다. 이제 이러한 전제에 동의한다면(동의하지 않는다고 해도 일단 동의나 해 보자) 본격적으로 게임을 시작해 보자.

이 게임은 도박은 도박인데, 현실의 도박과는 전제가 좀 다르다. 적어도 나는 이 점 때문에 자주 실수를 범했다.

1) 일단 이 게임에는 게임을 설계하고 제안하는 부키(bookie, 도박업자)와 게임 참가자(행위자)가 있다.
2) 이 부키는 능수능란하여 도박을 언제나 자신에게 유리하게 만들고자 한다. 그리고 이 부키는 내기에 대한 상금(stake)의 크기를 결정할 수 있다.
3) 게임 참가자는 자신이 생각하는 승률에 맞게 돈을 걸 수 있음. 좀 더 정확하게 말하자면 공정한 내기의 가격을 게임 참가자가 결정할 수 있다. 그리고 이러한 가격 아래에서만 게임 참가자는 실제로 내기에 참여하거나 참여하려는 의지를 지닌다.
- 공정한 가격을 결정했기 때문에 게임(내기)를 사는 것과 파는 것 사이에는 이익의 차이가 없다. 따라서 게임을 사고 파는 것에 대해 참가자는 무관심하다.
4) 이렇게 승률이 결정되면 부키는 게임을 살 수도 있고 참가자에게 팔 수도 있다. 이 경우 참가자는 부키의 결정을 따라야 한다(강매!) 그 다음 진짜 게임이 진행되고 정산이 이루어진다. 덧붙여 부키는 게임 상황에 대해 참가자보다 많은 정보를 가지고 있지 않다. 이를테면 이 게임의 결과를 미리 알지 못한다.

※ 이 상황에서 참가자가 결과에 관계없이 언제나 손해를 보는 경우가 생기면, 그 참가자는 비합리적으로 승률을 결정한 것이 된다.



게임에서 논의되는 어떤 명제 A가 있다고 하자. 이 명제는 "주사위의 다음 번 눈은 1이다", "내일 비가 내린다"와 같은 것들이 될 수 있겠다.
그리고 A가 참이면 S원을 받는다고 하자.
이제 참가자가 A의 승률을 r이라 생각하고 ¬A(not-A)의 승률을 (1-r)이라 생각한다면 A의 참에 rS원을 걸겠지? 이를테면 상금(S)가 만원이고, 참가자가 승률을 40%라 믿는다면 4천원을 쓴다는 소리다. 일단 이때 r의 범위는 다음과 같다. 0≤r≤1.

이제 이를 바탕으로 손익표를 그려보자.

bet on Abet against A
A -rS+S = (1-r)S rS-S = -(1-r)S
¬A -rS rS

일단 부키가 이 게임을 산다고 하자.[2] 즉 참가자는 A가 나오면 상금을 받는다(bet on A).

 A가 나오면 부키는 (1-r)S원을 참가자에게 지불한다.[3] 따라서 참가자의 이익은 (1-r)S원.
 ¬A가 나오면 부키는 rS원을 참가자에게 받는다. 따라서 참가자의 이익은 -rS원.

다음으로 부키가 게임을 팔 수도 있다. 즉 참가자는 A가 나오면 상금을 부키에게 주어야 한다.(bet against A).

 A가 나오면 부키는 (1-r)S원을 참가자에게 받는다. 따라서 참가자의 이익은 -(1-r)S원.
 ¬A가 나오면 부키는 rS원을 참가자에게 지불한다. 따라서 참가자의 이익은 rS원.

이 게임에서 참가자는 부키가 게임을 사거나 참가자에게 판매했을 때, 어느 쪽이건 이익을 얻을 수 있는 길이 열려 있다. 혹은 부키가 게임을 산다고 해서 참가자의 손해가 확정되거나 부키가 게임을 판다고 해서 손해가 확정되는 것이 아니다. 손해 여부는 부키의 선택이 아닌 세계의 상태, 다시 말해 A이냐 ¬A이냐에 달려있다. 따라서 이 게임은 (최소한의 정도로) 공정하다.

그런데 만약 행위자가 부키의 선택에 의해 항상 손해를 보는 경우가 생긴다면 어떻게 될까? 이렇게 항상 손해를 보는 경우가 생기면, "더치북이 구성되었다"고 말한다. 이제 어떻게 더치북이 구성되는지 알아보자.

CASE 1
참가자가 r<0이라고 믿는다고 하자. 현실적으로 좀 이상한 가정이지만 일단 그렇다고 하자. 앞에서 등장한 표를 소환하면,






bet on Abet against A
A (1-r)S -(1-r)S
¬A -rS rS

이 상황에서 부키가 게임을 산다고(bet on A) 하자.
 A가 나오면 부키는 (1-r)S원을 참가자에게 지불 |참가자의 이익은 (1-r)S원>0
 ¬A가 나오면 부키는 rS원을 참가자에게 받음 |참가자의 이익은 -rS원>0

다음으로 부키가 게임을 팔 수도 있다(bet against A). 이러면,
 A가 나오면 부키는 (1-r)S원을 참가자에게 받음 |참가자의 이익은 -(1-r)S원<0  ¬A가 나오면 부키는 rS원을 참가자에게 지불 |참가자의 이익은 rS원<0 이와같은 상황에서 능수능란한 부키는 참가자에게 게임을 판매하여 참가자를 호구로 만들 수 있다.
다시 말해 세계의 상태, 혹은 A의 참/거짓 여부와 무관하게 무조건 손실을 보는 경우가 생긴다.
이 경우 더치북이 구성된다고 말한다.

다음으로 참가자가 r>1이라고 믿는다고 하자. 역시 현실적으로는 좀 이상한 가정이지만 그렇다고 하자.

이 상황에서 부키가 게임을 사고 난 이후(bet on A),

 A가 나오면 부키는 (1-r)S원을 참가자에게 지불 |참가자의 이익은 (1-r)S원<0  ¬A가 나오면 부키는 rS원을 참가자에게 받음 |참가자의 이익은 -rS원<0 다음으로 부키가 게임을 팔 수도 있다. 이러면(bet against A),  A가 나오면 부키는 (1-r)S원을 참가자에게 받음 |참가자의 이익은 -(1-r)S원>0

 ¬A가 나오면 부키는 rS원을 참가자에게 지불 |참가자의 이익은 rS원>0


그렇다면 부키는 참가자에게 게임을 사버려 참가자를 호구로 만들 수 있다.
이 경우에도 더치북이 구성됨!

그렇기에 참가자가 생각하는 합리적 승률은 0≤r≤1이어야 한다.
만약 이 승률이 참가자 개인의 합리적 믿음의 정도, 혹은 합리적 신뢰도라고 한다면, 이 합리적 믿음의 정도는 다음의 확률 공리를 따른다고 볼 수 있다.

(1) 0≤p(A)≤1


CASE 2
다음으로 A가 필연적 참이라고 하자. 그런데 이때 r<1이라고 믿는다면 무슨 문제가 생길까? 이 상황에서 부키가 게임을 사고 난 이후(bet on A), 0≤r<1이라고 믿고 내기에 참가한 경우에는  A가 나오면 부키는 (1-r)S원을 참가자에게 지불 |참가자의 이익은 (1-r)S원>0

 ¬A가 나오면 부키는 rS원을 참가자에게 받음 |참가자의 이익은 -rS원<0 r<0이라고 믿고 내기에 참가한 경우에는  A가 나오면 부키는 (1-r)S원을 참가자에게 지불 |참가자의 이익은 (1-r)S원>0

 ¬A가 나오면 부키는 rS원을 참가자에게 받음 |참가자의 이익은 -rS원>0



다음으로 부키가 게임을 팔 수도 있다(bet against A). 이러면,


0≤r<1이라고 믿고 내기에 참가한 경우에는  A가 나오면 부키는 (1-r)S원을 참가자에게 받음 |참가자의 이익은 -(1-r)S원<0

 ¬A가 나오면 부키는 rS원을 참가자에게 지불 |참가자의 이익은 rS원>0


r<0이라고 믿고 내기에 참가한 경우에는  A가 나오면 부키는 (1-r)S원을 참가자에게 받음 |참가자의 이익은 -(1-r)S원<0

 ¬A가 나오면 부키는 rS원을 참가자에게 지불 |참가자의 이익은 rS원<0 그런데 A가 필연적 참이므로 고려해야할 것은 위에 진하게 표시된 경우이다. 이러면 부키는 게임을 참가자에게 팔아, 참가자를 필연적인 호구로 만들 수 있다.

그렇기에
 A가 필연적으로 참이면, 참가자가 생각하는 합리적 승률은 r=1이어야 한다.
 A가 필연적으로 거짓이면, 참가자가 생각하는 합리적 승률은 r=0이어야 한다.
 만약 이 승률이 참가자 개인의 합리적 믿음의 정도, 혹은 합리적 신뢰도라고 한다면, 이 합리적 믿음의 정도는 다음의 확률 공리를 따른다고 볼 수 있다.


(2) A가 동어반복적이면 p(A)=1
(2') A가 필연적 참이면 p(A)=1
※ A가 모순, 혹은 필연적으로 거짓이라면 p(¬A)=1로 간주할 수 있다.


CASE 3

이제 좀 더 복잡한 사례다.
서로 양립불가능한 A와 B에 대한 더치북 구성이다.

일단 우리의 부키 선생은 참가자에게 다음의 두 게임에 참가할 것을 제안하고, 예비 호구인 참가자 선생 역시 게임에 참가하기로 결정한다.

이제 이 두 게임이 어떤 것이냐?

1) 첫 번째 게임
A가 참이면 S원을 받고, B가 참이어도 S원을 받는 게임.

  A 의 승률을 r1이라 믿으면 ¬A의 승률은 (1-r1)
  B 의 승률을 r2라 믿으면 ¬B의 승률은 (1-r2)
  이러면 각각에 대해 r1S원, r2원을 걸겠지?

단, 0≤r1≤1, 0≤r2≤1, 0≤r1+r2≤1(위에서 이것들은 이미 보여준 내용)
  A&B인 경우는 없으니 다음의 세 경우만 고려합시다!


 


[1] bet on A 또는 B


[2] bet against A 또는 B


A & ¬B


-r1S -r2S +S=(1-r1-r2)S


r1S +r2S -S=-(1-r1-r2)S


¬A & B


-r1S -r2S +S=(1-r1-r2)S


r1S +r2S -S=-(1-r1-r2)S


¬A & ¬B


-r1S -r2S=-(r1+r2)S


+r1S +r2S=(r1+r2)S


2) 두번째 게임

A∨B가 참이면 S원 받는 그러한 게임[4]

  이제 A∨B의 승률을 r이라고 하면, ¬(A∨B)의 승률은 (1-r) 단, 0≤r≤1(이미 보여준 바와 같이)
  역시 A∨B의 승률이 r일 때 상금표를 구성해 보자.


 


[3]bet on A∨B


[4]bet against A∨B


A & ¬B


(1-r)S


-(1-r)S


¬A & B


(1-r)S


-(1-r)S


¬A & ¬B


-rS


rS


OK, OK 여기까지는 문제가 아니다.

이 상태에서 이제 r<r1+r2 라고 참가자가 생각한다면 어떻게 되겠나?


이제 모든 가능한 경우들을 하나씩 검토해 보자.
이 두 게임의 조합에서 부키의 선택지는 이럴 겁니다.

  첫 번째 게임도 사고 두 번째 게임도 사고 [1]-[3]
  첫 번째 게임은 사고 두 번째 게임은 팔고 [1]-[4]
  첫 번째 게임은 팔고 두 번째 게임은 사고 [2]-[3]
  첫 번째 게임도 팔고 두 번째 게임도 팔고 [2]-[4]


이제 각각에 대해서 분석하면

[1]-[3] 두 게임 다 사는 경우

[1]A&¬B가 나오면 부키는 (1-r1-r2)S원을 참가자에게 지불         참가자의 이익은 (1-r1-r2)S원

[3]A&¬B가 나오면 부키는 (1-r)S원을 참가자에게 지불           고로 참가자의 이익은 (1-r)S원


   참가자 총이익은(1-r1-r2+1-r)S원


[1]¬A&B가 나오면 부키는 (1-r1-r2)S원을 참가자에게 지불        고로 참가자의 이익은 (1-r1-r2)S원

[3]¬A&B가 나오면 부키는 (1-r)S원을 참가자에게 지불            고로 참가자의 이익은 (1-r)S원


   참가자 총이익은(1-r1-r2+1-r)S원


[1]¬A&¬B가 나오면 부키는 (r1+r2)S원을 참가자에게 받음         고로 참가자의 이익은 -(r1+r2)S원

[3]¬A&¬B가 나오면 부키는 (r)S원을 참가자에게 받음             고로 참가자의 이익은 -rS원


   고로 참가자 총이익은(-r1-r2-r)S원




[1]-[4] 첫 게임은 사고 두 번째 게임을 파는 경우

[1]A&¬B가 나오면 부키는 (1-r1-r2)S원을 참가자에게 지불         참가자의 이익은 (1-r1-r2)S원

[4]A&¬B가 나오면 부키는 (1-r)S원을 참가자에게 받음           참가자의 이익은 -(1-r)S원


   고로 참가자 총이익은(1-r1-r2-1+r)S원


[1]¬A&B가 나오면 부키는 (1-r1-r2)S원을 참가자에게 지불        참가자의 이익은 (1-r1-r2)S원

[4]¬A&B가 나오면 부키는 (1-r)S원을 참가자에게 받음            참가자의 이익은 -(1-r)S원


   고로 참가자 총이익은(1-r1-r2-1+r)S원


[1]¬A&¬B가 나오면 부키는 (r1+r2)S원을 참가자에게 받음         참가자의 이익은 -(r1+r2)S원

[4]¬A&¬B가 나오면 부키는 rS원을 참가자에게 지불              참가자의 이익은 rS원


   고로 참가자 총이익은(-r1-r2+r)S원




[2]-[3] 첫 게임은 팔고 두 번째 게임을 사는 경우

[2]A&¬B가 나오면 부키는 (1-r1-r2)S원을 참가자에게 받음         참가자의 이익은 -(1-r1-r2)S원

[3]A&¬B가 나오면 부키는 (1-r)S원을 참가자에게 지불           참가자의 이익은 (1-r)S원


   고로 참가자 총이익은(-1+r1+r2+1-r)S원


[2]¬A&B가 나오면 부키는 (1-r1-r2)S원을 참가자에게 받음        참가자의 이익은 -(1-r1-r2)S원

[3]¬A&B가 나오면 부키는 (1-r)S원을 참가자에게 지불            참가자의 이익은 (1-r)S원


   고로 참가자 총이익은(-1+r1+r2+1-r)S원


[2]¬A&¬B가 나오면 부키는 (r1+r2)S원을 참가자에게 지불         참가자의 이익은 (r1+r2)S원

[3]¬A&¬B가 나오면 부키는 (r)S원을 참가자에게 받음             참가자의 이익은 -rS원


   고로 참가자 총이익은(r1+r2-r)S원



……아 계산하기 귀찮다. 그래도 계속 진행하자.

[2]-[4] 첫 게임은 팔고 두 번째 게임도 파는 경우

[2]A&¬B가 나오면 부키는 (1-r1-r2)S원을 참가자에게 받음         참가자의 이익은 -(1-r1-r2)S원

[4]A&¬B가 나오면 부키는 (1-r)S원을 참가자에게 받음           참가자의 이익은 -(1-r)S원


   고로 참가자 총이익은(-1+r1+r2-1+r)S원


[2]¬A&B가 나오면 부키는 (1-r1-r2)S원을 참가자에게 받음        참가자의 이익은 -(1-r1-r2)S원

[4]¬A&B가 나오면 부키는 (1-r)S원을 참가자에게 받음            참가자의 이익은 -(1-r)S원


   고로 참가자 총이익은(-1+r1+r2-1+r)S원


[2]¬A&¬B가 나오면 부키는 (r1+r2)S원을 참가자에게 지불         참가자의 이익은 (r1+r2)S원

[4]¬A&¬B가 나오면 부키는 rS원을 참가자에게 지불              참가자의 이익은 rS원


   고로 참가자 총이익은(r1+r2+r)S원



이제 참가자가 r<r1+r2라고 믿는다면 무슨 일이 벌어지나?

[1]-[3]

A&¬B: 참가자 이익은 (1-r1-r2+1-r)S={2-(r1+r2+r)}S원≥0

¬A&B: 참가자 이익은 (1-r1-r2-1+r)S={2-(r1+r2+r)}원≥0

¬A&¬B: 참가자 이익은 (-r1-r2-r)S=-(r1+r2+r)S원<0


A와 B의 참 여부에 따라 이익-손실이 갈린다.

[1]-[4]

A&¬B: 참가자 이익은(1-r1-r2-1+r)S={r-(r1+r2)}S원<0

¬A&B: 참가자 이익은(1-r1-r2-1+r)S={r-(r1+r2)}S원<0

¬A&¬B: 참가자 이익은(-r1-r2+r)S={r-(r1+r2)}S원<0

A와 B의 참 여부에 관계없이 무조건 손실

[2]-[3]

A&¬B: 참가자 이익은(-1+r1+r2+1-r)S={(r1+r2)-r}원>0

¬A&B: 참가자 이익은(-1+r1+r2+1-r)S={(r1+r2)-r}원>0

¬A&¬B:참가자 이익은(r1+r2-r)S원={(r1+r2)-r}원>0

A와 B의 참 여부와 관계없이 이익

[2]-[4]

A&¬B: 참가자 이익은(-1+r1+r2-1+r)S={(r1+r2+r)-2}S원<0

¬A&B: 참가자 이익은(-1+r1+r2-1+r)S={(r1+r2+r)-2}S원<0

¬A&¬B: 참가자 이익은(r1+r2+r)S원>0

A와 B의 참 여부에 따라 이익-손실이 갈림



여기서 부키는 [1]-[4]를 선택해서 참가자를 호구로 만들 수 있다.

만약 참가자가 r>r1+r2라고 생각한다면, [2]-[3]을 선택해서 참가자를 호구로 만든다.

결국 참가자는 r=r1+r2라고 생각해야 함.



만약 이 승률이 참가자 개인의 합리적 믿음의 정도, 혹은 합리적 신뢰도라고 한다면, 이 합리적 믿음의 정도는 다음의 확률 공리를 따른다고 볼 수 있다.


A와 B가 양립불가능하다면,

[3] p(A∨B)=p(A)+p(B)



결론적으로, 개인의 합리적 믿음의 정도는 확률공리를 따른다. 혹은
개인이 자신의 믿음의 정도를 확률공리에 따르지 않게 분배한다면 비합리적이다. 끝!




※ 다시 꺼내 보니 오히려 이해하기 어렵게 쓴 것 같다. 고치기 귀찮아서 이대로...


======================================================
[1] 오타가 아니다. 그냥 무조건 잃는다.
[2] 처음에 "부키가 게임을 살 수도, 팔 수도 있다"고 한 점을 기억하자.
[3] 참가자가 rS원을 게임 참가비로 지불했다는 점을 기억하자.
[4] "무슨 소리냐?" 하겠지만 잠깐만 참고 따라가 봅시다.


댓글 없음:

댓글 쓰기