통계의 패러독스에 관한 몇 가지 이야기▷▶ 콩도르세의 패러독스갑, 을 ,병 이 세 사람이 대통령 후보로 나섰다. 마지막 여론 조사에 따르면,유권자 중의 2/3 는 을보다 갑을 더 좋아하는 것으로 나타났으며, 또 유권자중의 2/3 은 병보다 을을 더 좋아하는 것으로 나타났다. 그러면 갑은 병보다당선 확률이 더 높을까 ? 반드시 그렇지는 않다. 깜짝 놀랄 만한 패러독스가숨어 있기 때문이다. 어디 각 후보자들의 주장을 들어 보자.갑 : 유권자 중의 2/3는 을보다 나를 더 좋아한다.을 : 유권자 중의 2/3는 병보다 나를 더 좋아한다.병 : 유권자 중의 2/3는 갑보다 나를 더 좋아한다.< 해 설 >>수학자 콩도르세(Condorcet;1743 ~ 1794)가 발견한 이 패러독스는 비전이성 관계를 보여주는 유명한 예이다. 전이성이란 개념은 '...보다 더 큰', ' ... 보다 더 높은 ' , '... 보다 더 적은 ' 등등의 관계에 적용된다. 어떤 관계 R 이 있을 때, xRy 와 yRz 이면 xRz가 성립할 경우, 관계 R은 전이성이 있다고 말한다.콩도르세의 패러독스가 우리를 놀라게 한 이유는 , 우리는 "무엇을 더 좋아한다." 는 말로 표현되는 관계는 항상 전이성이 있다고 생각하기 때문이다. 그래서 어떤 사람이 갑을 을보다 좋아하고, 을을 병보다 더 좋아한다면 , 그는 갑을 병보다 더 좋아할 것이라고 우리는 자동적으로 추측한다. 그러나 이 패러독스는 항상 그렇게 되지는 않음을 보여준다. 유권자 중의 다수는 갑을 을보다 더 좋아하고, 또 그 중의 다수는 을을 병보다 좋아하고, 또 다른 다수는 병을 갑보다 더 좋아한다. 이 상황은 비전이적이다. 이 패러독스는 노벨 경제학상 수상자인 케네스 애로(Kenneth Arrow) 의 이름을 따 '애로의 패러독스'라 부르기도 한다. 그는 어떤 선행조건과 논리적 고찰에서 시작하여, 완전히 민주적인 선거제도는 불가능하다는 것을 증명했다.이 패러독스는 세 개의 기준을 근거로 하여 세 가지 가능성 중에서 선택해야 하는 모든 상황에서 생겨날 수 있다. A, B, C 세 남자가 한 여자에게 청혼을 했다고 가정하자. 그런데 그녀는 지성, 건강, 부의 세 가지 조건으로 세 남자의 등급을 매긴다. 그녀는 그들의 자질을 한 사람 대 한 사람으로 밖에 평가할 수 없었는데, 불행하게도 A가 B 보다 낫고, B는 C 보다 낫고, C 는 A 보다 낫다는 사실을 발견한다.이 패러독스는 시장 조사에서도 적용된다. 어느 통계 학자가 주부들의 2/3 는 미용크림 A를 B보다 더 좋아하고 , 또 그들 중의 2/3는 B를 C 보다 더 좋아한다는 통계 자료를 얻었다고 하자. 이 결과만 보고 제조회사는C 가 가장 인기 없는 미용 크림이라 판단하고 C 의 생산을 중단하기로 결정할지도 모른다. 그러나 세 번째 통계자료에서 주부들 중의 2/3는 C를A 보다 더 좋아한다는 결과가 나온다면? 한 번 생각해 봅시다.▷▶ 도박사의 궤변{ '딸만나' 부부는 5명의 딸을 낳았지만 , 아들은 한 명도 낳지 못했다. }딸만나 부인 : 다음 번의 아기는 딸이 아니었으면 좋겠어요.딸만나씨 : 여보, 딸을 계속해서 다섯이나 낳았으니, 이번에는 틀림없이 아들일거야{ 딸만나씨의 생각이 옳을까 ? }{많은 도박사들이 룰렛 게임에서 붉은색쪽이 계속 나온 뒤에 검은색 쪽에 걸면이긴다고 생각한다. 그들의 생각이 옳을까 ? }{ 에드거 포(Edgar Poe)는 주사위 게임에서 2 가 계속해서 다섯번 나왔다면, 여섯번째 시도에서 2가 나올 확률은 1/6 보다 작을 것이라고 주장하였다. 그의 생각은옳은가 ? }{ 위의 물음들 중 하나에라도 옳다고 답했다면, 당신은 소위 '도박사의 궤변' 이라는 함정에 빠진다. 각각의 경우에 새로 일어날 사건은 그 전에 일어난 사건과는 독립적이다. 우연은 기억도 양심도 없다. 딸만나 부부가 여섯번째 딸을 가질 확률은 여전히 1/2 이다. 룰렛에서 붉은 색이 나올 확률도 여전히 1/2 이며 주사위에서 2가 나올 확률은 언제나 1/6 이다. 바꿔 말하자면, 동전을 던져서 앞뒤를 알아맞히는 게임에서 앞면이 계속해서 다섯 번이 나왔다고 할 때 여섯 번째 시도에서도 앞면이 나올 확률은 그전과 다름없이 역시 1/2 이다. 동전은 앞에 던진 결과를 기억하지 않는 것이다.}< 해 설 >>어떤 사건 A가 사건 B에 영향을 끼칠 때 사건 B는 사건 A에 '종속적'이라고 말한다. 예를 들면, 내일 당신이 비옷을 입을 확률은 내일 비가 내릴 확률에 종속적이다. 반대로 서로간에 아무런 관계가 없는 사건들은 '독립적' 이라고 말한다. 내일 당신이 비옷을 입을 확률은 대통령이 아침식탁에서 냉면을 먹을 확률과는 완전히 독립적이다.대부분의 사람들은 어떤 독립적인 사건이 일어날 확률은, 어떤 나름대로의 방식으로, 같은 독립적인 사건 가까이에 있느냐 없느냐에 따라 변화가 있다고 생각한다. 그래서 제 1차 세계대전 기간 중 병사들은 새로 생긴 포탄구덩이 속으로 뛰어들었던 것이다. 더 오래 전에 생긴 포탄 구덩이는 새 포탄이 떨어질 확률이 더 높은 것으로 여겨졌다. 그들은 2 개의 포탄이 계속해서 똑같은 자리를 때리기는 힘들다라는 것을 알고 있었다. 따라서, 가장 최근에 생긴 포탄 구덩이가 그들에게는 훨씬 더 안전한 대피처를 제공한다고 생각했다.도박 중에서 달랑베르 시스템이란 유명한 게임은 완전히 '도박사의 궤변'에 기초하고 있다. 이 게임에서는 붉은색 또는 검은색 쪽에 돈을 거는데, 한 번 잃을 때마다 돈을 갑절로 걸고, 한 번 딸 때마다 돈을 1/2 씩 건다. 이 게임은 작은 상아구슬이 돈을 땄을 때 그것을 기억하고 있다가 다음 번에는 돈을 건 사람에게 불리하게 작용한다는 가정에 근거하고 있다. 또 마찬가지로 ,돈을 잃었을 경우에는 구슬이 선심을 써서 다음 번에는 관대함을 보인다는 것이다.공정한 룰렛 위에서 구슬을 굴릴 때의 어떤 결과도 그 전에 일어난 사건과는 독립적이라는 사실은, 카지노에서 달랑베르 시스템 게임이 도박사에게 아무런 이익도 주지 않는다는 것을 증명해 준다. 카지노에서 돈을 땄을 때 약간의 커미션을 떼는데, 이것은 공평하지 않다. 이 커미션은 당신이 게임을 할 수 있는 권리에 대한 대가이다. 한편, 당신의 기대값. 즉 이겼을 때 받는 돈에다 이길 확률을 곱한 값은 당신이 건 돈보다 적다. 따라서 당신은 평균적으로 매번 게임을 시도할 때마다 약간씩 돈을 잃는 셈이다. 마이너스를 아무리 더해 보아도 플러스가 되지는 않는다.주사위나 동전, 룰렛, 또는 다른 어떤 도박 기구에서든 일어나는 사건의 확률은 그 전에 일어난 사건들과는 독립적이다. 그래도 당신이 어떤 '도박사의 궤변' 을 떨쳐 버릴 수 없다면, 당신의 잘못을 실험적으로 검증해 보자. 당신의 친구에게 동전을 던져달라고 부탁을 한다. 당신은 동전이 3번 연속해서 앞면 또는 뒷면이 같은 것으로 나왔을 때만 돈을 건다. 어떤 면이 연속적으로 3번 나온 뒤에 당신은 그 반대편에 돈을 거는 것이다. 그렇게 해서 50 번을 돈을 걸었다고 한다면, 마지막에 당신의 판돈은 처음과는 똑같지 않을 것이다. 그러나 그 차이는 얼마 되지 않을 것이다. 최초의 판돈보다 약간 돈을 더 딸 확률과 약간 돈을 더 잃을 확률은 동일하기 때문이다.[질문] 우리는 백번의 동전을 던졌을 때 앞과 뒤가 나올 확률은 거의1/2에 근사함을 경험적으로 알고 있다. 몰론 그 수를 늘리면 더욱 1/2에 근사할 것이다. 지금 백번 중에 62번이 앞면이 나오고 37번이 뒷면이 나온 동전이 있다 다음 번에 앞과 뒤 중 당신은 어느 곳에 돈을 걸고 싶은가 ? 그리고 그것이 다른 것보다 유력하다고 할 수 있는가?동전을 계속해서 던질 때 일어나는 사건은독립적이므로 어느쪽에 걸든지 확률은 같다....출전 : ‘이야기 패러독스 - 통계의 패러독스 편’에서