과학과 철학 에세이/인지와 경험

출생 순서: 상관관계와 인과관계 (수정)

착한왕 이상하 2010. 3. 11. 10:27

출생 순서

 

 

과장된 광고인줄 알면서도 사람들은 잘 속는 경향이 있다. 그 이유 중 하나로 좋은 결과를 믿고 싶어 하는 사람들의 기대심리일 것이다. 또 다른 이유는 결과만이 시청자의 눈에 드러날 뿐 그 결과를 산출한 과정이 은폐된 것에 기인한다. 많은 과대광고는 두 현상 P, Q 사이의 어떤 통계적 상관관계(corelation)를 보여준 후 마치 Q가 P의 원인인 것처럼 사람들을 홀린다. 그러나 두 현상 사이에 상관관계가 성립한다고 해도 Q가 항상 P의 원인이라고 주장할 수 없다. 게다가 두 현상 P와 Q 사이에 아무런 상관관계가 없는 경우에도 Q가 P의 원인이라는 통념이 사람들을 지배하기도 한다. 실례로 제일 먼저 태어난 아들이 상대적으로 책임감이 강하다는, 혹은 아버지와 사이가 좋지 않다는 통념을 들 수 있다. 여기에는 생물학적 개념인 ‘출생 순서’와 문화적 개념인 ‘가족 내 서열’ 사이의 개념적 혼선도 뒤섞여 있다. 이를 알아보기 위해 먼저 상관관계와 인과관계의 연관성을 살펴보자.

 

<도식>

 

<도식>에서 P는 기온 상승 변화를, 그리고 Q는 태양빛에 의한 지상 복사열량의 변화를 나타낸다고 하자. P와 관련된 강도는 당연히 온도로, Q와 관련된 강도는 복사열량으로 측정될 것이다. 독립변수는 P, Q와 무관한 시간으로 잡을 수 있다. 새벽 4시에서 오후 1시까지의 기온과 태양빛에 의한 복사열량을 매시간 측정한 결과들은 검은 점들로 처리되었다. Q가 증가할수록 P가 증가하는 것으로 밝혀졌다. 이러한 경우, P와 Q는 상관관계를 맺게 되는 것이다. <도식>은 P와 Q의 변화가 서로 비례적으로 증가하는 경우에 해당하는데, 반대인 경우도 있다.

 

그러나 태양빛에 의한 복사열량 변화가 항상 기온 상승을 불러일으키는 것은 아니다. 갑자기 비가 온다든가, 저기압 구름대가 몰려오는 경우, 태양이 뜬 후에도 기온은 하강할 수도 있다. 그런 경우들을 고려하지 않을 때 기온과 복사열량의 주기적 측정은 Q가 P에 대한 원인이라는 결론을 뒷받침하게 된다. P와 Q에 무엇이 들어가는가에 따라 P가 Q의 원인으로 여겨지기도 한다. P와 Q가 사실은 또 다른 어떤 공통 원인(common cause)에 의해 발생한 까닭에 단지 표면적인 상관관계를 보이기도 한다. 자동차 속도계 눈금이 높아지는 것과 사고율 증가 사이에는 정비례의 상관관계가 나타날 수 있지만, 그 두 현상은 과속이라는 공통 원인에 기인한 것일 뿐이다.

 

P를 책임감 정도의 변화, Q를 출생 순서로 가정해보자. 이 경우, 기온 상승 변화와 태양빛에 의한 지상 복사열량 변화의 관계를 따지는 것보다 어려워진다. 책임감과 출생 순서의 관계를 따질 때 독립변수는 표본 집단이 된다. 그런데 출생 순서에 일반적으로 대응되는 가족 내 서열에 따라 성격 차이가 나타날 수도 있다. 가족의 규모 및 구성 방식, 농경문화와 같은 사회적 구조가 가족 내 서열에 따른 성격 차이 형성에 영향을 미치는 변수들로 취급될 수 있기 때문이다. 그러한 변수들은 실험적으로 통제하기 힘들다. 아니 거의 불가능하다. 책임감과 출생 순서 사이에 어떤 상관관계가 있는지를 따져 보려면, 표본 집단의 구성원들이 무선적으로 추출되어야 한다. 입양으로 장남이 된 경우, 장남의 사망으로 차남이 장남 역할을 하게 된 경우, 첫 번째 출생한 아이가 장녀나 장남이 된 일반적인 경우, 시골에서 성장한 경우, 도심지에서 성장한 경우, 이러한 모든 경우들이 표본 집단에 무작위로 뒤섞여줘야 이상적이기 때문이다. 따라서 몇 십 명 단위의 표본 집단에서 나타난 책임감과 출생 순서 사이의 상관관계가 성립한다고 보기 힘들다. 첫 번째 태어난 아들이 장남으로서 부모의 기대감이라는 압력에 시달리는 문화적 조건을 고려해 보자. 독립 변수 축의 각 칸이 10명씩의 표본 집단으로 구성되었을 때 그러한 문화적 조건 아래에서는 책임감과 출생 순서 사이에 상관관계가 나타날 수도 있다. 문제는 그러한 상관관계는 충분히 사전에 예측할 수 있는 것이며, 또 경우에 따라서는 단지 우연의 결과일 수도 있다.

 

책임감과 출생 순서 사이의 상관관계 유무를 따지기 위해서는 표본 집단의 규모가 어느 정도 커야 한다. 또 각 표본 집단은 그 구성원들이 무선적으로 선출되어야 실험에 대한 대표성 자격을 갖는다. 가장 이상적인 경우는 여러 국가에 걸쳐 표본 집단들이 구성되는 것이다. 실제 유럽에서 그렇게 표본 집단을 구성한 후 실험을 진행한바 있다. 그 실험이 정말 책임감과 출생 순서 사이의 상관관계를 보였었다면, 실험 결과는 어떤 식으로 나타났어야 할까? 실례로 유럽 여러 국가에서 구성된 100명의 표본 집단을 상정하자. 그 중 10명이 첫 번째로 태어난 경우, 책임감의 정도는 2였다. 다시 100명의 표본 집단을 구성해 실험한 결과 20명이 첫 번째로 태어났는데, 책임감의 정도는 3이였다. 이런 식으로 조사가 반복적으로 진행되어 최종 결과가 <도식>처럼 나와야 책임감과 출생 순서 사이에 어떤 상관관계가 있다는 것을 고려 대상으로 삼을 수 있게 된다. 그러나 실제 실험 결과는 달랐다. 책임감의 정도 변화와 출생 순서 사이에는 아무런 상관관계가 없는 것으로 밝혀졌다. 아무런 상관관계가 없다면, 생물학적 출생 순서가 개인 성격 형성에 중요한 원인이라고 얘기할 수 있는 근거도 없는 것이다.

 

많은 사람들이 생물학적인 출생 순서와 문화적인 가족 내 서열을 혼돈하여 출생 순서가 개인 성격 형성에 영향을 미친다고 생각한다. 아이러니한 것은 이러한 근거 없는 통념이 하나의 시장을 형성하기도 한다는 것이다. 혈액형에 따른 성격 차이에 대한 통념은 이미 그 자체의 시장을 갖고 있다. 이것이 사회 전체에 악영향을 미칠 것인지는 속단할 수 없다. 그러나 한 가지 분명한 것은 있다. 근거 없는 통념들이 사회를 지배하게 될 때 확실한 인과관계가 하나 성립한다는 것이다. 그것은 다음이다.

 

“저의 과대광고를 믿으세요. 그렇다면 저는 당신의 돈을 먹습니다. 이러한 통념을 믿으세요. 그렇다면 저의 장사는 계속되어 통장에 돈이 쌓이게 된답니다.”

 

 

'과학과 철학 에세이 > 인지와 경험' 카테고리의 다른 글

관계 놀이  (0) 2010.03.19
유니콘 (존재 도입의 문제)  (0) 2010.03.13
베이즈주의 (수정)  (0) 2010.03.06
웨이슨 선택 과제(Wason Selection Task)  (0) 2010.01.24
퍼지 논리(Fuzzy Logic)  (0) 2010.01.18