GK 비판적 사고/GCTC 퀴즈, 단문, 중문 추론

GCTC 퀴즈: 심슨의 역설

착한왕 이상하 2011. 9. 22. 02:10

* 나의 글과 EBS 제시문을 합성해 만든 제시문과 퀴즈로 구성된 다음 자료를 이상하의 허락 없이 변형하여 상업적 목적으로 사용하는 것을 금한다.

 

코헨(M. Cohen)과 네이글(E. Nagel)은 1934년 흥미로운 논문을 발표했다. 1910년도 리치몬드와 뉴욕의 결핵 사망자 비율을 조사한 결과 다음과 같은 결과가 나타났기 때문이다.

 

<흥미로운 결과>

• 흑인의 사망률은 뉴욕보다는 리치몬드가 높다.

• 백인의 사망률은 뉴욕보다는 리치몬드가 높다.

• (                            A                        )

 

위와 같은 통계 결과를 함축한 데이터를 코헨과 네이글은 ‘역설적 데이터(paradoxical data)’로 불렀다. 1951년 심슨(E.H. Simpson)은 그러한 역설적 데이터들을 모아 분석한 논문을 발표했다. 역설적 데이터는 부분들의 값들이 크면 그 값들이 합쳐진 총합 또한 크다고 여기는 일상적 통념에 반한다. 역설적 데이터는 전체 집단을 몇 개의 부분으로 나누어 통계 값을 분석했을 때, 각 부분에서 나타나는 경향이 전체에서는 나타나지 않는 경우가 있음을 보여준다. 부분적인 값을 비교·분석했을 때와 전체 값을 비교·분석했을 때 결과가 다를 수 있는 것이다. 이를 ‘심슨의 패러독스’라고 한다.

 

미국의 A 대학원 신입생에 관한 자료를 조사하던 한 사람이 남자와 여자 신입생의 합격률이 각각 52%와 39%로 13%의 차이가 난 것을 들어 신입생 선발 과정에 성별에 따른 차별이 있었다고 주장했다. 그가 제시한 자료를 보면 남자는 지원자 2,691명 중 합격자가 1,400명으로 합격 비율이 52%였으며, 여자는 지원자 1,835명 중 합격자가 722명으로 합격 비율이 39%였다. 이 자료를 얼핏 보면 신입생 선발 과정에서 남녀 차별이 있었다는 그의 주장이 꽤 설득력 있는 것처럼 판단된다.

 

과연 그런 것일까? 그러한 생각은 합격과 불합격이라는 결과에 영향을 주는 또 다른 변수를 무시하고 ‘남녀 구분’이라는 하나의 변수만을 고려해 계산한 데서 오는 착각이다. 앞의 사례와 관련해 각 학과별 남녀의 합격 비율을 보면 여자의 합격 비율이 높은 과가 여러 개 있었으며, 남자의 합격 비율이 높은 과도 남녀 합격 비율의 차이가 2.8%, 1.8%, 3.8% 등에 머물러 남자의 합격 비율이 특별히 높다고 말할 수 없었다. 이는 전체적으로 남자가 13%나 많이 합격했다고 판단할 만큼의 차이를 보여 주는 것이 아니다. 그럼에도 남자의 전체 합격 비율이 여자보다 13%나 높은 현상이 나타난 이유는 무엇일까? 그것은 남자의 합격 비율이 높은 과에 여성 지원자 수가 많았던 반면 여성의 합격 비율이 높은 과에는 여성 지원자 수가 적었기 때문이다. 각각의 학과에는 정원이 있어 지원자의 수와 합격 비율은 관련이 있을 수밖에 없다. 이로 볼 때 ‘학과 구분’이라는 변수는 남녀의 총합격 비율에 영향을 주는 중요한 변수이다. 이렇게 결정적인 변수가 있음에도 이를 무시하고 관심 있는 ‘남녀 구분’ 변수만 고려하여 남녀별 합격 비율을 계산하면 사실을 왜곡할 수 있다.

 

 

[퀴즈 1] 위 글의 <흥미로운 결과>의 빈 칸 (A)를 채워 본다면?

 

 

 

[퀴즈 2] 위 글의 내용에 비추어 다음의 (가)와 (나)에 대한 평가로 <보기> 중 적절하지 않은 것을 모두 고른다면?

 

(가)

 

남학생(합격자/총지원자)

여학생(합격자/총지원자)

국문학과

1/6

2/9

지진학과

6/9

4/6

대학

7/15

6/15

 

(나)

a/b<a'/b'

c/d<c'/d'

(a+c)/(b'+d')>(a'+c')/(b'+c')

 

<보기>

㉠ (가)는 심슨의 역설의 예에 해당하는 통계 조사 결과라고 할 수 있어.

㉡ (나)는 (가)의 수치들을 대소 관계로 비교한 것을 일반화한 것이며, 각 미지수 a, b, c, d, a', b', c', d'에는 임의의 정수들이 들어가겠군.

㉢ (나)를 만족하는 경우는 없기 때문에 심슨의 역설이 발생하는군.

㉣ 타당한 논증은 전제들을 받아들일 때 결론을 부정할 수 없는 경우라고 하는군. 이때 (나)의 사례가 되는 다음 논증은 타당하다고 할 수 없군.

 

• 간염 치료를 받은 남성들이 그렇지 않은 남성들보다 간암에 걸릴 확률은 낮다.

• 간염 치료를 받은 여성들이 그렇지 않은 남성들보다 간암에 걸릴 확률은 낮다.

• 따라서 간염 치료를 받은 사람들이 그렇지 않은 사람들보다 간암에 걸릴 확률은 낮다.

 

㉤ (가)와 같은 결과가 나온 이유는 여학생들이 남학생보다 더 많이 지원한 과에서 여학생의 합격률이 낮았기 때문이라고 할 수 있어.