GK 비판적 사고/쓰레기 입시 논술, 면접, 수능언어

고대논술 수리 훈련용: 통계적 가설 테스트

착한왕 이상하 2015. 8. 20. 23:10

* 다음 자료를 개발자 이상하의 허락 없이 변형하여 상업적 목적으로 사용하는 것을 금합니다.

 

* 통계적 가설 테스트 이해 및 고대 관련 논술 문제

 

얼핏 보면 아무런 공통점도 공유할 수 없어 보이는 판사의 판결 과정과 통계학자의 가설 테스트 과정을 비교해 보는 가운데, 통계적 가설 테스트에 대한 기본적인 이해가 가능해진다.

 

다음 글의 E, F, G에 들어가야 할 것으로 적합한 것은?

 

통계학자와 판사 사이에는 아무런 공통점도 없을 것 같지만, 그렇지 않다. 통계학자가 가설을 평가하는 방식과 판사의 판결 과정 사이에는 유사성이 있다. 통계학자가 거짓 가설이 선택되지 않도록 주의를 기울이는 것처럼 판사도 무고한 사람이 유죄를 받지 않도록 주의를 기울인다. 통계학을 공부하는 학생이 판사의 판결 방식을 고려할 때 통계적 가설 테스트 방식을 더 잘 이해할 수도 있다. 왜 그런지 살펴보자.

 

어느 통계학자는 라벤더 향기가 심리 상태를 안정시켜주는 효과를 갖고 있는지를 테스트해보려고 한다. 그러한 테스트는 상대비교가 필요하기 때문에, 통계학자는 다음 두 가지 경쟁 가설을 만들었다.

 

[가설 A] 효과의 측면에서 라벤더 향기와 비누 향기 사이에는 별 차이가 없다.

[가설 B] 효과의 측면에서 라벤더 향기와 비누 향기 사이에는 의미 있는 차이가 있다.

 

통계학자는 [가설 A][가설 B] 중 무엇이 옳은 것인지 사전에 알 수 없다. [가설 A]가 옳은 것인데도 불구하고, [가설 B]를 선호해 [가설 A]를 기각해버리는 오류가 발생할 수도 있다. [가설 B]가 옳은 것인데도 불구하고, [가설 A]를 기각하지 않는 경우도 있다. 통계학자들은 전자의 가설을 1종 오류, 후자의 가설을 2종 오류로 부른다. 1종 오류를 범하는 것은 제2종 오류를 범하는 것에 비해 우선적으로 피해야만 하는 것이다. 왜 그런가? 이 질문은 판사의 판결 과정을 살펴볼 때 쉽게 대답된다.

 

김 씨가 어느 범죄 사건의 용의자로 체포되어 판결을 받게 되었다고 해 보자. 이 경우, [가설 A][가설 B]는 각각 다음에 대응된다.

 

[가설 C] 김 씨는 범인이 아니다.

[가설 D] 김 씨는 범인이다.

 

판사가 [가설 C]를 기각하지 않는다는 것은 다음을 뜻한다.

 

E.                                                                  

 

따라서 통계학자가 [가설 A]를 기각하지 않는다는 것은 [가설 B]를 받아들이기에는 아직 그 통계적 증거가 불충분함을 뜻한다. 판사가 [가설 D]를 선호해 [가설 C]를 기각한다는 것은 김 씨가 범인일 정황이 충분함을 뜻한다. 통계학자가 [가설 B]를 선호해 [가설 A]를 기각한다는 것 역시 다음을 뜻하는 것이다.

 

F.                                                        

 

판사는 김 씨가 처한 정황에 근거해 판결을 내려야 하기 때문에 오판을 할 수도 있다. 통계학자가 제1종 오류를 범한 것은 무엇에 비유되는가?

 

G.                                                         

 

통계학자가 제2종 오류를 범한 것은 무엇에 비유되는가? 그것은 김 씨가 범인에도 불구하고 무죄 판결을 받게 되는 경우에 비유된다. 이 결과는 옳은 가설을 선별해내지 못한 것에 해당한다. 따라서 거짓 가설이 정설이 되지 않게끔 하기 위해서는 제1종 오류를 피하는 것이 제2종 오류를 피하는 것보다 중요하다.

 

 

E. 김 씨는 범인이 아니다.

F. 라벤더 향이 보여주는 효과는 비누 향기의 그것보다 크다고 볼 증거가 충분하다.

G. 아무 죄도 없는 김 씨가 범인으로 몰리게 된다.

E. 김 씨를 범인으로 단정짓기에는 그 증거가 불충분하다.

F. 효과의 측면에서 라벤더 향과 비누 향기 사이에 의미 있는 차이가 있다고 볼 증거가 충분하다.

G. 무고한 사람이 죄를 뒤집어쓰고 형을 살게 된다.

E. 무고한 김 씨가 유죄 판결을 받게 된다.

F. 효과의 측면에서 라벤더 향과 비누 향기 사이에 의미 있는 차이가 있다고 볼 증거가 충분하다.

G. 범인인 김 씨가 무죄 판결을 받게 된다.

E. 김 씨는 범인이 아니다.

F. 효과의 측면에서 라벤더 향과 비누 향기 사이에 의미 있는 차이가 있다고 볼 증거가 불충분하다.

G. 무고한 김 씨가 유죄 판결을 받게 된다.

E. 김 씨는 범인이다.

F. 효과의 측면에서 라벤더 향과 비누 향기 사이에 의미 있는 차이가 있다고 볼 증거가 불충분하다.

G. 무고한 사람이 죄를 뒤집어쓰고 형을 살게 된다.

 

 

[분석] 

통계학자의 [가설 A][가설 B]는 각각 귀무가설(null hypothesis)’대안가설(alternative hypothesis)’로 불린다.

 

[귀무가설] |(라벤더 향기)-(비누 향기)|=0 (효과의 측면에서 라벤더 향기와 비누 향기 사이에는 별 차이가 없다.)

[대안가설] |(라벤더 향기)-(비누 향기)|>0 (효과의 측면에서 라벤더 향기와 비누 향기 사이에는 의미 있는 차이가 있다.)

 

귀무가설과 대안가설의 평가는 각각의 통계 조사에 근거하는 만큼 무 자르듯이 어느 하나로 귀결되는 것이 아니다. 귀무가설을 기각하지 않는 것은 특정 오류 범위 내에서 허용되는 것이며, 대안가설을 선호해 귀무가설을 기각하는 것도 특정 오류 범위 내에서만 허용되는 것이다. 귀무가설을 기각하지 않는다고 해서 귀무가설이 참임이라고 말할 수 없다. 이를 보기 위해 귀무가설과 대안가설에 대응하는 판사의 두 경쟁 가설을 살펴보자.

 

[가설 C] 김 씨는 범인이 아니다.

[가설 D] 김 씨는 범인이다.

 

만약 판사가 김 씨에게 무죄를 선고하는 경우, 그 이유는 무엇일까? 판사는 김 씨가 처한 정황에 근거해 무죄를 선고했다. 김 씨가 무죄를 선고받았다고 하더라도, 이로부터 김 씨가 정말 범인이 아니라는 결론이 성립하는 것은 아니다. 귀무가설을 기각하지 않는다는 것이 귀무가설이 참임을 전제하지 않는 것처럼, 판사의 무죄 판결도 김 씨가 범인이 아님을 함축하는 것은 아니다. 판사가 김 씨에게 무죄를 선고한 이유는 김 씨를 범인으로 볼 증거가 불충분하기 때문이다. 통계학자가 귀무가설을 기각하지 않은 이유도 여기에 있다. 대안가설을 선호해 귀무가설을 기각할 통계적 증거가 불충분한 경우, 통계학자는 귀무가설을 기각할 수 없다. 따라서 E에 들어갈 것은 다음과 같다.

 

E. 김 씨를 범인으로 단정짓기에는 그 증거가 불충분하다.

 

만약 판사가 김 씨에게 유죄를 선고하는 경우, 그 이유는 무엇일까? 김 씨를 범인으로 볼 정황에 대한 증거가 그렇지 않을 때보다 충분히 크다는 것이다. 이는 통계적 증거를 바탕으로 대안가설을 선호해 귀무가설을 기각하는 것에 해당한다. 대안가설을 선호해 귀무가설을 기각하는 경우, F에 들어갈 것은 다음과 같다.

 

F. 효과의 측면에서 라벤더 향과 비누 향기 사이에 의미 있는 차이가 있다고 볼 증거가 충분하다.

 

판사는 김 씨가 정말 범인인지 아닌지를 모르는 상태에서 판결을 진행한다. 만약 판사가 김 씨가 범인이 아님에도 불구하고 유죄 판결을 내렸다면, 어떻게 되는가? 무고한 사람이 감옥에 가게 되는 것이다. 만약 김 씨가 범인임에도 불구하고 무죄 판결을 내렸다면, 어떻게 되는가? 범인을 놓치게 된 것이다. 무고한 사람을 감옥에 보내는 오판과 범인을 놓치게 만든 오판 중 무엇이 판사에게 더 심각한 것인가? 전자의 오판이다.

  

 

유죄 판결

무죄 판결

김 씨가 진범이 아닌 경우

오판 1(무고한 사람이 감옥에 가게 됨)

O

김 씨가 진범인 경우

O

오판 2(범인을 놓치게 됨)

 

유죄 판결은 대안 가설을 선호해 귀무가설을 기각하는 것에, 무죄 판결은 귀무가설을 기각하지 않는 것에 대응된다. 김 씨가 진범이 아닌 경우는 귀무가설이 참이라는 것에, 김 씨가 진범인 경우는 대안 가설이 참이라는 것에 대응된다.

 

 

귀무가설 기각(대안가설 선호)

귀무가설을 기각하지 않음

귀무가설이 참인 경우

1종 오류(거짓 가설이 정설이 되어버림)

O

대안가설이 참인 경우

O

2종 오류(참인 가설을 선별해내지 못함)

 

판사가 무고한 사람이 유죄를 받지 않도록 주의를 기울이듯이, 통계학자도 거짓 가설이 선택되지 않도록 주의를 기울인다. 판사에게 오판 1을 범하지 않는 것이 오판 2를 범하지 않는 것보다 중요하듯이, 통계학자에게도 제1종 오류를 피하는 것이 제2종 오류를 피하는 것보다 중요하다. G에 들어가야 할 것은 다음과 같다.

 

G. 무고한 사람이 죄를 뒤집어쓰고 형을 살게 된다.

 

답은 이다.

 

 

[예제] 어느 과학자가 간염을 치료하기 위한 신약을 개발하였다. 이 약의 효과를 검증하고자 60명의 간염 환자 중 40명을 무작위로 선택하여 신약을 투여하고, 나머지 20명에게는 위약(placebo)을 투여하는 임상 실험을 하였다. 표는 임상 실험 결과를 나타낸 것이며, A, B, C, D는 사람 수이다.

 

 

호전됨

호전되지 않음

신약

A

B

40

위약

C

D

20

48

12

60

 

표에 대한 설명으로 옳은 것을 <보기>에서 잘못된 것을 모두 고른다면?

<보기> 

 

() D가 클수록 신약을 투여 받은 사람 중 호전된 사람의 비율이 커진다.

() AC의 차이가 작을수록 신약을 투여 받은 사람 중 호전된 사람의 비율이 작아진다.

() A:B4:1이면 신약은 위약보다 간염 치료에 효과가 있다고 봐야 한다.

 

 

(), ()      (), ()       (), ()       ()      ()

 

[예제]에서 귀무가설과 대안가설은 다음과 같다.

 

귀무가설: (신약의 효과)-(위약의 효과)=거의 차이가 없음

대안가설: (신약의 효과)-(위약의 효과)>0

 

그러나 <보기>()만 제외하고는 ()()는 수리추리력의 평가에 가깝다. 도표를 수식화해 보면 다음과 같다.

 

A+B=40, C+D=20, A+C=48, B+D=12

 

()를 보자. “D가 클수록 신약을 투여 받은 사람 중 호전된 사람의 비율이 커진다.” 'B+D=12'이므로, D가 클수록 B는 작아진다. B는 신약을 투여 받은 사람 중 호전되지 않은 사람의 비율이다. 따라서 'A+B=40'에 의해 B가 작아진 만큼 신약을 투여 받은 사람 중 호전된 사람의 비율인 A가 커져야 한다. ()는 옳다.

 

() “AC의 차이가 작을수록 신약을 투여 받은 사람 중 호전된 사람의 비율이 작아진다.” '(A-C)+(B-D)=20'이므로 (A-C)가 작아진 만큼 (B-D)가 커진다. 'C=20-D'이므로 D의 최대값 12(B=0)와 최소값 0(B=12)을 넣어보면, 'A-C'의 최대값은 32, 그리고 최소값은 8이 된다. 따라서 'A>C>0'이기 때문에, C가 커진 만큼 A도 작아지는 경우에만 'A-C'도 작아진다. C가 커진 만큼 D도 작아져야 하며, 'B+D=12'에 의해 D가 작아진 만큼 B도 커진다. 'A+B=40'이므로 B가 커질수록 A는 작아진다. ()는 옳다.

 

() “A:B4:1이면 신약은 위약보다 간염 치료에 효과가 있다고 봐야 한다.” A:B4:1라는 것은 내기 돈을 걸었을 때 A의 승률이 4/5, B의 승률이 1/5이라는 것과 같다. 404/5를 곱해주면 A32, 401/5를 곱해주면 B8이다. 따라서 C16, D4이다. C:D4:1이다. 이 경우 신약의 효과가 4/5이고, 위약의 효과도 4/5가 나온다. 따라서 '(신약의 효과)-(위약의 효과)=0'이므로, 귀무가설은 기각될 수 없다. 귀무가설이 기각될 수 없다는 것은 신약이 위약보다 효과가 있다고 볼 수 없음을 뜻한다. 따라서 ()는 잘못된 것이다.

 

[예제]의 답은 이다.

 

 

아래의 제시문들을 읽고 논제에 답하시오(기출 논술 문제).

 

.

신문과 같은 전통적인 미디어와 함께 최근에는 SNS(Social Networking Services)와 같은 새로운 미디어를 통해 정보가 유통되고 있다. 신문과 SNS에 유통되는 거짓 정보의 비율이 같다는 가설을 H, 신문에 비해 SNS에 유통되는 거짓 정보의 비율이 더 높다는 가설을 K라고 한다. HK 중 하나를 선택하는 의사결정에서 초래되는 손실은 <1>과 같다.

 

<1> 손실 구조

 

H를 선택

K를 선택

H가 참(true)

0

1

K가 참(true)

1

0

 

.

의사결정을 위해 실시한 설문조사에서 신문에 보도된 특정 정보가 거짓이라고 응답한 수를 X라 하고, SNS에 유통된 같은 정보가 거짓이라고 응답한 수를 Y라고 할 때, <2>와 같은 확률분포를 가정하자.

 

<2> 확률분포

 

X=Y

X>Y

X<Y

H가 참(true)

0.2

0.4

0.4

K가 참(true)

0.1

0.3

0.6

 

.

위와 같은 상황에서 다음과 같은 4가지 의사결정 방법(A1, A2, A3, A4)을 고려하자.

A1: 언제나 H를 선택

A2: 언제나 K를 선택

A3: X>Y이면 H, XY이면 K를 선택

A4: XY이면 H, X<Y이면 K를 선택

 

.

위의 <1>과 같은 손실 구조에서 의사결정을 할 때 발생하는 기대손실은 오류를 범할 확률로 표현된다. 가령 A3을 사용하는 경우, H가 참일 때 K를 선택하는 오류를 범할 확률은 0.6이다(H가 참일 때, X<Y일 확률 0.4X=Y일 확률 0.2의 합).

 

다음 논제에 답하시오.

1. 만약 K가 참인 경우, 주어진 의사결정 방법들 중 기대손실을 기준으로 선택 순서는 A2,

A3, A4, A1이다. 그 이유를 논하시오.

 

2. 의사결정 방법 A3A4 중에서 기대손실을 기준으로 A4를 선택하는 경우 그 근거를

논하시오.