Yes / No 로만 선택을 하는 문제가 있다고 했을때

No가 정답인 문제를 Yes로 대답한 경우가 false positive가 되고,
Yes가 정답인 문제를 No로 대답한 경우가 false negative가 됩니다.


예를 들어 설명을 해보면 "주어진 컵에 담긴 것이 커피인가?"라는 문제에서

우유가 주어졌는데 Yes를 대답한다면 false positive,
커피가 주어졌는데 No를 대답한다면 false negative

사실 true positive와 true negative도 있는데,
true positive는 Yes를 Yes로
true negative는 No를 No로
대답한 것을 말합니다.

자... 그럼 여기서 문제!!

화장실 변기에 앉아있는 데 방귀만 나온 경우는?
1. false positive
2. false negative

답: 1. false positive (마우스로 드래그)


화장실의 변기에 앉았다는 것은 "변이 예상되는가?" 라는 문제에 대해 Yes라고 생각하고 화장실에 갔으나 변이 아닌 방귀였으므로...

만약 문제가 "방귀가 예상이 되느냐?" 로 본다면 false negative가 될 것이나, 방귀를 예상하고 변기에 앉는 사람은 없을 것이므로 위 상황은 "변이 예상되는가?"라는 문제였다고 판단해야 할 것입니다.


'이딴게 어따 써먹는 거냐?'라고 하신다면 

스펨 분류기의 성능을 평가할때 '이 메일이 스펨이니?'라는 문제를 두고 스펨 분류기는 나름 열심히 분류를 해서 YES(스펨) / NO(일반)를 갈라서 사용자에게 도착하는 메일을 갈라 놓게 될텐데요.

  1. 스펨이 아닌 메일을 스펨으로 분류한 경우(false positive)
  2. 스펨인 메일을 스펨이 아닌 메일로 분류한 경우(false negative)

2 의 경우에는 사용자는 '아 이 바보 같은 스펨필터 스펨을 안버려놨네'하면 끝이지만, 1의 경우 특히 중요한 메일을 스펨으로 분류가 되어버렸다면 사용자는 내가 이따위 걸 쓰나봐라 라고 집어 던질 수도 있겠죠. 따라서 스펨 분류기의 성능을 평가할때 단순히 accuracy(= true / all )로 평가하기에는 무리가 있습니다. 이러한 경우에 ( all - ( false positive * 0.9 + false negative * 0.1 )  )  / all 과 같은 방법으로 평가할 수 있겠죠.(앞의 0.9, 0.1의 가중치는 단순히 예를 들어본 것일 뿐입니다.)


출처: http://blog.naver.com/uook_?Redirect=Log&logNo=130084534694

'Informatics > Medical & Bio Statistics' 카테고리의 다른 글

Statistics / 연구 설계 및 분석  (0) 2011.01.10
Statistics / Q-value  (0) 2011.01.05
Terms / T-Test  (0) 2010.01.21
Terms / P-Value  (0) 2010.01.21
R project / PhViD 설치하기  (0) 2009.12.07

+ Recent posts