Precision과 Recall이란 단어가 몇 번 나왔지만 별 관심없이 지나치다가 이번엔 도대체 뭔가하고 검색 해 봤더니 정확도와 재현율이란다. 별 것 아니라는 생각과 더불어 이번에 명확히 하고 가고자 Reference와 함께 정리한다.
Precision과 Recall은 두 개 이상의 Database Schema를 비교할 때 Schema Match의 품질을 측정하기 위해 많이 사용된다. 다음 그림은 Schema Match 가능한 결과를 집합으로 표시한 것이다.

영역 A + B: 수작업으로 발견한 Match. 자동화된 방법을 평가하기 위한 Gold Standard로 이용된다.

영역 C + B: 자동화된 방법으로 발견한 Match



영역 A: False Negative, 순수히 수작업으로만 발견가능한 Match
영역 B: True Positive, 수작업과 자동화된 방법으로 발견 가능한 Match이면서 Correctly Match된 것.
영역 C: False Positive, 자동화된 방법으로 발견된 잘못된 Match
영역 D: True Negative, 

위 집합에서 Precision, Recall, F-Measure (Harmonic mean of Precision and Recall),과 Overall(False Negative(영역 A)를 추가하고 False Positive(영역 C)를 제거하기 위한 Post-Match Effort))가 다음과 같이 정의된다.












참고 문헌
Do,H. H., Melnik, S. & Rahm, E. 2002. Comparison of Schema Matching Evaluations. In Revised Papers from the NODe 2002 Web and Database-Related Workshops on Web, Web-Services, and Database Systems, Akmal B. Chaudhri, Mario Jeckle, Erhard Rahm, and Rainer Unland (Eds.). Springer-Verlag, London, UK, 221-237.

출처: http://jzcafe.blogspot.com/2011/02/precision-and-recall.html 

+ Recent posts