배우고 나누는 사람

모두에게 더 넓고 더 깊은 세상을 향해

박사과정/연구 빌드업

[빌드업] 정확도(Accuracy) 과 정밀도(Precision)

Jeongwon Seo 2022. 10. 20. 04:50

아마 연구 카테고리의 제 글을 읽으신 분들은 제가 무얼 하는지 대략적으로 아실 거예요. 유효성 검증이라고도 하는데 이는 넓게 사람이든 컴퓨터든 우리가 가진 값에 대한 질적 향상을 의미해요. 그러니까 우리가 최초로 가진 값을 어떻게든 더 나은 값으로 향상을 해야 하죠. 그때 더 나은 값이라는 의미는 두 가지로 나눠볼 수 있는데 정확과 정밀이죠. 마침 학회 때 썼던 자료가 있어서 가져왔어요.

 

정확과 정밀의 차이

 

위의 그림에서 보시면 정확하다는 것은 어떤 불확실성은 있지만 그래도 그들이 지향하는 방향은 맞다는 것이고, 정밀하다는 것은 방향은 틀렸지만 꽤나 확실하게 한 방향을 가리킬 수 있다는 건데요. 왼쪽의 그림처럼 정확하지만 정밀하지 않은 경우에는 이들의 불확실성을 줄이는 쪽으로 그리고 오른쪽 그림처럼 정밀하지만 정확하지 않은 경우는 값을 조정하는 쪽으로 노력을 기울여야 할 것입니다. 

 

최근의 기계 학습 분야는 분류(Classification)에 많은 연구가 이루어져 있고 불확실성에 초점을 두지 않고 이분법적으로 맞다 틀리다 식의 손실함수(혹은 목적함수)를 가지는 것이 대부분이죠. 그래서 정확과 정밀의 개념보다는 몇 개의 문제 중에 몇 개를 맞추는지가 중요하게 되었어요 (예를 들면 사진을 보고 강아지인지 고양이인지 맞추는 것). 하지만 회귀(Regression) 연구에 있어서는 불확실성을 다루는 것이 중요한 문제가 됩니다.  이때 손실 함수는 정확과 정밀도 둘 다 양적으로 계산할 수 있는 방향으로 설계되어야 할 거예요. 

 

이번 10월 학회에 와서 제가 제안한 것도 이런 회귀문제에 있어서의 손실함수를 디자인 할 때 필요한 방법이었어요. 그래서 분수의 분자(Numerator) 쪽에는 정확함을 측정할 수 있도록 예상 값과 실제 측정값의 차이를, 분모(Denominator)쪽에는 정밀도를 측정할 수 있도록 사후 정확도를 넣었죠. 발표는 조금 더 개념적으로 하려다 보니 무자비한 그래프만 던져놓기보다 그림 위주로 했더니 전문성이 조금 떨어져 보이긴 하던데 저는 만족스러웠습니다. 

 

아직 측정값 오류에 대한 부분이 반영이 잘 되어있지 않아서 조금 더 후속 연구를 필요로 하지만 앞으로 제가 만든 목적함수가 여러 부분에 쓰일 수 있길 기대하면서 남은 박사기간을 보내야 하지 않나 싶습니다. 그리고 이 정확과 정밀의 문제는 실제 우리 삶 속에서도 우리가 알게 모르게 사용하는데요. 여러분께서 사용할 수 있는 예를 하나 들어볼까요? 남편이 아내와 같이 어떤 행사에 가야 하는데 남편이 묻습니다. "여보 얼마나 걸릴 거 같아?" 아내는 대답을 해요 "한 30분?" 그때 남편은 무의식적으로 머릿속에서 어떤 계산을 할까요? 아마도 '30분이라 말했으니 실제론 45분쯤 걸릴 거고 거기에 위아래로 5분 정도 잡으면 되니까 50분 안에는 어떻게든 집에서 나갈 수 있겠구나'가 아닐까요? 여러분 가정에 편안을 빕니다. :) 

728x90
반응형