배우고 나누는 사람

모두에게 더 넓고 더 깊은 세상을 향해

할많하자/과학으로 본 세상

오버피팅 (Overfitting)이 되버린 법

Jeongwon Seo 2021. 7. 6. 08:50

안녕하세요. 오늘은 제가 요즘 보았던 기사에 관한 제 의견을 과학으로 한 번 풀어보는 시간을 가져보려고 해요. 일단 오늘 이야기 할 메인 주제는요. 지나가던 여자가 어려움에 처했을 때, 과연 도와주어야 하는가? 아니면 그냥 못본체 지나가야 하는가? 입니다. 뭐 최근들어서 엄청 화제가 되는 주제는 아니지만 간간히 아직도 이런 논란이 많이 있는 것 같아서요. 뭐가 맞다 틀리다라기보다는 사회적 현상에 대해 조금 풀어볼까 합니다. 

 

https://www.sedaily.com/NewsView/22OT2APCSL

 

'핫팬츠 女승객 쓰러졌는데 남성들 외면' 글에 '현명' vs '사람 살려야' 갑론을박

사진은 기사 내용과 무관함/연합뉴스'지하철에서 여성이 쓰러지면 남성들은 '성추행범'으로 몰릴까 걱정돼 이를 외면하는 경향이 있다'는 주장이 최근 온라인상에서 제기된 가운데 '도와주고

www.sedaily.com

 

이런 이야기가 자주는 아니어도 심심치 않게 올라오죠. 한 달 전인가도 봤던 거 같은데 기사를 못찾겠네요. 밤 거리에 여자가 성추행을 당하려는 것 같은데 남자가 우연히 보고는 그냥 지나갔다는 겁니다. 나중에 경찰에서 그 남자가 결제한 신용카드를 보고 역추적을 해서 신원을 알라냈고 경찰서에 나와서 증언을 해달라는 거였는데, 그 남자가 자기는 잘못한 거 없으니 증언도 할 것도 없다면서 안갔다는 내용이었어요. 비슷한 내용 맞죠?

 

여쨌든 이러한 사건들을 보면 사람들은 (대체적으로) 안도와주길 잘했다. 도와줘봐야 나중에 신고할거다. 라는 의견이 있고요. 다른 한편으로는 아니 어려움에 처한 사람이 있으면 도와줘야지, 아니면 경찰에 신고라도 하던가. 라는 의견으로 나뉘어서 이런 이슈에 대해 의견을 나누는 것 (거의 싸우는 것) 같더라고요. 

 

여기까지가 서론이었고요. 오늘 본론은 오버피팅 (한국말로 "과적합"이라는데..) 입니다. 오버피팅은 기계학습, 음 뭐 인공지능 분야에서도 많이 나오는데, 쉽게 말하면 국지적인 현상에 너~~무 빡세게 기준을 정해서 나머지 일반적인 상황에는 오히려 기준이 안맞는 경우가 나온다는 이야기에요. 그림으로 한번 보시죠. 제가 사랑하는 위키백과에서 긁어 왔습니다.

검은색은 일반 최적화, 초록색은 과적합

위 그림 보이시죠? 빨간 색과 파란 색은 각기 서로 다른 분류에 들어가는 데이터에요. 수학자 또는 과학자들은 (사실 누구나) 저런 데이터를 받아서 파란 색과 빨간 색 점을 구분할 수 있는 경계 또는 기준을 결정하려고 할거에요. 여러분은 초록색 경계를 보면 조금 불편하지 않나요? 그래도 완벽하게 분류해 놓았으니 좋다고 생각하시나요? 아쉽게도 이런 데이터들은 우리의 삶에서 아주 극히 작은 부분에 밖에 해당되지 않습니다. 그러니까 우리는 이 넓은 세상에서 우리가 모을 수 있는 만큼의 데이터를 모아보는 거죠, 위의 그림처럼요. 그리고는 이제 기준을 정합니다. 초록색으로 정할 수도 있고, 검은색으로 정할 수도 있어요. 초록색으로 정하면 그래서 도대체 뭐가 문제 일까요?

 

이제 현실에서 다른 데이터를 가져옵니다. 위의 그림과 비슷하지만 같지는 않아요. 대체적으로 파란색 점들은 위의 그림에 있는 것처럼 오른쪽 위에 모여있고, 빨간색 점들은 나머지 부분에 있다고 가정해봅시다. 아직도 초록색 분류기(기준)가 검은색보다 판별을 더 잘 할수 있을까요? 저는 대부분의 경우 아니라고 말할 수 있습니다. 

 

다시 우리 사회 문제로 돌아와 볼까요? 애석하게도 많은 법들은 뭔가 일이 터지고 나서야 바뀌곤 하죠. 미리미리 그런 법이 있었다면 어떤 문제들은 막았을 수도 있었을 지도 모르지만요. 성폭력, 성희롱 등 성과 관련된 문제는 하루 빨리 없어져야 많은 사람들이 행복하겠죠? 우리 국민들을 위해 열심히 일하시는 분들 또한 이런 문제가 조속히 없어지길 바라고 법을 개정할 것입니다. 안타깝게도 문제를 너무 국지적으로만 보게되면 위의 그림 처럼 과적합의 문제가 생길수가 있어요. "내가 당했다는 느낌이 중요하다.", 그럴 수도 있습니다. 정말 그렇게 느낌으로만 너무나도 큰 수치심을 느낄 수도 있어요. 또는 "가해자로 의심되는 사람이 자신의 무고를 스스로 증명해야 한다.", 가끔은 피해자가 제대로 설명을 못할 수도 있기에 그럴 수도... 있다고 생각 할 수도 있을지도 모를지도 모르겠습니다. 그렇다고 대부분이 그럴 것이다라고 생각하기에는 조금 무리가 있지 않을까요? 

 

많은 좋은 법들이 발의되고 다들 더 좋은 대한민국을 만들기 위해 노력하고 있습니다. 하지만 꼭 선한 의도가 좋은 결과를 낳는 것은 아니잖아요? 나의 좋은 의도가 대체적으로 괜찮은 결과를 낳길 바란다면, 오버피팅은 반드시 넘어야 할 산 중에 하나 (다른 것들도 많아요!) 라는 점은 우리가 한 번 생각해봐도 좋은 문제 인 것 같습니다. 그럼 이만!

728x90
반응형

'할많하자 > 과학으로 본 세상' 카테고리의 다른 글

기대값의 효용 (투자 원칙)  (0) 2021.07.21