본문 바로가기
What is □?

26_손실 함수란 무엇인가?

by 전봇대파괴자 2021. 7. 16.

인공지능 모델이 예측한 답과 원래 정답의 오차를 표현, 판단하는 함수를 말한다. 인공지능의 성능을 증명하는 가장 중요한 지표 중 하나이다.

 

이 개념을 이해하려면 우선 지도학습이 무엇인지 이해해야 한다. 지도 학습은 문제-정답의 데이터 세트를 통해 기계를 훈련시키는 방법이다. 문제와 정답을 모두 학습하며 둘의 연관관계를 파악하여 학습하고, 그를 바탕으로 새로운 테스트 케이스의 답을 맞춘다. 마치 수많은 콜라와 까나리액젓의 표면을 관찰한 후 육안만으로 콜라를 골라내듯이 말이다.

 

모델이 예측한 결과와 실제 테스트 케이스의 답은 다를 수 있는데, 이런 오차를 수식화하여 모델의 성능을 판단하는 것이 바로 손실함수이다. 인공지능은 이 손실함수의 값을 최소화하는 방향으로 학습을 진행한다. 그렇기 때문에 어떠한 손실함수를 모델 학습의 기준으로 삼느냐가 매우 중요하다.

 

 

대표적인 손실함수로는 MSE, RMSE, MAE, Binary Crossentropy, Categorical Crossentropy 등이 있다.

 

 

MSE(Mean Squared Error, 평균 제곱 오차)

가장 많이 사용되는 손실 함수 중 하나다. 모델이 예측한 값과 실제 정답값의 차를 제곱하여 모두 더한 후 평균을 낸다(t). 제곱을 하는 이유는 거리가 음수일 경우 실제 오차값과 차이가 발생할 수 있기 때문이다.

이 손실함수를 사용할 때의 장점은, 오차가 두드러지는 부분은 잡아내기 쉽다는 것이다. 오차가 큰 부분은 제곱했을 때 더 커질 수밖에 없으므로, 오차가 작은 데이터는 잘 드러나지 않지만 오차가 큰 데이터의 경우에는 이런 변화가 두드러진다.

 

 

RMSE(Root Mean Square Error)

MSE에 루트를 씌운 것으로 MSE와 기본적으로 동일하다. MSE의 경우 오차의 제곱을 구해서 실제 오류 평균보다 더 커지는 특성이 있다. RMSE는 여기에 루트를 씌워 값의 왜곡을 줄여준다.

 

 

MAE(Mean Absolute Error, 절대값 평균 오차)

MSE와 거의 비슷하지만 제곱의 평균을 구하는 것이 아닌 오차에 절대값을 씌우고 합산해 평균을 구한다.

 

 

Binary Crossentropy

이진 분류 문제(분류하는 항목이 두 개인 문제를 말한다. ex) 동물 사진을 개와 고양이로 분류)를 풀 때 사용하는 손실함수이다.

 

 

Categorical Crossentropy

다중 분류 문제(분류하는 항목이 세 개 이상인 문제 ex) 사람들의 혈액 데이터로 혈액형 분류)를 풀 때 사용되는 손실함수이다.