뉴스 정보 뉴스 컴퓨터 소프트웨어 및 개발 기계 학습, 손실 기능, 일체 포함 Min-jun (민준) 3월 5, 2025 0 Comments

AI 예측 개선의 열쇠

예측시 AI 모델은 얼마나 좋은가요?

실제 번호를 넣을 수 있습니다. 기계 학습에서 손실 함수는 예측 값과 실제 값 사이의 차이 또는 손실을 정량화함으로써 AI 모델의 출력의 오차 정도를 추적합니다. 모델의 예측이 정확하다면,이 두 숫자의 차이 (손실)는 작습니다. 예측이 정확하지 않으면 손실이 더 큽니다.

예를 들어, 동료는 YouTube에서 비디오가 수신 할 수있는 조회수 수를 예측하기 위해 AI 모델을 구축했습니다. 이 모델은 YouTube 타이틀을 공급했으며 첫 주에 비디오가받을 수있는 견해 수를 예측했습니다. 모델의 예측을 실제 뷰 수와 비교할 때 예측은 그다지 정확하지 않았습니다. 이 모델은 Cold Brew 비디오가 폭격 할 것이며 Pour-Over Guide 비디오가 인기가 될 것이라고 예측했지만 그렇지 않았습니다. 이것은 해결하기 어려운 문제이며 손실 기능은 모델을 개선하는 데 도움이 될 수 있습니다.

손실 함수는 모델이 수학적으로 얼마나 잘 수행되는지 정의합니다. 손실을 계산하여 모델 매개 변수를 조정하여 손실이 증가하는지 (악화) 또는 감소 (개선)인지 확인할 수 있습니다. 기계 학습 모델은 손실이 사전 정의 된 임계 값 미만으로 최소화 될 때 충분히 훈련 된 것으로 간주됩니다. 높은 수준에서 손실 함수는 회귀 손실 기능과 분류 손실 함수의 두 가지 범주로 분류됩니다.

회귀 모델의 손실 기능

회귀 손실 기능은 주택 가격, 온도 또는 YouTube 비디오보기와 같은 연속 가치 예측의 오류를 측정합니다. 이러한 기능은 예측이 정확한 지 여부와 지상 진실에서 분기되는 정도에 민감해야합니다.

1. 평균 제곱 오류 (MSE)

가장 일반적인 회귀 손실 함수는 평균 제곱 오차 (MSE)이며, 모든 훈련 예제에서 예측 된 값과 실제 값 사이의 평균 제곱 차이로 계산됩니다.

오류를 제곱하면 큰 실수가 전체 손실에 불균형 적으로 큰 영향을 미치며 특이 치는 심각한 처벌을받습니다.

2. 평균 절대 오류 (MAE)

반면에 Mae는 예측 된 값과 실제 값 사이의 평균 절대 차이를 측정합니다. MSE와 달리 Mae는 오류를 제곱하지 않으므로 이상치에 덜 민감합니다.

MSE와 MAE를 선택하는 것은 데이터의 특성에 따라 다릅니다. 미국 남부에서 7 월의 온도 범위와 같은 극단적 인 특이 치가 있다면, MSE는 큰 편차를 크게 벌이기 때문에 좋은 선택입니다. 그러나 데이터에 가끔 제품 판매가 급증하는 것과 같이 모델에 지나치게 영향을 미치지 않아야하는 특이 치가 포함 된 경우 MAE가 더 나은 옵션입니다.

3. 허버 손실

Hubber Loss는 MSE와 MAE 사이의 타협을 제공하며, 작은 오류는 MSE처럼 작용하고 큰 오류에 대한 MAE. 이것은 큰 오류를 처벌 할 때 유용하지만 너무 가혹하지는 않습니다.

YouTube 예제의 경우 MAE 값은 비디오 당 16,000 조회의 평균 예측 오류로 요약되었습니다. MSE 손실 기능은 큰 오류가 발생하여 4 억 명 이상으로 급등했습니다. Huber 손실은 또한 예측이 좋지 않은 것으로 나타 났지만 MSE보다 큰 오류를 덜 벌인하여보다 균형 잡힌 관점을 제공했습니다. 그러나 이러한 손실 값은 모델 매개 변수를 조정하고 개선을 관찰하는 데 사용될 때만 의미가 있습니다.

분류 모델의 손실 기능

분류 손실 기능은 회귀 손실 함수와 달리 범주 적 예측에서 정확도를 측정합니다. 이러한 기능은 이메일이 스팸인지 여부를 결정하는 것과 같은 실제 범주와 일치하는 확률 또는 레이블이 얼마나 잘 일치하는지 평가합니다.

1. 교차 엔트로피 손실

크로스 엔트로피는 가장 널리 사용되는 분류 손실 기능으로, 모델의 예측이 실제 결과와 비교되는지를 측정합니다. 이러한 맥락에서 엔트로피는 불확실성을 나타냅니다. 코인 플립은 엔트로피가 낮고 6면 다이를 굴리는 것은 엔트로피가 높습니다. 교차 엔트로피 손실은 모델 예측의 확실성을 지상 진실 레이블의 확실성과 비교합니다.

2. 힌지 손실 (SVMS에서 사용)

또 다른 분류 손실 함수는 힌지 손실로, SVMS (Support Vector Machines)에 일반적으로 사용됩니다. 힌지 손실은 클래스 간의 마진을 극대화하기 위해 자신감을 갖는 올바른 예측을 장려합니다. 이로 인해 클래스 간의 구별이 명확 해야하는 이진 분류 작업에서 특히 유용합니다.

손실 함수를 계산하는 것은 모델을 개선하기위한 가이드 역할을합니다. 손실 값은 실제 결과에서 예측이 얼마나 멀리 떨어져 있는지를 나타냅니다. 최적화를 통해 조정을 가능하게합니다. 손실 기능은 학습 과정을 지시하는 피드백 메커니즘 역할을합니다. 낮은 손실은 예측과 실제 결과 사이의 더 나은 정렬을 나타냅니다. YouTube 예측 모델을 조정 한 후, 새로운 예측은 세 가지 기능 모두에서 손실 값이 낮아졌으며 MSE의 가장 큰 개선으로 모델이 쏟아지는 비디오의 큰 예측 오류가 줄어들 었습니다.

손실 기능은 모델 성능을 평가할뿐만 아니라 그라디언트 하강과 같은 최적화 기술을 통해 모델 교육에도 영향을 미칩니다. 그라디언트 하강은 각 모델 매개 변수와 관련하여 손실 함수의 기울기를 계산하여 손실을 최소화하기위한 최적의 방향을 결정합니다. 모델은 손실이 충분히 최소화 될 때까지 무게와 편견을 반복적으로 업데이트합니다.