¿Podría explicar, en palabras, y de la manera más simple, como es la función de pérdida y que toma en cuenta en Yolo ?

criloal23 commented 4 years ago

Nombres y apellidos

Cristian López Del Alamo

Contexto adicional sobre la pregunta

Cualquier contexto adicional para entender mejor el tema de la pregunta.

Mi posible respuesta

Si crees tener una respuesta pero no estás seguro, colócala aquí.

jelasus commented 4 years ago

La función de pérdida YOLOv1, realmente es una regresión de las predicciones: (bounding box, class object), en la que podemos destacar tres sub-minimizaciones. La primera corresponde a los ajustes de la predicción de la bounding box (localizacion) : su centro (x,y), y el alto y ancho (w,h). El ajuste de clasificación obtiene el error de la clase predicha p(c). El tercero es un ajuste de la confianza de que el objeto se encuentre o no en una caja(grilla). Los parámetros lambda son muy parecidos a los lambda de una regularización de regresión lineal, siendo el valor de λ_coord predefinido 5, lo que significa que le da importancia a ajustar los valores de localización. (ver imagen) loss_func_yolo

source 1 source 2

dccopah commented 4 years ago

Su objetivo de la función de pérdida en YOLO es hacer encajar la caja predicha al ground truth. Y toma en cuenta los siguientes puntos:

1. CENTRO DE LA CAJA: Encajar el centro de la caja predicha con el centro de la caja ground truth; donde X y Y( centro de la caja predicha) y X^ y Y^(centro de la caja ground truth) y lo que hace es obligar a centrar la caja predicha a la caja del ground truth. 2. TAMAÑO DE LA CAJA: Trata de que el ancho(W) y alto(H) de caja predicha sea lo mas parecido con la caja real. 3. CLASE A DONDE PERTENECE: Trata de predecir a que clase(C) a donde pertenece sea correcta. 4. PROBABILIDAD DE PERTENENCIA DE LA CAJA: Ve la probabilidad sea la adecuada.

lossYOLO

quebin31 commented 4 years ago

Agregando en lo que mis compañeros ya explicaron, la función solo se aplica cuando dentro de la grilla existe un objeto o no, denotado respectivamente por 1^{obj} y 1^{noobj}, esto es así porque son los casos que realmente se desean optimizar.

skdi commented 4 years ago

André Mogrovejo Martínez

lossfunction

Donde:

Primer termino: La Bonding box de las coordenadas x,y estan parametrizadas, tal que varian entre valores [0,1], donde la SSE es estimada solo cuando hay un objeto.

Segundo termino: La Bounding box del ancho y alto estan normalizadas entre valores de [0,1], solo se calcula el SSE cuando hay un objeto contenido, se utiliza la raiz cuadrada como delimitador en a la diferencia de tamaños en las cajas. El tercer y cuarto termino: Llamados la confidencia IOU, debido a que En cada imagen, muchas celdas de la cuadrícula no contienen ningún objeto, siendo las celdas vacias nombradas con el valor de 0. El quinto termino: Las probabilidades de clases, el SSE se calcula cuando hay objetos. Lambda coord: Debido a la misma razón mencionada en los términos tercero y cuarto, λcoord = 5 para aumentar la pérdida de las predicciones de coordenadas del cuadro delimitador fuente: https://towardsdatascience.com/yolov1-you-only-look-once-object-detection-e1f3ffec8a89

FranklinCncr commented 4 years ago

La función de pérdida se compone de tres factores:

Pérdida de Clasificación: es el error al cuadrado de las probabilidades condicionales para cada clase.
Pérdida de Localización: mide los errores en las ubicaciones de acuerdo a las coordenadas "x" , "y" y errores de anchura y altura del cuadro de límite predichos.
Pérdida de Confianza: mide la objetividad(objectness) y presenta dos modos de calculo, dependiendo si detecto o no un objeto.

quebin31 / stack-tia