¿Explique algunas limitaciones de Yolo y de algunas razones por las cuales se dan?

quebin31 / stack-tia

Stack TIA (Preguntas y respuestas)

2 stars 0 forks source link

¿Explique algunas limitaciones de Yolo y de algunas razones por las cuales se dan? #7

Open criloal23 opened 4 years ago

criloal23 commented 4 years ago

Nombres y apellidos

Cristian López Del Alamo

Contexto adicional sobre la pregunta

Cualquier contexto adicional para entender mejor el tema de la pregunta.

Mi posible respuesta

Si crees tener una respuesta pero no estás seguro, colócala aquí.

jelasus commented 4 years ago

imagen

En la imagen vemos el tensor 7x7x30 de salida de una Yolov1, que se divide en tres partes, los colores verde y morados corresponden a las grillas de la imagen y sus valores de localización y clasificación del objeto. Las 20 posiciones restantes corresponden a 20 copias de la imagen secccionada para cada clase. Justo la limitante clasificación de Yolo es este tensor de salida ajustado a 20 clases. Tambien se puede decir que porque las grillas aprenden a detectar solo un objeto, no podían detectar dos o más objetos que tengan en la misma grilla sus centroides.

dccopah commented 4 years ago

Daniela Ccopa Hancco

YOLO tiene los isguientes limites:

Impone fuertes restricciones espaciales en las predicciones de cuadro ya que cada celda de la cuadrícula solo predice dos cuadros y solo puede tener una clase. Esta limitación espacial restringe a YOLO en el número de objetos cercanos que YOLO puede predecir.
YOLO lucha con pequeños objetos dentro de la imagen, por ejemplo, podría tener dificultades para detectar una bandada de pájaros. Esto se debe a las restricciones espaciales del algoritmo
YOLO al entrenar la función de pérdida trata a los errores en cuadros delimitadores pequeños versus límites de las cajas grandes. Un pequeño error en una caja grande es generalmente bueno pero un pequeño error en un cuadro pequeño tiene un efecto mucho mayor en IOU. Lo que ocaciona las localizaciones incorrectas.

Loudev19 commented 4 years ago

Solo para agregar al punto 3 de la respuesta anterior, YOLO si trata ese problema y lo hace sacando la raiz cuadrada al ancho w y el alto h de la caja (bounding box) predicha. Por ejemplo, si el modelo predice 2 cajas (uno más grande que la otra) con un error de 5 píxeles en el ancho de ambos cajas, tomando la raíz cuadrada aumentamos el error cuadrado para la cja pequeña.

criloal23 commented 4 years ago

Correcto MBlev !!!!

deeiqh commented 4 years ago

Además, el proceso de generación de los Bounding Boxes centrados en la celda de la grilla no considera que por lo general, y dependiendo del contexto, algunos Boxes podrían tener una forma esperada. Por ejemplo, si se va a usar Yolo en una autopista las fromas esperadas serían las que contiene a una persona o a un auto. Entonces, esto podría afectar el valor de la box confidence. Pero, Yolo2 considera esto al usar los anchor boxes.