¿Por qué se dice que la R-CNN y SPPnet son procesos multi-stage? Y ¿Por qué se considera un desventaja?

quebin31 / stack-tia

Stack TIA (Preguntas y respuestas)

2 stars 0 forks source link

¿Por qué se dice que la R-CNN y SPPnet son procesos multi-stage? Y ¿Por qué se considera un desventaja? #12

Open quebin31 opened 4 years ago

quebin31 commented 4 years ago

Nombres y apellidos

Kevin Del Castillo Ramirez

Contexto adicional sobre la pregunta

Cualquier contexto adicional para entender mejor el tema de la pregunta.

Mi posible respuesta

Si crees tener una respuesta pero no estás seguro, colócala aquí.

limonadev commented 4 years ago

Debido a que el entrenamiento se realiza en "etapas": Por ejemplo para la RCNN primero se tunea una red convolucional con propuestas de regiones. Luego se entrena varias SVM para adaptarse a las características de la red convolucional (convirtiéndose en las detectores de objetos) para finalmente aprender las "cajas" que delimitan los objetos encontrados.

Se consideran desventajas no solo por la inherente complejidad de un entrenamiento en varias etapas sino además por el gasto excesivo de tiempo y espacio durante el entrenamiento. Además, incluso ya entrenadas, la detección de objetos es lenta (al tener que extraer características de cada región propuesta por cada imagen).

dccopah commented 4 years ago

Daniela Ccopa Hancco

Porque tanto la R-CNN(Busqueda selectiva + CNN) como la SPPnet (SPP + R-CNN) se realizan en varios procesos para ser especificos en dos procesos y esa es su desventaja ya que son muy lentas ya que deben pasar esos procesos; en cambio Yolo es un algoritmo de un solo proceso por lo que es mucho más rápido.

deeiqh commented 4 years ago

Además la calidad de la detección podría llegar a dependender del resultado de las otras stages, porque al no ser entrenadas en conjunto con toda la arquitectura los parámetros de cada una no necesariamente son los mejores desde el punto de vista global de la R-CNN, por ejemplo.

brayan1408 commented 4 years ago

Brayan Maguiña del Castillo son multistages porque tenían 3 "bloques" por asi decirlo( CNN, SVM, Bounding box regressor) y al tener esta estructura era una desventaja ya que: -Dificil de entrenar: se tenía que entrenar cada "bloque" por separado. -Era lento: ya que se tenía que calcular un mapa de características para cada propuesta de región. -Requisito de momoria grande: ya que se tenía que guardar cada mapa de características de cada región propuesta.