Open quebin31 opened 4 years ago
Debido a que el entrenamiento se realiza en "etapas": Por ejemplo para la RCNN primero se tunea una red convolucional con propuestas de regiones. Luego se entrena varias SVM para adaptarse a las características de la red convolucional (convirtiéndose en las detectores de objetos) para finalmente aprender las "cajas" que delimitan los objetos encontrados.
Se consideran desventajas no solo por la inherente complejidad de un entrenamiento en varias etapas sino además por el gasto excesivo de tiempo y espacio durante el entrenamiento. Además, incluso ya entrenadas, la detección de objetos es lenta (al tener que extraer características de cada región propuesta por cada imagen).
Daniela Ccopa Hancco
Porque tanto la R-CNN(Busqueda selectiva + CNN) como la SPPnet (SPP + R-CNN) se realizan en varios procesos para ser especificos en dos procesos y esa es su desventaja ya que son muy lentas ya que deben pasar esos procesos; en cambio Yolo es un algoritmo de un solo proceso por lo que es mucho más rápido.
Además la calidad de la detección podría llegar a dependender del resultado de las otras stages, porque al no ser entrenadas en conjunto con toda la arquitectura los parámetros de cada una no necesariamente son los mejores desde el punto de vista global de la R-CNN, por ejemplo.
Brayan Maguiña del Castillo son multistages porque tenían 3 "bloques" por asi decirlo( CNN, SVM, Bounding box regressor) y al tener esta estructura era una desventaja ya que: -Dificil de entrenar: se tenía que entrenar cada "bloque" por separado. -Era lento: ya que se tenía que calcular un mapa de características para cada propuesta de región. -Requisito de momoria grande: ya que se tenía que guardar cada mapa de características de cada región propuesta.
Nombres y apellidos
Kevin Del Castillo Ramirez
Contexto adicional sobre la pregunta
Cualquier contexto adicional para entender mejor el tema de la pregunta.
Mi posible respuesta
Si crees tener una respuesta pero no estás seguro, colócala aquí.