quebin31 / stack-tia

Stack TIA (Preguntas y respuestas)
2 stars 0 forks source link

¿Cuál es la desventaja de la RCNN y cómo lo resuelve la SPP-NET? #3

Open criloal23 opened 4 years ago

criloal23 commented 4 years ago

Nombres y apellidos

Cristian López Del Alamo

Contexto adicional sobre la pregunta

Cualquier contexto adicional para entender mejor el tema de la pregunta.

Mi posible respuesta

Si crees tener una respuesta pero no estás seguro, colócala aquí.

quebin31 commented 4 years ago

El principal problema con la R-CNN es que no comparte poder computacional, esto se debe a que cada región propuesta es pasada por el backbone CNN por separado, esto es demasiado lento ya que el algoritmo de selective search generalmente propone unas 2000 regiones, la SPPnet resuelve este problema primero pasando toda la imagen por la CNN e introduciendo el pooling piramidal espacial que como vimos en clase realiza poolings en múltiples niveles resultando en un vector de tamaño fijo (esto se realiza para cada región propuesta). La ventaja está en compartir el poder del backbone CNN.

dccopah commented 4 years ago

Daniela Ccopa Hancco

Desventajas de RCNN:

La SPP soluciono la mayoría de sus de sus deventajas de la R-CNN porque saca características por regiones del mapa en una CNN y no lo realiza por cada región de interés; en lugar de aplicar 2.000 veces CNN a las áreas propuestas, solo pasa la imagen original a un modelo CNN previamente entrenado una vez.

StarUnu commented 4 years ago

La RCNN necesita imágenes del mismo tamaño(227x227) ya que en la ultima capa de la CNN hay una capa full conected. Entonces al reajustar las regiones propuestas ocasiona perdida de datos que posiblemente sean claves para reconocer la imagen. Esto puede producir distorciones geometrica. Ademas la red RCNN realiza una CNN por cada region propuesta(alrededor de 2000) ocupando mucha memoria y recursos de la computadora, en cambio la SPP realiza una CNN. Para obtener este resultado la red SPP cambia la ultima capa full conected de la CNN por una capa Spatial pyramid pooling(SPP) que es ubicada antes de la ultima convolución de la CNN. La capa SPP es capas de recibir diferentes tamaños de imágenes, gracias a que realiza operaciones de max pooling para generar un vector de salida fija. Como la SPP es más rapida que la RCNN se puede realizar aplicaciones en el mundo real. https://arxiv.org/pdf/1406.4729.pdf .

skdi commented 4 years ago

André Mogrovejo Martínez

Una de las principales desventajas de R-CNN es que al tomar una imagen, esta es segmentada mediante regiones propuestas, tal que si el objeto que queremos detectar es mas grande que esta región, será recortado o transformado, deformando la imagen y por lo tanto perdiendo características de la misma. Fast

SPP-NET cambia la ultima capa fully connected por una capa SPP Spatial pyramid pooling, la cual recibe diferentes imágenes de distintos tamaños, a la cuales les realiza una operación de max pooling para generar un vector de salida fija el cual es trabajable. spp

fuente: https://arxiv.org/pdf/1406.4729.pdf