quebin31 / stack-tia

Stack TIA (Preguntas y respuestas)
2 stars 0 forks source link

¿Cómo se aplica el spacial pyramid pooling layer y cual es la diferencia con respecto al ROI pooling Layer? #5

Open criloal23 opened 4 years ago

criloal23 commented 4 years ago

Nombres y apellidos

Cristian López Del Alamo

Contexto adicional sobre la pregunta

Cualquier contexto adicional para entender mejor el tema de la pregunta.

Mi posible respuesta

Si crees tener una respuesta pero no estás seguro, colócala aquí.

quebin31 commented 4 years ago

2020-06-05 (10:29:43) Imagen extraída de https://arxiv.org/abs/1406.4729

El spp divide la matriz en pequeñas ventanas en diferentes niveles, o sea inicialmente se puede realizar ninguna división, i.e. 1 ventana, luego 4 ventanas, luego 16 ventanas, donde se realiza el pooling, el resultado es combinado en un vector que siempre tendrá la misma longitud como se puede ver en la imagen de arriba. En contraste, RoI pooling se basa en el concepto de dividir la imagen en ventanas pequeñas de h/H x w/W, donde h y w son la altura y ancho de la imagen, y H y W son hyper-parámetros que dictaminan cuantas ventanas serán generadas, el resultado de esta división genera HxW ventanas, donde en cada una de estas se realiza la operación de pooling y como se puede suponer siempre generará una matriz de HxW sin importar el tamaño de la imagen que entre.

dccopah commented 4 years ago

Daniela Ccopa Hancco

La idea de la agrupación de pirámides espaciales (SPP) ha hecho una contribución significativa a la evolución de R-CNN. La SPP net tiene dos características:

1. Integra el método de la pirámide espacial para proporcionar información de escala a las CNN Una capa de conexión completa o un clasificador siguen a General CNN. Todos necesitan un tamaño de entrada fijo, por lo que deben recortar o deformar los datos de entrada. Este preprocesamiento puede causar pérdida de datos o distorsión geométrica. La primera contribución de SPP Net es la adición de la idea de una pirámide a CNN para lograr la entrada de datos a múltiples escalas.

Como se muestra en la imagen a continuación, se agrega una capa SPP entre la capa convolucional y la capa completamente conectada. Ahora, la entrada a la red podría ser de cualquier escala. En la capa SPP, el filtro de cada agrupación se ajustará en tamaño de acuerdo con la entrada, y la escala de la salida del SPP siempre se establecerá.

imagen

2. Solo extraiga características convolucionales una vez para la imagen original En R-CNN, cada cuadro candidato se redimensiona a un tamaño estándar y luego se divide en la entrada CNN, lo que reduce la eficiencia.

Por otro lado, SPP Net solo aplica una convolución para obtener un mapa de características completo, luego encuentra el parche de mapa del mapa de naturaleza de cada cuadro candidato y trata este parche como una entrada de característica convolucional de la capa SPP y las capas posteriores. Esto ahorra mucho tiempo informático, ya que es cien veces más rápido que R-CNN.

imagen

La SPP net agrega un SPP entre la última capa de convolución y la capa de unión completa posterior. ROI pooling layer es una versión simplificada de la capa SPP que se asigna desde el área de mapa original al área conv5, la última agrupación a una función de tamaño fijo. La capa de agrupación de ROI transforma la matriz característica de ROI en una matriz presentada normalizada más pequeña utilizando la capa de agrupación máxima a una amplitud sapacial fija HXW.

heygonzalocaira commented 4 years ago

Gonzalo Caira Aguilar

ROI pooling Layer es un caso especial de la capa de agrupación de spacial pyramid pooling layer (SPP) con un solo nivel de pirámide. La capa básicamente divide las características de las ventanas de propuesta seleccionadas (que provienen del algoritmo de propuesta de región) en subventanas de tamaño h / H por w / W y realiza una operación de agrupación en cada una de estas subventanas. Esto da lugar a características de salida de tamaño fijo de tamaño (H x W) independientemente del tamaño de entrada. H y W se eligen de modo que la salida sea compatible con la primera capa totalmente conectada de la red.

 ROI pooling Layer como un caso especial de la SPP Layer 

2