CS-SI / 2018_ups_iarf-rodeco_schoolproject

Extractions d'un MNT à partir d'un MNS & Rasterisation MNS en 2.5D à partir d'un mesh 3D
0 stars 2 forks source link

Retours sur la réunion du 31/10/2018 #2

Closed amiotc closed 5 years ago

amiotc commented 5 years ago

Ci-dessous, quelques retours sur la réunion. N'hésitez pas à rajouter des sections s'il en manque, ou bien à laisser des commentaires.

Multi Scale

Le principe du multi-scale repose sur la création d'une pyramide. Les images sont sous-échantillonnées : leur taille est réduite. Habituellement, on divise la taille d'une image par 2 dans les deux directions. L'effet du dézoom est de filtrer les hautes fréquences : les images dézoomées ne contiennent que l'information basse fréquence de l'image du niveau précédent. Pour éviter des phénomènes de repliement spectral (lié au dézoom), les radiométries des images dézoomées ne sont pas obtenues par décimation (ie, on ne conserve qu'une ligne/colonne sur deux), mais en appliquant un filtre passe-bas (très souvent un filtre laplacien, gaussien...). Les effets sont bien ceux que vous avez détaillés : en supprimant les hautes fréquences, le bruit et les erreurs d'appariement qui lui sont imputables sont diminués.

Comparaison algorithmique

Cost Volume Filter

Après vérification, le Cost Volume Filter (publication : Fast Cost-Volume Filtering for Visual Correspondence and Beyond, Rhemann et al., 2011) est une approche relativement complexe. Pour mieux analyser les résultats entre les méthodes locales et globales, il faut s'attarder sur le concept de régularisation qui est présent dans les méthodes globales, mais absent dans les méthodes locales.

Note sur les méthodes locales et globales

J'essaierai, dans la mesure du possible, d'expliciter cette différence dans une note spécifique. Je ne pense pas pouvoir le faire avant la fin de ce sprint cependant.

Comparaison des algorithmes

On distingue communément deux approches comparatives :

La première, qualitative, est une observation des données. Cette approche reste très subjective car soumise à l'inspection visuelle d'une personne. L'approche quantitative est celle trouvée dans la plupart des publications. Elle consiste, à l'aide d'une vérité terrain, à quantifier l'erreur commise par l'algorithme. Ainsi, si l'on note VT la vérité terrain (autrement dit, une image contenant les disparités à trouver), et D l'image de disparité obtenue, alors l'erreur commise, en chaque point, vaut : Err(x,y) = |VT(x,y) - D(x,y)| On peut ensuite dériver des statistiques sur l'erreur moyenne, son écart-type, le pourcentage de point ayant une erreur supérieure à 1 pixel etc.

Installation et problèmes techniques

export PATH=/chemin/complet/vers/dossier/binaire:$PATH export LD_LIBRARY_PATH=/chemin/complet/vers/dossier/lib:$LD_LIBRARY_PATH

Loicsadou commented 5 years ago

Bonjour, je n'ai toujours pas bien compris le concept du multi-scale, lors de notre précédente réunion, il me semblait effectivement qu'il était question de faire un sous-échantillonnage. De ce que j'ai compris, il faut faire une recherche de correspondant dans l'image la plus petite, une fois qu'un correspondant est trouvé, il faut chercher le correspondant dans une zone plus ou moins centrée sur le correspondant trouvé dans l'image inférieure. On remonte ainsi jusqu'à l'image non sous-échantillonnée. Du coup, le multi-scale sert à réduire l'espace de recherche ? D'après msmw.pdf, il semblerait que le multi-scale soit aussi utilisé pour réduire les ambiguïtés. Est-ce le cas ? Est-ce juste une conséquence de la réduction de l'espace de recherche ? (On réduit l'espace de recherche donc on espère éliminé les motifs qui se répètent).

Cordialement Loïc.

amiotc commented 5 years ago

L'intérêt du multi-scale est bien de réduire les ambiguités et d'accélérer les temps de calculs. L'utilisation du multi-scale peut réduire la taille de la fenêtre de recherche (en avançant d'une étape à l'autre). Ce faisant, le nombre de calculs est réduit et diminue donc les temps. Mais le multi-échelle n'a pas que cette fonctionnalité : il permet surtout de réduire les ambiguïtés en s'affrichissant, aux basses échelles, du bruit et des hautes fréquences. Aux échelles les plus fines (ie, avec les hautes fréquences), la taille de la zone de recherche est réduite ce qui limite le risque de faux positifs. Donc pour répondre à tes questions, oui le multi-scale réduit l'espace de recherche (à l'échelle correspondant à la résolution de l'image). Il réduit également les ambiguïtés en exploitant les basses fréquences et en réduisant la taille de la fenêtre de recherche d'une échelle à l'autre. Les ambiguïtés sont résolues par l'utilisation conjointes des basses fréquences (ie, de la recherche à des résolutions plus grossières) et par la gestion de la taille de la fenêtre de recherche.