axinc-ai / ailia-models

The collection of pre-trained, state-of-the-art AI models for ailia SDK
2.04k stars 325 forks source link

Fix mean of poseresnet #1225

Closed kyakuno closed 11 months ago

kyakuno commented 1 year ago

pose_resnet.pyでは画素値を正規化する部分で、mean = [0.485, 0.456, 0.406], std = [0.229, 0.224, 0.225]を使用しているが、これはRGB順である。

poseresnetではBGR順に適応してしまっており、間違いだと思われる。

https://github.com/axinc-ai/ailia-models/blob/a4ea6f5c6b0b134b6fab289c2fe50addfaa0dc79/pose_estimation/pose_resnet/pose_resnet_util.py#L151

kyakuno commented 11 months ago

下記にあるように、元々のPoseResnetのコードがBGR順にRGBのmeanを適用してしまっているため、現状のコードが正しい。 https://github.com/axinc-ai/ailia-models/pull/1323

kyakuno commented 11 months ago

・poseresnetの大元のリポジトリで、imreadしてBGRのデータに対して、RGB順のmeanとstdを適用している https://github.com/microsoft/human-pose-estimation.pytorch/issues/73 ・ailiaのサンプルはこの手順に沿った実装になっている ・学習時の前処理と推論時の前処理は合わせる必要があり、大元が間違った学習をされている以上、現状のままの方が良い