Closed kyakuno closed 11 months ago
下記にあるように、元々のPoseResnetのコードがBGR順にRGBのmeanを適用してしまっているため、現状のコードが正しい。 https://github.com/axinc-ai/ailia-models/pull/1323
・poseresnetの大元のリポジトリで、imreadしてBGRのデータに対して、RGB順のmeanとstdを適用している https://github.com/microsoft/human-pose-estimation.pytorch/issues/73 ・ailiaのサンプルはこの手順に沿った実装になっている ・学習時の前処理と推論時の前処理は合わせる必要があり、大元が間違った学習をされている以上、現状のままの方が良い
pose_resnet.pyでは画素値を正規化する部分で、mean = [0.485, 0.456, 0.406], std = [0.229, 0.224, 0.225]を使用しているが、これはRGB順である。
poseresnetではBGR順に適応してしまっており、間違いだと思われる。
https://github.com/axinc-ai/ailia-models/blob/a4ea6f5c6b0b134b6fab289c2fe50addfaa0dc79/pose_estimation/pose_resnet/pose_resnet_util.py#L151