leoxiaobin / deep-high-resolution-net.pytorch

The project is an official implementation of our CVPR2019 paper "Deep High-Resolution Representation Learning for Human Pose Estimation"
https://jingdongwang2017.github.io/Projects/HRNet/PoseEstimation.html
MIT License
4.31k stars 909 forks source link

请教代码意思。 #241

Closed YuQi9797 closed 3 years ago

YuQi9797 commented 3 years ago

https://github.com/leoxiaobin/deep-high-resolution-net.pytorch/blob/ba50a82dce412df97f088c572d86d7977753bf74/lib/dataset/mpii.py#L58

作者您好,请问下这里避免裁剪到肢体, 是自己自定义轻微调整center 和 scale的值吗? 具体表示的是什么意思呢? 纵坐标和尺度发生变化?

hebangwen commented 3 years ago

看这部分代码的含义应该是center向右平移15*s[1],bbox框扩大到1.25倍,从而多获得一些图片上的信息以获得更好的姿态估计结果。这里乘了1.25之后框变大了,大概就是这个原理。

leijue222 commented 2 years ago

看这部分代码的含义应该是center向右平移15*s[1],bbox框扩大到1.25倍,从而多获得一些图片上的信息以获得更好的姿态估计结果。这里乘了1.25之后框变大了,大概就是这个原理。

https://github.com/leoxiaobin/deep-high-resolution-net.pytorch/blob/ba50a82dce412df97f088c572d86d7977753bf74/lib/dataset/coco.py#L223-L227 请问您知道为什么是放大1.25倍吗?以及为什么self.pixel_std固定设置为200。关于1.25和200这两个trick值的设定该如何解释

hebangwen commented 2 years ago

看这部分代码的含义应该是center向右平移15*s[1],bbox框扩大到1.25倍,从而多获得一些图片上的信息以获得更好的姿态估计结果。这里乘了1.25之后框变大了,大概就是这个原理。

https://github.com/leoxiaobin/deep-high-resolution-net.pytorch/blob/ba50a82dce412df97f088c572d86d7977753bf74/lib/dataset/coco.py#L223-L227

请问您知道为什么是放大1.25倍吗?以及为什么self.pixel_std固定设置为200。关于1.25和200这两个trick值的设定该如何解释

你好,下面是我个人认为的解释: