Open gwleeee opened 1 year ago
https://arxiv.org/abs/2302.09790v1 https://github.com/vefalun/HTNet ICASSP 2023
각각의 세 파트로 네트워크가 분리되어 있으나, 한 파트의 출력이 다음 파트의 입력에 더해지는 구조임
Graph convolution network 기반의 아기텍쳐
G=(V,A) / V: 스켈레톤 정보 / A: 인접 행렬
diagonal node degree matrix는 주대각 성분만을 0이 아닌 값을 가지며, 각 노드의 인접한 노드의 개수를 성분으로 가짐
여기서의 GCN은 인접행렬 정보를 노드정보에 취합하여 성분을 전파시키고, weight 매트릭스를 통해 특정 노드 성분을 조합, 강화함
(X → GCN → GELU → GCN) + X 와 같은 residual 구조로 되어있음
Multi-head Self-attention 을 이용하여 human body의 global context를 캡쳐
세가지 모듈을 통과한 각각의 텐서를 concat하고 MLP를 통과혀여 출력 3D joints를 유도
HTNet: Human Topology Aware Network for 3D Human Pose Estimation
https://arxiv.org/abs/2302.09790v1 https://github.com/vefalun/HTNet ICASSP 2023
Abstract
Introduction
Methodology
각각의 세 파트로 네트워크가 분리되어 있으나, 한 파트의 출력이 다음 파트의 입력에 더해지는 구조임
Local joint-level connection (LJC)
Graph convolution network 기반의 아기텍쳐
G=(V,A) / V: 스켈레톤 정보 / A: 인접 행렬
diagonal node degree matrix는 주대각 성분만을 0이 아닌 값을 가지며, 각 노드의 인접한 노드의 개수를 성분으로 가짐
여기서의 GCN은 인접행렬 정보를 노드정보에 취합하여 성분을 전파시키고, weight 매트릭스를 통해 특정 노드 성분을 조합, 강화함
(X → GCN → GELU → GCN) + X 와 같은 residual 구조로 되어있음
Intra-part connection (IPC)
Global body-level interaction (GBI)
Multi-head Self-attention 을 이용하여 human body의 global context를 캡쳐
세가지 모듈을 통과한 각각의 텐서를 concat하고 MLP를 통과혀여 출력 3D joints를 유도
Experiments