Open fulfulggg opened 4 hours ago
ヨガポーズの自動認識を改善する研究: 近年注目されているヨガのポーズを、コンピュータが自動で認識できるよう精度向上を目指した研究。
大量のヨガポーズデータを使用: 82種類のヨガポーズを含む「Yoga-82」という大規模なデータセットを活用。これは難しいポーズも含まれている。
転移学習で効率的に学習: 画像認識で優秀な成績を持つ既存のモデル(VGG-16, ResNet-50, ResNet-101, DenseNet-121)をベースに、ヨガポーズ認識用にカスタマイズ(ファインチューニング)。
ニューラルアーキテクチャサーチで最適化: ベースモデルに追加する層の構造を、自動的に最適化することで、さらに精度を向上させた。
DenseNet-121が最高性能: 試したモデルの中でDenseNet-121が最も良い結果を示し、82種類のポーズを高い精度(top-1精度85%、top-5精度96%)で認識できた。これは従来の技術を上回る成果。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
タイトル: 転移学習を用いたヨガポーズ分類
リンク: https://arxiv.org/abs/2411.00833
概要:
ヨガは近年、心身の健康を維持する上で欠かせないものとなっています。生活が忙しくなり、在宅勤務が増える中で、ジムに通って運動する時間を確保するのは難しくなってきています。人間のポーズ推定は、体の主要なポイントや関節の位置を特定する必要があるため、重要な課題の一つです。82種類のヨガポーズを収録した大規模データセット「Yoga-82」は、正確なアノテーションが困難な難しいポーズを含んでいます。本研究では、VGG-16、ResNet-50、ResNet-101、DenseNet-121を用い、それぞれ異なる方法でファインチューニングを行い、より良い結果を得られるようにしました。また、ニューラルアーキテクチャサーチを用いて、これらの学習済みモデルに追加の層を構築しました。実験の結果、DenseNet-121が最も高い性能を示し、top-1精度85%、top-5精度96%を達成し、現在の最先端技術を上回る結果となりました。