Open fulfulggg opened 1 week ago
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
以下の新しいラベルが作成され、適用されました:
駐車場の空き状況を画像認識で判定する場合、高精度な認識には複雑な計算が必要となり、処理のために中央サーバーにデータを送信する必要が生じます。
この論文では、中央サーバーへのデータ送信を不要にする、軽量な画像認識モデルの開発手法を提案しています。
この論文は、エッジデバイスにおけるリアルタイム画像認識の可能性を広げる、軽量かつ高精度なモデル開発手法を提案しています。
タイトル: 駐車場スペース分類の最適化:アンサンブルモデルから軽量分類器への知識蒸留
リンク: https://arxiv.org/abs/2410.14705
概要:
大規模な機械学習モデルをスマートシティアプリケーション(画像ベースの駐車場監視など)に展開する場合、多くの場合、データは分類タスクを実行するために中央サーバーに送信する必要があります。これは、画像ベースのアプリケーションが大量のデータ送信を必要とする都市のインフラストラクチャにとって課題であり、データを処理するための複雑なネットワークとハードウェアインフラストラクチャが必要になります。画像ベースの駐車場スペース分類におけるこの問題に対処するために、教師モデルとして機能する堅牢な分類器のアンサンブルを作成することを提案します。これらの教師モデルは、エッジデバイスに直接展開できる軽量で専門的な生徒モデルに蒸留されます。知識は、教師モデルによって生成された疑似ラベル付きサンプルを通じて生徒モデルに蒸留され、ターゲットシナリオで生徒モデルを微調整するために使用されます。その結果、教師モデルよりもパラメーター数が26分の1の生徒モデルは、ターゲットテストデータセットで平均96.6%の精度を達成し、平均精度95.3%の教師モデルを上回りました。