Open fulfulggg opened 5 hours ago
人工知能(AI)の食品・栄養研究における進歩は、注釈付き食品データの不足という深刻なボトルネックによって妨げられています。食品のセグメンテーションや分類などのタスク向けに設計された、非常に効率的なAIモデルが登場しているにもかかわらず、それらを実際に応用するにはAIや機械学習の原則に関する知識が必要になる可能性があり、栄養科学分野の非AI専門家にとっては課題となる可能性があります。言い換えれば、AIモデルを、誰でもアクセスできるユーザーフレンドリーなツールに変換する必要があるのです。この問題に対処するため、Segment Anything Model(SAM)を活用した半自動食品画像アノテーションツールのデモを紹介します。このツールは、ユーザーとのインタラクションを通じてプロンプトベースの食品セグメンテーションを可能にし、ユーザーのエンゲージメントを高め、食事画像内の食品項目をさらに分類したり、必要に応じて重量/体積を指定したりできるようにします。さらに、SAMのマスクデコーダーを微調整した、MealSAMと呼ばれるバージョンをリリースします。これは、食品画像のセグメンテーション用に特別に調整されたViT-Bバックボーンを備えています。私たちの目標は、参加、コラボレーション、より多くの注釈付き食品データの収集を促進することでこの分野に貢献するだけでなく、AIを実際のツールに変換することで、より幅広いユーザーがAIテクノロジーを利用できるようにすることです。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
タイトル: SAMベースの半自動食品アノテーションツール
リンク: https://arxiv.org/abs/2410.19756
概要:
人工知能(AI)の食品・栄養研究における進歩は、注釈付き食品データの不足という深刻なボトルネックによって妨げられています。食品のセグメンテーションや分類などのタスク向けに設計された、非常に効率的なAIモデルが登場しているにもかかわらず、それらを実際に応用するにはAIや機械学習の原則に関する知識が必要になる可能性があり、栄養科学分野の非AI専門家にとっては課題となる可能性があります。言い換えれば、AIモデルを、誰でもアクセスできるユーザーフレンドリーなツールに変換する必要があるのです。この問題に対処するため、Segment Anything Model(SAM)を活用した半自動食品画像アノテーションツールのデモを紹介します。このツールは、ユーザーとのインタラクションを通じてプロンプトベースの食品セグメンテーションを可能にし、ユーザーのエンゲージメントを高め、食事画像内の食品項目をさらに分類したり、必要に応じて重量/体積を指定したりできるようにします。さらに、SAMのマスクデコーダーを微調整した、MealSAMと呼ばれるバージョンをリリースします。これは、食品画像のセグメンテーション用に特別に調整されたViT-Bバックボーンを備えています。私たちの目標は、参加、コラボレーション、より多くの注釈付き食品データの収集を促進することでこの分野に貢献するだけでなく、AIを実際のツールに変換することで、より幅広いユーザーがAIテクノロジーを利用できるようにすることです。