Open e4exp opened 3 years ago
物体認識は過去10年間で大きな進歩を遂げましたが、主に、物体のカテゴリーごとに多くの高品質な学習例に依存しています。 これに対して、わずかな例から新しい物体を学習することができれば、ロボット工学からユーザーのパーソナライゼーションまで、多くのインパクトのあるアプリケーションを実現することができます。 しかし、少数例からの学習に関する研究のほとんどは、ベンチマークデータセットを用いて行われており、これらのアプリケーションが実世界で展開されたときに直面するような高いバリエーションを持っていない。 このギャップを埋めるために、我々はORBITデータセットとベンチマークを発表します。 このデータセットは、盲目や弱視の人のためのティーチング可能な物体認識装置という実世界のアプリケーションに基づいています。 ORBITデータセットには、視覚障害者が携帯電話で撮影した486個の物体に関する3,822本の動画が含まれており、また、ベンチマークには、現実的で非常に困難な認識問題が反映されています。 このベンチマークは、現実的で非常に難易度の高い認識問題を反映しており、数ショットの高変動条件に対するロバスト性の研究を促進する豊かな遊び場となっています。 私たちは、このベンチマークで初めて最先端の技術を確立し、さらなるイノベーションの余地があることを示しました。 データセットとベンチマークコードはこちらのhttps URLからアクセスできます。 https://github.com/microsoft/ORBIT-Dataset
物体認識は過去10年間で大きな進歩を遂げましたが、主に、物体のカテゴリーごとに多くの高品質な学習例に依存しています。 これに対して、わずかな例から新しい物体を学習することができれば、ロボット工学からユーザーのパーソナライゼーションまで、多くのインパクトのあるアプリケーションを実現することができます。 しかし、少数例からの学習に関する研究のほとんどは、ベンチマークデータセットを用いて行われており、これらのアプリケーションが実世界で展開されたときに直面するような高いバリエーションを持っていない。 このギャップを埋めるために、我々はORBITデータセットとベンチマークを発表します。 このデータセットは、盲目や弱視の人のためのティーチング可能な物体認識装置という実世界のアプリケーションに基づいています。 ORBITデータセットには、視覚障害者が携帯電話で撮影した486個の物体に関する3,822本の動画が含まれており、また、ベンチマークには、現実的で非常に困難な認識問題が反映されています。 このベンチマークは、現実的で非常に難易度の高い認識問題を反映しており、数ショットの高変動条件に対するロバスト性の研究を促進する豊かな遊び場となっています。 私たちは、このベンチマークで初めて最先端の技術を確立し、さらなるイノベーションの余地があることを示しました。 データセットとベンチマークコードはこちらのhttps URLからアクセスできます。 https://github.com/microsoft/ORBIT-Dataset