tkuri / papers

Summarizing the papers I have read (Japanese)
41 stars 1 forks source link

Large datasets: A Pyrrhic win for computer vision? #328

Open tkuri opened 3 years ago

tkuri commented 3 years ago

論文概要

AIの発展に著しく貢献してきたImageNet等の大規模データセットの倫理的な問題点を指摘した論文。データセット中の人物画像は個人の同意や承認なしに取得され多くの論文に使われている。CV分野においては大きな勝利であるが個人のプライバシーを侵食する事を助長したと主張。

また、様々なデータセットの人物画像を解析したところ、倫理的に問題が大きい子供の非同意画像や盗撮画像、ポルノ画像等がこれらの大規模なデータセットから散見された。 彼らはデータセットの倫理性を判断するための、監査方法を提案し、普及を推進している。 分析結果等。

彼らはImageNet等の学術的な貢献をAI分野におけるブレークスルーとし関係者を評価・賞賛する一方、思慮深い研究者でもこれらデータセットのキュレーション手順のような伝統に挑戦するような倫理感や正義を自発的に持つのは非常に難しいので、何らかの報酬系システムを確立する必要があると述べている。

bib_20210115 00 https://arxiv.org/abs/2006.16923

Code

https://github.com/vinayprabhu/Dataset_audits