Open AkihikoWatanabe opened 6 years ago
・ポルノコンテンツのフィルタリングが目的. 提案手法はgeneral frameworkなので他のコンテンツのフィルタリングにも使える. ・NNを採用する理由は,robustだから(様々な分布にfitする).Webpageはnoisyなので. ・trainingのためにpornographic pageを1009ページ(13カテゴリから収集),non-pornographic pageを3,777ページ収集. ・feature(主なもの) - indicative term(ポルノっぽい単語)の頻度 - displayed contents ページのタイトル,warning message block, other viewable textから収集 - non-displayed contents descriptionやkeywordsなどのメタデータ,imageタグのtextなどから収集 ・95%くらいのaccuracy
https://dl.acm.org/citation.cfm?id=630765