AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
20 stars 0 forks source link

Neural Networks for Web Content Filtering, 2002, Lee, Fui and Fong, IEEE Intelligent Systems #41

Open AkihikoWatanabe opened 6 years ago

AkihikoWatanabe commented 6 years ago

https://dl.acm.org/citation.cfm?id=630765

AkihikoWatanabe commented 6 years ago

・ポルノコンテンツのフィルタリングが目的. 提案手法はgeneral frameworkなので他のコンテンツのフィルタリングにも使える. ・NNを採用する理由は,robustだから(様々な分布にfitする).Webpageはnoisyなので. ・trainingのためにpornographic pageを1009ページ(13カテゴリから収集),non-pornographic pageを3,777ページ収集. ・feature(主なもの)  - indicative term(ポルノっぽい単語)の頻度  - displayed contents ページのタイトル,warning message block, other viewable textから収集  - non-displayed contents descriptionやkeywordsなどのメタデータ,imageタグのtextなどから収集 ・95%くらいのaccuracy