misskey-dev / summaly

🔍 Get a summary of any web page
MIT License
22 stars 10 forks source link

センシティブ判定にratingメタデータも併せて使用する #21

Closed moko256 closed 1 week ago

moko256 commented 10 months ago

Googleのセーフサーチはセンシティブ判定に、

<meta name="rating" content="adult">
<meta name="rating" content="RTA-5042-1996-1400-1577-RTA">

のようなメタデータを参照するそうで、サイトがセンシティブかどうかを判断する基準の一つとして使えそうです。 https://developers.google.com/search/docs/crawling-indexing/safesearch?hl=ja#add-metadata

また、HTTPヘッダーに、

rating: RTA-5042-1996-1400-1577-RTA

が含まれるかどうかでも判定が可能なようです。

P〇rnHubがメタタグ・HTTPヘッダー両方に対応しており、このメタデータを使用することでセンシティブと判定できるようになります。DLsiteはメタタグのみ対応。Twitterは非対応。