統合出会い系エンジン(IDE: Integreted Deai Engine).
出会い系マッチングサイトを AI、データ分析、自動化を駆使してハッキングします。Auto Matchingのリメイクです。今回はPythonとSQLをつかっています。
とりあえずスクレイピングしてきたデータをローカルのMySQLに入れて、SQLによるサクラ判定を実装してみました。大体1日に8000レコードずつ溜まっていきますが、サクラ判定をかけると100レコードくらいまで絞り込めます。出会い系サイトの9割の投稿はクズという話はよくききますが、5%の宝を如何にして見つけ出すかが勝負だと思います。
1時間に1度定期実行をかけてクローリングをしています。cronをつかっていたけど、Rundeckといういいツールをみつけたので、こちらで運用中。
Tinderはモチベーションが高まったら対応します。
最低限入れておくものを列挙しておく。
ハッピーメール, ワクワクメール, PCMAX, イククルの4サイトのデータ分析。