peach-hack / auto-matching-reiwa

Integrated Deai Engine(IDE: 統合出会い系エンジン) - 令和版
5 stars 1 forks source link
erotech ide jupyter-notebook mysql pandas python scrapy tinder

Auto Matching(令和版)

Open Source Love

概要

統合出会い系エンジン(IDE: Integreted Deai Engine).

出会い系マッチングサイトを AI、データ分析、自動化を駆使してハッキングします。Auto Matchingのリメイクです。今回はPythonとSQLをつかっています。

とりあえずスクレイピングしてきたデータをローカルのMySQLに入れて、SQLによるサクラ判定を実装してみました。大体1日に8000レコードずつ溜まっていきますが、サクラ判定をかけると100レコードくらいまで絞り込めます。出会い系サイトの9割の投稿はクズという話はよくききますが、5%の宝を如何にして見つけ出すかが勝負だと思います。

1時間に1度定期実行をかけてクローリングをしています。cronをつかっていたけど、Rundeckといういいツールをみつけたので、こちらで運用中。

Tinderはモチベーションが高まったら対応します。

新規環境構築

最低限入れておくものを列挙しておく。

出会い系大手4サイトの統計データ分析

ハッピーメール, ワクワクメール, PCMAX, イククルの4サイトのデータ分析。