アプリのURL: https://the-pelican.herokuapp.com
※ サーバー代の都合で、最新記事の取り込みのcronは止めているため、記事はアップデートされていません。
Pelican
アジェンダ
- 使用したライブラリ・フレームワーク
- アプリデモと仕様紹介
- 関連記事を算出する仕組み
- 表示高速化の工夫
1. 使用したライブラリ・フレームワーク
バックエンド
- Ruby on Rails 4.2.0
- PostgreSQL
フロントエンド
記事取得・推薦記事選定用
- MeCab
- natto
- nokogiri
- whenever
- cron jobsをシンプルに書くためのライブラリ
2. アプリデモと仕様紹介
3. 関連記事を算出する仕組み
ニュースデータの取得
- cron設定のgithub上のソースコードはこちら
キーワード抽出
- tf-idf法計算メソッドを持ったクラスと、本文に対してtf-idf法を行っているバッチ処理を実装したソースコードはこちら
文書ベクトルの類似度
- コサイン距離測定はtf-idfクラス内のインスタンスメソッドで行い、それをバッチ処理中で使用する。github上のソースコードはこちら。
補足
4. 表示の高速化の工夫
UI/UX に関する補足