Open nogawanogawa opened 1 year ago
グラフ協調フィルタリングでデータセット上にはないuser-user間、item-item間の情報をうまく組み込むことで推薦精度を向上させることができたという論文。
グラフ協調フィルタリングモデルでは隣接行列に対してGCN層を重ねて高次の相互作用を取り込んでいく。しかし、一般的に隣接行列にはuser-item間のインタラクション情報しか含まれておらず、情報を十分活用できているとは言えないという課題があった。
そこでこのモデルでは、user-user間、item-item間の情報を使うためにモデルの学習を2回に分けるという手法を提案した。
多くのデータセットでこの手法による精度改善が見られた。
https://www.ueo-workshop.com/wp-content/uploads/2014/04/sig-alternate.pdf
Krishna Kamath, Aneesh Sharma, Dong Wang, Zhijun Yin
UEO ’14
SNSにおけるパーソナライズでは、与えられたユーザーの既存の結びつきに対する関係強度を推定することが重要になる。 Twitterのフォロー関係の強さを計算するにはいくつか問題がある。
1つには、likeやretweetなどの複数の行動があるなかで繋がりの強さをどう扱えばよいかわからない。 もう一つは、2億5千万人以上のアクティブユーザーがおり、数十億のフォローエッジが存在し、毎日数十億のインタラクションが行われている点で、計算規模が非常に大きくなる。 最後に、計算できた繋がりの強さをどう解釈したらよいかわからないという点である。
https://github.com/visenger/awesome-mlops/blob/master/papers.md で見つけた論文
機械学習モデルを実際に運用する際の問題点と、その解決策について調査した論文。
論文では、機械学習のモデル開発者とシステムエンジニアの間にある溝が主な問題点であることが示されている。この溝は、文化やツールの違い、スキルの欠如、プロセスの違いなどによって引き起こされる。
論文では、技術的な解決策と非技術的な解決策が提案されている。技術的な解決策には、モデルレジストリとフィーチャーストアの導入、チームの横断的な再構築、データサイエンティストとシステムエンジニアのペアリングやコードレビューが含まれる。これらの技術的な解決策により、組織内のエンティティがより体系的かつ構造化された方法で作業することができる。
非技術的な解決策には、役割の理解と仲介を担う役割の導入、共通の用語辞書の構築、共通の目標を理解するための翻訳作業が含まれる。これらの非技術的な解決策により、異なる役割やチーム間で共通の言語を持つことができ、製品を共有の責任として理解することができる。また、データの生産者と消費者間の統合についても取り上げられており、データのアクセスやデータの品質管理についての課題があることが指摘されている。
アンチパターン17個(ChatGPTの訳)
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. https://github.com/wantedly/machine-learning-round-table/issues/191
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!