Open GENZITSU opened 1 year ago
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
メンタリングはチーム作りをする上でもとても重要な下地になると思うが、軽視されることが多い印象がある。
まずは重要な業務であるという認識合わせからしていくべきか。
CPMPさんによる売上予測や不正検知などの時系列予測モデルのモデリング方法とその注意点を解説した資料
勉強になったスライドを抜粋
売り上げ予測に関しては特徴として利用できる期間と予測すべき期間の間に時間的なギャップが生じることがある
gap期間を設けた状態でhistoryとtargetのペアを作成 → history期間中から特徴量を生成
時系列に沿ったvalidationを実施する
トレンド成分からの乖離を予測する場合もある
最近のデータが重要なので、重み付けをすることも
モデルの予測値を再帰的に入力して、系列予測をする方法
各時点ごとのモデルを作成する方法
入力と系列のgapを特徴量にする方法
商品によっては課題予測はそこまで大きな問題にならないケースがある
種々のイベントによる影響も大きいのでできるだけ特徴量に組み込む
不正の数は本当に少ない、そして検出すべき不正が本当に正しいものかの確認を怠らないようにする
系列予測の方法が特に勉強になった。
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
– テックリードはチームの誰よりも技術力に優れた人物が引き受けるわけではない
プロセスやツールよりも個人と対話を、
包括的なドキュメントよりも動くソフトウェアを、
契約交渉よりも顧客との協調を、
計画に従うことよりも変化への対応を
ここで書かれているテックリードの職責はかなり重たいが、給与とのバランスはちゃんと釣り合うものなのだろうか...
jupyter上で対話的にデバックする方法の紹介
エラー発生直後に%debugを打つか、%pdb onを設定することでエラー発生時に自動的にpdbに入ることが可能
EDAする際のでバックに便利だった
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
ここまでくると実務経験がないのであまりピンとこなくなってくるな...
新規広告に対するコンバージョン予測精度を向上させるため、広告カテゴリ / 広告主 / キャンペーン種別などの広告の階層性を活用した事例の紹介
階層性を活用してCVRが2.0%向上しているのがすごい
convolution や deconvolutionが行列演算としてどう計算されているかを解説している記事
恥ずかしながらなぁなぁにしていた部分だったので勉強になった
Yahooのトップページにどのニュースを表示するかの推薦システムと試行錯誤の歴史を紹介しているスライド
気になったスライドを抜粋
ユーザーのベクトルと記事のベクトルを事前に計算しておいて、optimizer APIがユーザー訪問時に記事を推薦
BERTやGRUを用いて記事ベクトルとユーザーベクトルを取得している
類似度ベースの手法やクラスタリングベースの手法を適応
現在は表示する他の記事も含めて多様性を計算できないかを試しているが、計算時間が重たいことがネックとのこと
dislikeした記事を用いてuserベクトルを求めたり、dislikeするかどうかを使ってみるのはよいが、なぜdislikeされるかの理由が様々あるため難しいらしい。
少数群に対するA/Bテストを行う場合は非対称群に対する性能が支配的になる
推薦システムのアーキテクチャー参考になる
2022年4月にGoogleが開発した大規模言語モデルPaLMの学習にどれくらいお金がかかったかを見積もっている記事
Googleは計算機を保有しているので正確な値ではないが、GCPでインスタンスを購入した場合は以下のような見積もりができるとのこと
Our three (not independent!) methods estimate $17M, $23.1M, and $9.2M for the final training cost of PaLM.
だいたい20 ~ 30億円くらいのモデル...
30代人間のFLOPSは10 ** 26オーダーらしいので、2,3000億円用意すれば人間相当のモデルが作れる
またCompute Trends Across Three Eras of Machine Learningによると最近の大規模言語モデルは10ヶ月で倍になると言う傾向があり、PaLMのFLOPSが2 x 10*24程度であることを考えるとあと4,5年程度でそこに到達する見込みである
IBIS 2022にてオムロンサイニエックスが実施したFederated Learningのチュートリアル資料
Federated Learningがもつ様々な課題に対する近年の研究動向が詳細にまとめられている。
以下はまとめページの抜粋
非常に勉強になる。面白い。
Federated Learningを用いたスタンプレコメンデーションを実現するシステムアーキテクチャーの紹介
ユーザーのテキスト入力から適切なスタンプを推薦するタスク
今回はLINEスタンプのプレミアムプランに登録されているのみを対象
サーバーサイドで事前に候補を絞っておき、クライアントサイドで最終的なスタンプ推薦を実施すると言う構成
クライアントサイドで使用されるユーザーベクトルはここクライアントでパーソナライズされていて、スタンプ推薦モデルはFederated Learningにより更新される
利用しているモバイルOSごとにONNXで最適化している
個々のクリックイベントではなく、クライアントサイドで学習されたモデルを収集してグローバルモデルの更新 (単純平均ベース)を行っている
また差分プライバシーとして、モデルにノイズを載せてサーバーに送信
実務でFederated Learningを用いることはまだ稀だと思うので、アーキテクチャー例がとても参考になる
エンジニアのためのマネジメントキャリアパス ~1章 マネジメントの基本 ~
エンジニアのためのマネジメントキャリアパスを読んだので要点をまとめていく
できる上司が持つべき特徴
1 on 1 ミーティングの実施
フィードバックと指導
トレーニングとキャリアアップ
自分に対する責任は自分で負う
上司も人の子
コメント
まだピンとくることが少ないが、今後のためにメモしておく
出典
エンジニアのためのマネジメントキャリアパス