Open agatan opened 3 years ago
https://arxiv.org/pdf/1902.10730.pdf AIES 2019. DeepMind
src:https://arxiv.org/pdf/1911.11130.pdf
CVPR 2020のBest Paper Award。著者はOxford大学の人。
画像を入力すると、Viewpoint(カメラ位置)/Depth map/Albedo(表面の光の反射)/Light(=撮影時の光)に分解するAutoEncoderを構築した。上記4要素を組み合わせて画像を再構築し、元画像との誤差を用いて学習する。
上記4要素の値をいじることで
https://sigir.org/sigir2020/accepted-papers/
コールドスタート問題に対応する系が多かった印象を受けた。あと流行りの因果推論などによる bias 除去系。BERT 発展しました系もちょっとだけあった。あと Hash 多い。
Facebook の検索に Embedding を使った retrieve を使っているという話。 普通の embedding based retrieval と違って social graph や location の情報を加味した検索をする必要があり、それらの情報を unify した仕組みを提案している。
疑似コードなのか本物なのか知らないけど、 (nn <key> :radius <radius>)
という検索クエリ拡張をするらしくてちょっと面白い。(
一度の forward で N 回 Dropout させた N 個の出力を作り、それぞれで loss を計算したのちに平均をとって全体の loss とすることで、学習速度を向上させることができる & error rate も低くなって最高、という論文。
終盤の dropout だけ複製を作れば良いので、計算量を抑えつつ学習効率を増すことができる。実装も簡単そうだし、コンペとかで使えそうだなと思いました。( kaggle tweet コンペの闇と光 (コンペ概要と上位解法) で紹介されていたので読みました)
https://ai.googleblog.com/2020/07/smartreply-for-youtube-creators.html
gmail にあった SmartReply を YouTube のコメント返信にも使えるようにした、という報告と、その進化の過程を説明しているブログ。 Seq2seq だと遅いから predefined list から embedding based な retrieval するようにしたり、絵文字や多言語に対応するために word-by-word → character based に変更したり、dilated transformer で推論速度を上げたり。
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. #56
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!