Open agatan opened 5 years ago
マイクロソフト
A Machine Learning Framework for Programming by Example
人間が入力したセルの値から、自動で値を埋めるルールを作る。
入力(既存のセルの値)→出力(入力したセルの値)という定式化で問題を解ける形にしている。
目標:Input→Outputからプロコンのコードを生成する。読みやすさは考慮しない。
https://arxiv.org/pdf/1703.07469.pdf
DSL
Model Architecture
http://proceedings.mlr.press/v80/sun18a/sun18a.pdf
画像処理の複雑なアルゴリズムを実装し高速に動かそうとすると、アーキテクチャごとの違いによって複雑になったり、シンプルなアルゴリズムのはずなのに複雑で読みづらくなったりする。 そこで、アルゴリズム部分とそれをどう実行するかを分離しよう、というモチベーションのもと開発された C++ 内 DSL 。 微分可能版とかも出ていてかっこいい。
https://openreview.net/forum?id=B1x8anVFPr
Transformer のアーキテクチャを見直そうという論文。 LayerNormalization を FFN や MHA の前に置くと学習が安定して lr scheduling とかもしなくてよくなる。
Why
Machine Learning 輪講は最新の技術や論文を追うことで、エンジニアが「技術で解決できること」のレベルをあげていくことを目的にした会です。
prev. #20
What
話したいことがある人はここにコメントしましょう! 面白いものを見つけた時点でとりあえず話すという宣言だけでもしましょう!