Open bishopfunc opened 2 years ago
どんなもの?(Abstract,Conclusion) 進化的実験計画法(Evo-DoE: evolutionary design of experiments)を使った機械学習により無細胞タンパク質合成を向上できる。過去の実験結果と実験結果の確率的探索を組み合わせた。進化の目的は目標物質の収量だと定義された。実験結果は標準より350%高い収量を得た。発見された最良の実験条件を分析したところ、2つの異なるクラスの反応速度があることがわかった。1つは最大値に到達した後に平衡状態になる、2つは初期に下がってのちに急激に上がる。
先行研究と比べてどこがすごいの?(先行研究,どんな問題を解決した) 単一の因子を逐次的に調整しても合成プロセス(収量)に効果がない 非線形性の強い相互作用が存在するため、同時にパラメータを調整する必要がある、それは難しい Evo-DoE (Caschera et al., 2010; Theiset al., 2006)はML+roboticの手法と違い人の手も加わる。また、実験結果の向上を第一にしており、仮説生成(Hypothesis Generation, DS用語)を二の字にしている。
技術や手法の"キモ"はどこにある?(新規点,どう解決した) R言語のnnetライブラリを使用し、誤差逆伝播法で学習した 16入力1出力のニューラルネットワーク、メタパラメータである重み減衰と隠れ層の数は40のデータセットからバギング法でランダムに選択した 第2〜4世代まで進化させ、1,572,864の実験をpredicted-fitness-proportional sampling criterion(予測適合度比例サンプリング基準)でサンプリングした?
どうやって有効だと検証した?(実験手法) 2つの異なるクラスの反応速度はTOP30の実験のグラフから見られたが、収量が300%上がった実験は書かれてない。 ~0.014%の実験空間をサンプリングしたのみで得られた、更なる最適化の可能性もある
議論はあるか?(未解決点,応用例) 今回はeGFPだが他の種類のタンパク質にも
次に読むべき論文?
(任意)より詳しい手法の理解
構成が普段読んでる論文と違う 機械学習系の論文の書き方じゃない 結果の検証方法がわからん
アッ
きっかけ:HKUSTのwiki輪読でこれを元に実装していたの読んだ https://2022.igem.wiki/hkust/drylab-optimization
お気持ち: そのチームはうまくいかなかった、多分データがたりない はじめて機械学習とcell-freeの組み合わせを見た
リンク:https://onlinelibrary-wiley-com.waseda.idm.oclc.org/doi/pdf/10.1002/bit.23178