yukarinoki / reseach

0 stars 0 forks source link

Apollo: Automatic partition-based operator fusion through layer by layer optimization #15

Open yukarinoki opened 1 year ago

yukarinoki commented 1 year ago

1 の被引用

深層学習モデルのJITコンパイルフレームワークApolloの研究。融合の対象を広げている。

https://mlsys.org/virtual/2022/oral/2136 スライドも発表VTRもある

yukarinoki commented 1 year ago

フレームワークがfusionを頑張ってくれているわけではない。代わりにJITが頑張っている。 image

yukarinoki commented 1 year ago

loop shiftは大変らしい

image

yukarinoki commented 1 year ago