-
wondering if this can be extended to image to video generation with image condition, and controllable camera motion?
-
# Controllable deep melody generation via hierarchical music structure representation [[ISMIR21](https://arxiv.org/abs/2109.00663)]
## Abstract
- music framework generates rhythm and basic melody …
-
Hello!
Would you mind telling me what I should type in the {path-to-diffusion-lm} in decoding Diffusion-LM, I have tried several but they all return an empty output list.
Also may I ask where did y…
-
https://virtual2023.aclweb.org/paper_P1495.html
-
## 一言でいうと
言語モデルによる事前学習を行う際に、挙動をコントロールするコードを付けた研究。これによりWikipeidaスタイル、Redditスタイルといった条件を与えた上で生成を行うことができる(Questionに対してAnswerを生成するといった制御も行っている)。
### 論文リンク
https://einstein.ai/presentations/ctrl.pd…
-
# CTRL: A Conditional Transformer Language Model for Controllable Generation
出力制御可能な言語モデルを提案。ドメインを表すラベル(Wikipedia, Book, Legal, ...)を先頭に付与することによって、出力制御可能な言語モデルの学習を行う。生成時には、ラベルとプロンプト(文書の書き出しの数単語)を入力…
-
TIP2023 Structure-Informed Shadow Removal Networks
PG2022 Depth‐Aware-Shadow-Removal
PG2023 Facial Image Shadow Removal via Graph-based Feature Fusion
ACMMM2023 Exploiting Res…
-
[The format of the issue]
Paper name/title:
Project link:
Paper link:
Code link:
amusi updated
5 hours ago
-
看了几个例子,有个疑问,以canny为例,
需要先有所有frame的canny结果,再以此作为condition生成新的video。但是,实际情况这个condition是无法获取的。
而且,如果看起来这个canny结果也是根据其他视频提取的,那这样的话,这个方法的在实际应用时的意义在哪呢?
-
https://virtual2023.aclweb.org/paper_P1149.html