issues
search
chaos-moon
/
paper_daily
One paper a day, keep laziness away.
MIT License
6
stars
3
forks
source link
Diffusion Application
#3
Open
zc12345
opened
1 year ago
zc12345
commented
1 year ago
Diffusion in the Dark: A Diffusion Model for Low-Light Text Recognition
2303.04291
contribution
提出了一个基于conditional diffusion model的 low-light reconstruction方法
引入了key normalization,用于极暗场景数据
声称达到了SOTA
思路
把diffusion model作为一个简单的denoise工具,对dark image使用diffusion进行denoise,然后再进行text recognition
使用LOw-Light dataset (LOL)的485 training and 15 test low-light/well-lit pairs训练,一块NVIDIA Quadro RTX 8000训了3天
训练的时候打成patch降低运算量
效果
思考
看起来是做text recognition然后追diffusion的热点
不清楚denoise现阶段具体进展,但是只看效果还是比较能打的
有意思的是好像基本就是直接用DDPM就work了,完全没有什么特殊的task-specific design
缺点就是diffusion推理时间似乎有点长,而且不同size的图需要打成同样大小的patch处理之后再merge
Diffusion in the Dark: A Diffusion Model for Low-Light Text Recognition
2303.04291
contribution
思路
效果
思考