Open sghong977 opened 2 months ago
기존 VI 관점의 문제 3가지를 반박하면서 시작한다. 실제로 VI 하면서 굉장히 의아했던 부분을 모조리 지적하고 있기에 상당히 흥미로운 논문
이 논문 contribution?
내가 놓친 논문 있나 보자
VI; 이 분야에서 딥러닝 처음 쓴게 2019년도 논문이라서 예전건 잘 모르겠음
Diffusion Model을 활용한 Image inpainting 모델들
diffusion을 잘 모르겠다. conditional diffusion과 unconditional diffusion의 차이를 좀 찾아보고 논문으로 다시 돌아오자
글쓰다가 날려서 기분 안좋음.. 걍 이거 읽으면 된다
모델은 기본적으로 4D UNet 구조, relative positional encoding
Harvey et at. 정의 약간 바꿔서, 이 논문에서 condition / uncondition에 mask 여부로 나누는게 하나의 contribution이다.
Q. 그러면 이거 맞는건가? diffusion 몰라서 헷갈림
"The test sets we use, along with code for processing the original BDD100K dataset and generating masks, will be released upon publication." -> 데이터 처리 코드만 공개하는건지 논문 코드도 공개하는건지... 아직 깃 레포 없음
개요
디테일 설명
오브젝트 제거와 더하는 것 2가지 태스크를 위해 각각 다른 데이터셋을 정의함.
갑자기 드는 생각...
샘플러 저거 논문 봐야겠다 뭔지 모름
https://wikidocs.net/233896#heun
Semantically Consistent Video Inpainting with Conditional Diffusion Models