-
좋은 리뷰 감사합니다. 읽으면서 몇 가지 궁금한 점들이 생겨서 질문 드립니다.
1. inter-PR 에서 hard selection 시, 두 모델 사이 consistency 가 높은 modality 를 취한다고 하는데, 두 모델은 fast model 와 slow model 인가요? 그래서 각 modality 별로 fast 와 slow model 의 c…
-
A new method entitled ["Uncertainty-Guided Cross-Modal Learning for Robust Multispectral Pedestrian Detection" ](https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9419080) is now available, who…
-
Hi, thanks for your code! I have some questions about the model.
When we construct the prototype matrix(N_l x N_p x D), the 1xD vectors in it is derived from the whole image/sentence;
However, when…
-
## Bug report
**Describe the bug**
When making changes to an open bottom sheet, it isn't rebuilt
### Steps to reproduce
Steps to reproduce the behavior:
1. Open Bottom Sheet
2. Edit Widg…
-
#
[sound-spaces](https://github.com/facebookresearch/sound-spaces)
[Project: RLR-Audio-Propagation](https://github.com/facebookresearch/rlr-audio-propagation)
[Audio Sensor](https://github.com/f…
-
CVPR 2022
#
格式
* **Paper Title**
*Author(s)*
CVPR, 2022. [[Paper]](link) [[Code]](link) [[Website]](link)
需要填充:
1)Paper Title
2) Author(s)
3) 3个“link”
4)两篇文章之间间隔一行
# agent
Meta Ag…
-
### Sources
- https://github.com/ZechengLi19/Awesome-Sign-Language
- https://github.com/Skye601/SLR
- https://www.sign-lang.uni-hamburg.de/lrec/project/asllrp.html
- https://www.semanticscholar.…
-
The feature extraction tutorial is available for only *images* https://vissl.ai/tutorials/Feature_Extraction. Can we extract features for **videos**? I would love to contribute and send PR if necessar…
-
## Problem statement
1. CLIP variants의 이미지와 텍스트 사이의 관계 학습은 텍스트의 각 토큰들과 이미지 패치의 관계에 대해 학습하기에는 학습과 추론 시 효율성이 떨어진다 -> finer-level alignment할 수 있는 방법을 찾아보자
2. 이미지 패치와 텍스트 토큰 간의 attention 이용하는 기존 연구의 약점 …
-
# Vision Transformer Adapter for Dense Predictions
Info.
- ICLR 2023 spotlight
- https://github.com/czczup/ViT-Adapter
- https://arxiv.org/abs/2205.08534
### Summary
- plain ViT
- whi…