-
Good day! First, I'd like to say great work on this!
As I was trying to reproduce the results found [here](https://github.com/microsoft/RegionCLIP/blob/main/docs/MODEL_ZOO.md), I'd like to focus on…
-
Hi. Thx for the great work!
I tried detection inference with the following code
```
!python demo/demo.py \
--config-file projects/ViTDet/configs/COCO/cascade_mask_rcnn_vitdet_eva.py \
-…
-
hi, no offense at all to any of the authors of this github page who have worked very hard to help me with my questions and also worked very hard on this project. I just want to give a suggestion that,…
-
root@zmj:/build/YOLO-World# python deploy/export_onnx.py configs/pretrain/yolo_world_x_dual_vlpan_l2norm_2e-3_100e_4x8gpus_obj365v1_goldg_train_lvis_minival.py pretrained_models/yolo_world_x_clip_base…
-
- https://arxiv.org/abs/2104.05702
- 2021
分類や検出などの主要な認識タスクにおいて、ロングテール分布を持つデータセットでの学習は困難でした。
この課題に対処するために,画像のリサンプリングが単純かつ効果的なアプローチとして一般的に導入されている.
しかし,ロングテールの検出は,1つの画像に複数のクラスが存在する可能性があるため,分類とは異なりま…
e4exp updated
3 years ago
-
Thank you for the open source. How long will it take to train with 8 GPUs on the LVIS+CC3M training set?
-
We need a clearer understanding of the potential users of `granule-metadata` and how they interact with NSIDC. Scenarios known so far:
- SIPS (should be completely separate from our team's activities…
-
python train_net.py --num-gpus 8 --config-file configs/VLDet_LbaseCCcap_CLIP_R5021k_640b64_2x_ft4x_caption.yaml --eval-only MODEL.WEIGHTS models/lvis_vldet.pth
[03/06 02:12:52] timm.models.helpers WA…
-
This is my directory structure:
.
├── 1.jpg
├── LICENSE
├── README.md
├── checkpoints
│ ├── ckpt.txt
│ ├── cloth_segm.pth
│ └── ipadapter_faceid
│ ├── ckpt.txt
│ ├── ip-ada…
-
- https://arxiv.org/abs/2104.13921
- 2021
ゼロショット画像分類は、整列した画像とテキストのエンコーダーを学習することで、有望な進歩を遂げている。
本研究の目的は、バウンディングボックスやマスクアノテーションのない新規オブジェクトを検出することを目的としたゼロショットオブジェクト検出を進化させることである。
本研究では、Vision and La…
e4exp updated
3 years ago