jungwoo-ha / WeeklyArxivTalk

[Zoom & Facebook Live] Weekly AI Arxiv 시즌2
972 stars 41 forks source link

[20210418] Weekly AI Arxiv 만담. #6

Closed jungwoo-ha closed 3 years ago

jungwoo-ha commented 3 years ago
nick-jhlee commented 3 years ago

Image from Gyazo


뭔가 적당히 이론적이면서 적당히 practical하면서 다들 관심있어 할만할 논문들 중 biased sampling 했어요 (저의 지극히 개인적인 research interest도 반영되었습니당)

veritas9872 commented 3 years ago

GTC 2021 중 흥미로운 이슈. 혹시나 CUDA를 좋아하시는 분들을 위해 알려드립니다.

CUDA Python이 릴리스되어 이제 Low-level CUDA kernel을 파이썬으로 작성할 수 있습니다. https://developer.nvidia.com/cuda-python

NVIDIA NSight VSCode Edition 릴리스되어 Visual Studio를 사용하지 않고 우리가 모두 좋아하는 VSCode에서 NSight를 통해 CUDA kernel을 디버깅할 수 있습니다. NSight는 CUDA의 공식 프로파일러 중 하나입니다. https://developer.nvidia.com/nsight-visual-studio-edition-2020_3

veritas9872 commented 3 years ago

HuggingFace에서 Multi-GPU, FP16 등을 쉽게 사용할 수 있도록 Accelerate 라이브러리를 공개했습니다. PyTorch Lightning이 편하지만 training loop가 복잡해지면 PyTorch로 코드를 작성해야 하는데 그러면 Multi-GPU를 사용하기 위해 code refactoring을 할 필요가 있습니다. Accelerate를 사용하면 그런 부담이 적어질 것을 기대합니다. https://github.com/huggingface/accelerate

Facebook Research에서 PyTorch VIdeo를 공개했습니다. Video 관련 딥러닝을 하시는 분들께 도움이 될 것 같습니다. https://github.com/facebookresearch/pytorchvideo

veritas9872 commented 3 years ago

Does Your Dermatology Classifier Know What It Doesn't Know? Detecting the Long-Tail of Unseen Conditions

Google Health, Google Brain, DeepMind 3개 연구진에서 Medical Image에서 long-tailed distribution을 해소하고자 새로운 hierarchical loss를 제안했습니다. 지난번에 online shopping 등에서도 많이 발생하는 문제라고 말씀해주셨는데 관심 있으신 분들께 도움이 되길 바랍니다.

j-min commented 3 years ago

Robust Open­Vocabulary Translation from Visual Text Representations

text embedding 으로 discrete vocab embedding 대신 이미지를 사용하는 연구입니다. 작년에도 비슷한 연구들을 (ex. https://arxiv.org/pdf/2010.10648.pdf) 본 거 같아요. 개인적으로 CLIP / DALL-E 의 text recognition ability 가 굉장히 신기했는데, 몇 년 뒤에는 OCR 모듈이 없이도 이미지 안의 텍스트를 자연스럽게 읽을 수 있지 않을까요?

image