Closed jungwoo-ha closed 3 years ago
AISTATS 마무리되었습니당 (TMI)
뭔가 적당히 이론적이면서 적당히 practical하면서 다들 관심있어 할만할 논문들 중 biased sampling 했어요 (저의 지극히 개인적인 research interest도 반영되었습니당)
Best Student Paper: Matérn Gaussian Processes on Graphs
Learning GPLVM with arbitrary kernels using the unscented transformation
Learning-to-Rank with Partitioned Preference: Fast Estimation for the Plackett-Luce Model
Stochastic Polyak Step-size for SGD: An Adaptive Learning Rate for Fast Convergence
Competing AI: How does competition feedback affect machine learning?
Dirichlet Pruning for Neural Network Compression
Adaptive wavelet pooling for convolutional neural networks
GTC 2021 중 흥미로운 이슈. 혹시나 CUDA를 좋아하시는 분들을 위해 알려드립니다.
CUDA Python이 릴리스되어 이제 Low-level CUDA kernel을 파이썬으로 작성할 수 있습니다. https://developer.nvidia.com/cuda-python
NVIDIA NSight VSCode Edition 릴리스되어 Visual Studio를 사용하지 않고 우리가 모두 좋아하는 VSCode에서 NSight를 통해 CUDA kernel을 디버깅할 수 있습니다. NSight는 CUDA의 공식 프로파일러 중 하나입니다. https://developer.nvidia.com/nsight-visual-studio-edition-2020_3
HuggingFace에서 Multi-GPU, FP16 등을 쉽게 사용할 수 있도록 Accelerate 라이브러리를 공개했습니다. PyTorch Lightning이 편하지만 training loop가 복잡해지면 PyTorch로 코드를 작성해야 하는데 그러면 Multi-GPU를 사용하기 위해 code refactoring을 할 필요가 있습니다. Accelerate를 사용하면 그런 부담이 적어질 것을 기대합니다. https://github.com/huggingface/accelerate
Facebook Research에서 PyTorch VIdeo를 공개했습니다. Video 관련 딥러닝을 하시는 분들께 도움이 될 것 같습니다. https://github.com/facebookresearch/pytorchvideo
Google Health, Google Brain, DeepMind 3개 연구진에서 Medical Image에서 long-tailed distribution을 해소하고자 새로운 hierarchical loss를 제안했습니다. 지난번에 online shopping 등에서도 많이 발생하는 문제라고 말씀해주셨는데 관심 있으신 분들께 도움이 되길 바랍니다.
Robust OpenVocabulary Translation from Visual Text Representations
text embedding 으로 discrete vocab embedding 대신 이미지를 사용하는 연구입니다. 작년에도 비슷한 연구들을 (ex. https://arxiv.org/pdf/2010.10648.pdf) 본 거 같아요. 개인적으로 CLIP / DALL-E 의 text recognition ability 가 굉장히 신기했는데, 몇 년 뒤에는 OCR 모듈이 없이도 이미지 안의 텍스트를 자연스럽게 읽을 수 있지 않을까요?
AI News
Arxiv