Open jungwoo-ha opened 1 year ago
Announcement: https://www.amd.com/en/newsroom/press-releases/2023-6-13-amd-expands-leadership-data-center-portfolio-with-.html HuggingFace Blogpost: https://huggingface.co/blog/huggingface-and-amd
현재 NVIDIA CUDA의 독점 체제에서 AMD가 가장 유사한 시장 위치에 있으나 CUDA 등 여러 장벽에 의해 영향을 가지지 못했습니다. 그러나 PyTorch에서도 AMD의 ROCm backend를 지원하며 이번에 HuggingFace에서도 AMD를 도입하기 위해 적극적으로 노력하고 있어 Python frontend를 사용하는 대다수의 유저는 곧 코드를 그대로 사용하면서 AMD를 사용할 수 있는 방향으로 움직임이 있습니다.
ArXiv: https://arxiv.org/abs/2306.07899 GitHub: https://github.com/epfl-dlab/GPTurk
ArXiv: https://arxiv.org/abs/2305.20030 GitHub: https://github.com/YuxinWenRick/tree-ring-watermark
DDIM 기반의 Diffusion Model에서 결과물을 해치지 않으면서 robust한 watermark를 심는 방버이 제안되었습니다. 해당 방법은 최초 latent space의 noise에서 Fourier space에서 concentric ring을 tree-ring pattern으로 생성하는 방법을 활용하는데 Fourier Transform의 성질에 의해 rotation, noise injection, cropping 등 다양한 image space perterbation에 대해 강건하면서 최종 결과물의 현실감을 해치지 않는 방법입니다. Diffusion process를 실행해야 하기 때문에 기존 모델을 소유해야지만 확인이 가능하지만 Diffusion Model 기반의 서비스를 하시는 많은 분들께 도움이 될 것 같습니다.
Simplicity Bias Leads to Amplified Performance Disparities (FAccT 2023)
"Controversial" paper: Exploring the MIT Mathematics and EECS Curriculum Using Large Language Models (MIT, Boston University)
Recent papers in optimization theory:
Explosion in NLP Theories!! (수학에 관심있으신 분들은 한번 내년부터 같이 해보시죠 ㅎㅎ)
Health system-scale language models are all-purpose prediction engines
News
ArXiv
InstructZero: Efficient Instruction Optimization for Black-Box Large Language Models
Knowledge Distillation of Large Language Models