jungwoo-ha / WeeklyArxivTalk

[Zoom & Facebook Live] Weekly AI Arxiv 시즌2
972 stars 41 forks source link

[20230108] Weekly AI ArXiv 만담 시즌2 - 1회차 #67

Open jungwoo-ha opened 1 year ago

jungwoo-ha commented 1 year ago

News

Research

veritas9872 commented 1 year ago

Research (겸 뉴스?): Large Language Models Encode Clinical Knowledge

스크린샷_20230108_083719 스크린샷_20230108_083835 스크린샷_20230108_084724

구글과 딥마인드에서 ChatGPT와 유사하게 의료 영역에서 질의응답에 답변을 할 수 있도록 초거대 언어 모델을 학습한 논문입니다. ChatGPT의 등장으로 LLM을 여러 영역에서 사용하는데 관심이 급증하면서 연구가 활발해질 것으로 보입니다.

ChatGPT와는 다르게 RLHF(Reinforcement Learning with Human Feedback)을 사용하지 않고 Instruction fine-tuning 기반의 FLAN 모델에서 soft prompt, 단어 대신 한 단계 encoding된 prompt를 학습한 후 추가하는 방식을 적용합니다.

GPT Takes the Bar Exam

GitHub: https://github.com/mjbommar/gpt-takes-the-bar-exam

accuracy_bar_chart

accuracy_bar_chart_progression

유사한 맥락으로 법률 분야에서 GPT 3.5 계통의 모델을 미국 변호사 시험 모의고사에서 객관식 문항에 적용했을 때 별도의 학습 없이 prompt tuning 만으로도 상당한 성능을 얻을 수 있는 것을 보여줍니다.

두 논문은 LLM을 전문 지식이 필요한 분야에서 적용할 때 신규 학습 뿐만 아니라 prompting 방법을 적용하는 것의 중요성과 전문성을 유도하는 방법에 대한 실험적 연구로 의미가 있다고 생각됩니다.

Tutorial High-Performance Computing for Deep Learning (HPC4DL)

딥러닝, 특히 PyTorch 사용자를 위한 GPU 하드웨어부터 최상위 소프트웨어 기술스택까지 어떻게 구성되어있는지 발표를 한 영상을 공유해드립니다. 딥러닝 학습의 원리 및 GPU 하드웨어에서의 구현, PyTorch에서 적용되는 방법 등 깊이 있게 다룰 뿐만 아니라 실제 연구개발을 하시는 분들께 도움이 될만한 팁과 경험 또한 많이 공유했습니다.

ghlee3401 commented 1 year ago

Research

흥미로운 연구

jwlee-neubla commented 1 year ago

논문

Scaling Language-Image Pre-training via Masking

TinyMIM: An Empirical Study of Distilling MIM Pre-trained Models

image image image

ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders

nick-jhlee commented 1 year ago

News (AI)

News (Math)

AI Papers

Non-AI Papers

kimyoungdo0122 commented 1 year ago
kwonminki commented 1 year ago

image

image

아직은 비공개인 링크도 살짝 올려보자면 (아직 arxiving 되지 않은 후속논문의 프로젝트페이지입니다.)

styletransfer 스러운 무언가도 할 수 있습니다.

https://curryjung.github.io/DiffStyle_project_page/

Eunhui-Kim commented 1 year ago

News

Research

언제나 좋은 정보 공유 감사드려요~ 새해 복 많이 받으소서!