su3inni / interested

0 stars 0 forks source link

AI-Text 필터링을 위해 거대 모델을 사용한 과정 #12

Open su3inni opened 9 months ago

su3inni commented 9 months ago

LINE Engineering Tech Blog

https://engineering.linecorp.com/ko/blog/apply-large-ml-models-for-ai-text-filtering-models

0. 특정 목적에 ML을 도입하는 과정

파라미터 수를 급격하게 늘려 단일 언어 모델을 다국어 모델로 확장해서 개발과 서비스에 들어가는 비용을 줄였다고한다. 파라미터 수를 늘린다는 것은 실행 비용은 증가하게 될텐데 이때 trade off에 대해 어떻게 결론을 내리게 되는지 궁금하다.

1. Large ML Model Training Tech

거대 모델을 다룰 수 있는 기술은 크게 스케일링Scaling 기술과 경량화Lightwegith 기술로 나뉜다.

1-1. Scaling 기법

2. 프레임워크 선택 : CPU Offload를 위한 DeepSpeed 프레임워크

3. Multi Node 사용시 고려해야할 부분

4. Fine-Tuning 시 학습 모델을 병렬화하는 방법

5. 모델 서빙

6. 결과 확인

7. 기대효과

su3inni commented 9 months ago

Todo

추가 정보