DKU-StarLab / SolidStateSquad

This is a study group studying SSD, FTL, and FEMU in 2024.
8 stars 3 forks source link

10. FlashGNN: An In-SSD Accelerator for GNN Training #13

Open Student5421 opened 2 months ago

Student5421 commented 2 months ago

Motivation

FlashGNN은 대규모 그래프 데이터셋에서 그래프 신경망(GNN)을 효율적으로 훈련시킬 필요성에서 시작한다. 기존의 중앙 집중식 CPU/GPU 기반 시스템은 실제 데이터셋의 크기가 커짐에 따라 하드웨어 활용도가 낮고 분산 시스템에서의 느린 데이터 교환으로 인해 비효율적이다. SSD 기반 시스템은 큰 저장 용량을 제공하지만, PCIe 데이터 전송 속도가 느려 CPU 및 GPU 리소스의 활용이 저해되는 병목 현상을 겪는다. 이러한 문제를 해결하기 위해 FlashGNN은 SSD 내부에서 처리 능력을 활용하여 PCIe 병목 현상을 극복하고 데이터 재사용을 향상시키며, SSD 내 I/O 병렬 처리를 최대한 활용하여 GNN 훈련을 최적화하고자 한다.

Proposal

FlashGNN의 아키텍처는 다음과 같은 주요 기법을 제안한다.

Results

FlashGNN은 Ginex라는 최첨단 SSD 기반 GNN 훈련 시스템과 비교하여 최대 11.83배의 속도 향상과 상당한 에너지 절약을 달성하였으며, 이 설계는 느린 플래시 메모리 접근과 PCIe 버스 병목 현상의 한계를 효과적으로 해결하여 대규모 데이터셋에 대해 GNN 훈련을 효율적으로 수행할 수 있는 방안을 제시한다.