Command Palette
Search for a command to run...
플래시모바
FlashMoBA는 2025년 11월 MIT와 엔비디아 연구팀이 공동으로 제안했으며, 관련 연구 결과는 논문으로 발표되었습니다. 블록 어텐션의 혼합 최적화 .
FlashMoBA는 하드웨어 인식 CUDA 커널로, 이론적으로 권장되는 작은 블록 크기에서도 효율적인 MoBA 실행을 가능하게 합니다. FlashAttention의 기술을 차용하고 블록 희소성을 위한 새로운 최적화 기법을 추가하여, FlashAttention-2 대비 14.7배의 속도 향상을 달성함으로써, 이전에는 실현 불가능했지만 이론적으로 최적의 구성을 구현할 수 있게 되었습니다.