多智能体工作流程 CudaForge
CudaForge 是由明尼苏达大学的研究团队于 2025 年 10 月提出的,相关研究成果发表于论文 CudaForge: An Agent Framework with Hardware Feedback for CUDA Kernel Optimization 。
CudaForge 是一个用于 CUDA 内核生成和优化的无训练多智能体工作流程,受人类专家迭代工作流程的启发,包含开发初始内核、测试正确性、分析硬件反馈和迭代改进等步骤。更具体地说,CudaForge 采用两个 LLM 智能体:一个 Coder 和一个 Judge,它们迭代地生成、纠正和优化 CUDA 内核,同时整合硬件反馈,如 Nsight Compute(NCU)指标。
