Psyche去中心化网络:让全球用户参与AI开发的新时代
Nous Research近日宣布推出Psyche,一个基于Solana区块链的去中心化AI训练网络,旨在让全球用户通过贡献闲置计算资源参与AI模型开发。这一突破性的平台通过DisTrO技术大幅减少了带宽需求,成功启动了史上最大规模的互联网分布式训练项目,目标是训练一个40亿参数的AI模型,并将所有数据和检查点完全开源。 Psyche网络的问世打破了传统AI训练对集中式数据中心的依赖。它通过Solana区块链协调全球分布式GPU,允许任何人贡献自己空闲的计算资源来参与模型训练。Psyche的首个重要任务是预训练名为Consilience的40亿参数模型,采用了多头潜在注意力(MLA)架构,并基于20万亿个token的数据集进行训练。这个模型的设计在性能与可访问性之间找到了完美的平衡,既能在单一服务器上完成训练,也能在消费级的RTX3090 GPU上运行推理,同时还支持长上下文处理,具有高级推理和创意应用潜力。 Psyche的技术内核之一是DisTrO(Distributed Training Over-the-Internet),这项技术通过优化器创新,将GPU之间的通信数据量压缩了1000到10000倍。具体来说,DisTrO允许每个节点独立训练,而不必每步都进行同步,从而显著降低网络延迟和带宽需求。这种机制使得不同类型的硬件,如RTX4090、A100、H100,可以高效协同工作。 Solana区块链在Psyche中发挥了关键作用,通过智能合约存储训练元数据、参与者列表和随机分配任务,确保整个训练过程的透明度、防篡改性和抗审查性。此外,Solana高吞吐量和低交易成本的特点,使其成为处理分布式训练微支付的理想选择,极大提升了Psyche的全球可扩展性。 Psyche的另一个核心特点是彻底的开源。所有训练数据、检查点和模型结果都将公开分享,托管在Hugging Face和GitHub上,供全球开发者免费访问。开放的Rust-based系统和P2P网络允许开发者参与优化,或基于现有文档构建自定义应用。Nous Research计划在未来进一步扩展Psyche的功能,包括支持模型微调和社区数据输入,帮助小型团队甚至个人开发者定制适合特定领域的AI模型,如教育、医疗和创意行业。 Psyche的推出对整个AI行业产生了深远影响。2024年12月,Psyche成功完成了150亿参数模型的测试训练,跨越1.1万步,验证了其在全球网络中的稳定性。2025年4月,Nous Research获得了由Paradigm领投的5000万美元A轮融资,估值达到10亿美元,这将加速Psyche的发展步伐。测试网启动后仅44分钟,Psyche就通过社区捐款筹集了50万美元的GPU算力,充分显示了项目的高度受欢迎和社区的热情参与。 总体来看,Psyche的发布不仅推动了AI的技术普惠化,还在全球范围内激发了更多的创新潜力,挑战了传统集中式AI巨头的垄断地位。随着更多开发者加入这一平台,预期将出现更多的创新应用场景,进一步丰富AI生态。Nos Research作为一家致力于AI民主化的新兴公司,其未来的发展值得期待。