摘要

神经渲染，尤其是三维高斯点阵（3D Gaussian Splatting, 3DGS）技术，近年来发展迅速，已成为构建世界模型的关键组成部分。然而，现有的可视化解决方案仍存在碎片化、资源占用高或受限于传统渲染管线等问题，导致部署门槛高，且对动态内容与生成式模型的支持有限。为此，本文提出 Visionary——一个开源、原生面向网页的实时渲染平台，支持多种高斯点阵与网格的实时渲染。Visionary 基于高效的 WebGPU 渲染引擎，并结合每帧执行的 ONNX 推理机制，实现了动态神经处理能力，同时保持轻量化与“点击即运行”的浏览器体验。平台引入了一种标准化的高斯生成器合约（Gaussian Generator Contract），不仅支持标准的 3DGS 渲染，还允许插件式算法在每一帧中生成或更新高斯分布，从而实现灵活的动态内容生成。该架构进一步支持前馈式生成后处理，拓展了内容创作的可能性。此外，Visionary 提供与 three.js 兼容的插件库，配备简洁的 TypeScript API，可无缝集成至现有 Web 应用中。实验表明，在相同 3DGS 资产条件下，Visionary 因采用基于 GPU 的原始图元排序机制，相较当前主流 Web 渲染器展现出更优的渲染效率。平台目前已支持多种变体，包括基于 MLP 的 3DGS、4DGS、神经化身（neural avatars），以及风格迁移与增强网络等生成模型。通过在浏览器中直接统一推理与渲染流程，Visionary 显著降低了 3DGS 系列方法在复现、对比与部署过程中的技术门槛，为重建式与生成式双重范式下的世界模型提供了一个统一的载体平台。

源 PDF 查看代码