日期

1 个月前

组织

论文 URL

标签

Model Souping 是由华盛顿大学、谷歌等高校和机构的研究团队于 2022 年 7 月联合提出的，相关研究成果发表于论文「Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time」，入选 ICML 2022 。

Model Souping 是指将多个独立微调的模型权重进行平均，进而提高模型准确性和鲁棒性。该范式仅在超参数扫除后的微调模型基础上进行加权平均，无需额外训练，也不会增加推理时的计算成本。在对 CLIP 、 ALIGN 及 JFT 预训练的 ViT-G 等大型预训练模型进行微调时，Model Souping 方法相比在 ImageNet 上通过超参数扫描得到的最佳单一模型有显著提升。最终得到的 ViT-G 模型在 ImageNet 上取得了 90.94% 的准确率，达到了新的技术水平。此外，该方法还可扩展至多种图像分类与自然语言处理任务，不仅提升了分布外泛化性能，而且在新下游任务中增强了零样本学习能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

日期

1 个月前

组织

论文 URL

2203.05482

标签

机器学习

稀疏化接码树 Decoding Tree Sketching

利用 GPU 并行性高效扩展解码树，实现推理路径的快速且可扩展的优化。

1 个月前

安全比对方法 Deep Aligned Visual Safety Prompt

有效解决了 LVLM 安全对齐中的关键挑战。

2 个月前

空间理论 Theory of Space

空间理论是指智能体通过主动探索在不完全信息环境中构建、更新并利用空间信念的能力框架。

1 个月前

SoCE 类专家 Soup

SoCE 是一种基于自动类别感知专家选择机制、结合多基准任务的模型优化范式。

2 个月前

思维引导的强化学习框架 Guided Thought Reinforcement

GTR 能在复杂视觉环境中引导模型推理，防止「思维崩溃」

1 个月前

Peak-Return Greedy Slicing

PRGS 显著增强了离线强化学习模型拼接高回报经验的能力。

1 个月前

部署中学习 Learning While Deploying

LWD 是一种舰队级离线到在线强化学习框架，使通用机器人持续收集经验并实现策略的自我进化。

10 天前

Decomposed Forward Pass（DePass）

DePass 用于通过分解前向传递来解释 Transformer 模型。

2 个月前

指纹识别方法 iSeal

iSeal 在 12 个 LLM 上对超过 10 次攻击实现 100% 指纹成功率（FSR）。

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

模型融合 Model Souping

用 AI 构建 AI

HyperAI Newsletters

Command Palette

模型融合 Model Souping

相关百科

稀疏化接码树 Decoding Tree Sketching

安全比对方法 Deep Aligned Visual Safety Prompt

空间理论 Theory of Space

SoCE 类专家 Soup

思维引导的强化学习框架 Guided Thought Reinforcement

Peak-Return Greedy Slicing

部署中学习 Learning While Deploying

Decomposed Forward Pass（DePass）

指纹识别方法 iSeal

用 AI 构建 AI

HyperAI Newsletters

Command Palette

模型融合 Model Souping

相关百科

稀疏化接码树 Decoding Tree Sketching

安全比对方法 Deep Aligned Visual Safety Prompt

空间理论 Theory of Space

SoCE 类专家 Soup

思维引导的强化学习框架 Guided Thought Reinforcement

Peak-Return Greedy Slicing

部署中学习 Learning While Deploying

Decomposed Forward Pass（DePass）

指纹识别方法 iSeal

用 AI 构建 AI

HyperAI Newsletters

相关百科

稀疏化接码树 Decoding Tree Sketching

安全比对方法 Deep Aligned Visual Safety Prompt

空间理论 Theory of Space

SoCE 类专家 Soup

思维引导的强化学习框架 Guided Thought Reinforcement

Peak-Return Greedy Slicing

部署中学习 Learning While Deploying

Decomposed Forward Pass（DePass）

指纹识别方法 iSeal

相关百科

稀疏化接码树 Decoding Tree Sketching

安全比对方法 Deep Aligned Visual Safety Prompt

空间理论 Theory of Space

SoCE 类专家 Soup

思维引导的强化学习框架 Guided Thought Reinforcement

Peak-Return Greedy Slicing

部署中学习 Learning While Deploying

Decomposed Forward Pass（DePass）

指纹识别方法 iSeal