Command Palette
Search for a command to run...
百科
我们编汇了数百条相关词条,帮助您理解「人工智能」
Search for a command to run...
我们编汇了数百条相关词条,帮助您理解「人工智能」
单点 PageRank 计算通过随机游走模型来确定节点的重要性。
强化微调结合了监督微调和强化学习,旨在优化模型生成高质量解答的能力。
NLRL 将强化学习的核心概念用自然语言的形式重新定义。
MILP-StuDio 旨在通过保留问题分块结构来生成高质量的 MILP 实例。
MILP 是一种数学优化技术,它用于在一组线性约束条件下寻找线性目标函数的最大值或最小值。
事件相机 (Event-based Camera),也称为动态视觉传感器 (DVS) 或 DAVIS (Dynamic and Active-Pixel Vision Sensor),是一种新型的视觉传感器,它与传统相机 […]
UDK-VQA 框架的核心目的是为了增强现有的大型视觉语言模型 (LVLMs),使其能够处理关于最新知识的视觉上的问题回答 (VQA) 。
SearchLVLMs 框架能够显著提升 LVLMs 在回答需要最新知识的问题上的性能。
LLMxMapReduce 框架打破了大模型的记忆限制,理论上实现了「无限长」上下文的处理能力。
AdaCache 是由 Meta 于 2024 年提出的用于加速 AI 视频生成技术,其核心在于自适应缓存机制,相关论文成果为「Adaptive Caching for Faster Video Generation w […]
卡内基梅隆大学 (CMU) 在 2024 年提出了一种全新的黑盒优化策略,这一策略通过大语言模型自动调整自然语言提示词,以优化视觉语言模型 (VLMs) 在文生图、视觉识别等多个下游任务中的表现。这种方法不仅无需触及模型 […]
DexMimicGen 能够通过少量的人类示范生成大量的机器人训练数据。
MIA-DPO (Multi-Image Augmented Direct Preference Optimization) 是一种面向大型视觉语言模型 (LVLMs) 的多图像增强的偏好对齐方法,由上海交通大学、上海人 […]
梅尔倒谱是一种在声音处理领域广泛应用的技术,特别是在语音识别和话者识别中。
Dijkstra 算法是一种用于寻找图中单源最短路径的经典算法。
WISE 技术旨在对抗大语言模型中的幻觉现象,并提升模型的知识记忆编辑能力。
DuoAttention 通过为检索头应用全 KV 缓存,而为流式头应用轻量级、固定长度的 KV 缓存,实现了内存和计算资源的优化。
数字表亲不追求与真实物体一一对应,而是关注相似的几何和语义特质,从而以更低的成本生成实用的训练数据。
DAPE 全称为 Data-Adaptive Positional Encoding,是一种新的位置编码方法,由香港中文大学的郑传阳等人提出的,该研究团队还包括来自新加坡国立大学、诺亚实验室、香港大学和香港浸会大学的研究 […]
SparseLLM 是一种新型的全局剪枝框架,由埃默里大学和美国阿贡国家实验室的研究人员于 2024 年共同提出,相关论文成果为「SparseLLM: Towards Global Pruning of Pre-trai […]
Diff Transformer 通过计算两个独立的 softmax 注意力图,然后求其差值来得到最终的注意力分数,这种方法能够有效消除注意力噪声,促使模型更加关注于输入中最相关的部分。
UNA 全称为 Unified Alignment Framework,是由来自 Salesforce 和厦门大学的研究团队提出的一个新型对齐框架。相关论文成果为「UNA: Unifying Alignments of […]
Swarm 是由 OpenAI 于 2024 年开发的一个实验性质的多智能体框架,它旨在简化多智能体系统的构建、编排和部署工作。 Swarm 关注的重点是让智能体协作和执行变得轻量、高度可控且易于测试。 Swarm 的核 […]
Michelangelo 是由 DeepMind 的研究人员于 2024 年提出的一个用于评估大型语言模型在长文本上下文推理能力的方法。它通过一个名为 Latent Structure Queries (LSQ) 的框架 […]