倒计时 3 天!立即预约苹果 WWDC24 直播;RLAIF-V 大规模多模态偏好数据集上线,有效减少不同 MLLMs 幻觉现象

特色图像

6 月 3 日-6 月 7 日,hyper.ai 官网更新速览:

优质公共数据集:10 个

优质教程精选:2 个

社区文章精选:3 篇

热门百科词条:5 条

6-7 月截稿顶会:5 个

访问官网:hyper.ai

公共数据集精选

1. ChartQA 图表问题基准数据集

该数据集涵盖了 9.6K 个人工编写的问题,以及从人工编写的图表摘要生成的 23.1K 个问题,旨在解决涉及视觉和逻辑推理的复杂问题。

直接使用:https://go.hyper.ai/5tJE9

2. RS5M 大规模图文配对遥感数据集

RS5M 数据集包含 500 万张带有英文描述的遥感图像。这个数据集是通过使用预训练的视觉语言模型 (VLM) 筛选公开可用的图像文本配对数据集和带标签的遥感 (RS) 数据集而获得的。
直接使用:https://go.hyper.ai/jbwsV

3. CapsFusion-120M 多模态图文数据集

该数据集包含来自 LAION-2B 和 LAION-COCO 数据集的图文信息,可用于大规模多模态预训练,或进一步深入研究图像文本数据的质量。

直接使用:https://go.hyper.ai/pEE7u

4. ShareGPT4V 大规模高质量图文数据集

该数据集包含 120 万对图像-文本配对,这些数据有效地对齐了视觉和语言特征,增强了模型遵循指令的能力,并纳入了更多学术任务,例如 ScienceQA 、 TextVQA 、 SBU 等。

直接使用:https://go.hyper.ai/9CVao

5. RLAIF-V-Dataset 大规模多模态偏好数据集

RLAIF-V 数据集是一个由 AI 生成的多模态偏好数据集,它覆盖了各种任务和领域。该数据集包含超过 44,757 组高质量的对比对,用于训练和评估多模态大型语言模型。

直接使用:https://go.hyper.ai/cG6fp

6. FoodLogoDet-1500 高质量食品标识检测数据集

该数据集由 1,500 个类别、 99,768 张图像和 145,400 个对象组成。这是首个最大的公开食品标识检测数据集。

直接使用:https://go.hyper.ai/eco23

7. ZSFooD 食品食物图像数据集

该数据集包含 10 个餐厅场景中收集的 20,603 张食物图像,每个场景中都有多个用边界框标注的食物对象,由 95,322 个边界框和 291 个类组成。

直接使用:https://go.hyper.ai/6xrrC

8. Food-1K 食品图像数据集

该数据集包含超过 1,000 个细粒度食品类别和超过 50 万张图像,被 ICCV 2021 用于 Workshop LargeFineFoodAI 大规模细粒度食品分析竞赛。

直接使用:https://go.hyper.ai/sjZJi

9. ISIA Ingredient-201 食材图像数据集

该数据集中有 201 个子类,涵盖了现有食材类别的常见类型。食材图像收集在 5 个与食材相关的场景中,每个场景至少收集了 150 个食材类别。

直接使用:https://go.hyper.ai/bGe45

10. ISIA Food-500 食品菜肴数据集

该数据集包含 399,726 个食品项目,共有 500 多种菜肴。每一项都包含食物名称、食物图片。

直接使用:https://go.hyper.ai/yqco5

更多公共数据集,请访问:

https://hyper.ai/datasets

公共教程精选

1. ComfyUI DynamiCrafter 教程|颠覆 AI 视频生成!分分钟实现图转视频,细节也能完美调整

由香港中文大学、腾讯 AI Lab 等推出的 DynamiCrafter 模型利用视频扩散技术模拟真实世界的运动模式,结合文本指令,即可将图片转换为动态视频。该教程为大家搭建好了 ComfyUI 工作流环境,不用担心节点连接错误,仅需上传图片并输入文本即可操作!

在线运行:https://go.hyper.ai/PWzJR

2. 别等了!速来体验 GLM-4-9B-Chat Demo

本周,智谱 AI 发布了基座大模型 GLM-4 的最新开源成果——GLM-4-9B,首次拥有了多模态能力。为了让大家第一时间体验到这个自称「超越 Llama3-8B」的开源模型,超神经上线了「GLM-4-9B-Chat Demo」教程。无需输入任何命令、点击克隆即可立即开始体验 GLM-4-9B-Chat 的卓越性能。

在线运行:https://go.hyper.ai/hc5OK

社区文章精选

1. 无实验数据指导蛋白质定向进化,上海交大洪亮课题组发表微环境感知图神经网络 ProtLGN

上海交通大学洪亮课题组提出了 PROTLGN 微环境感知图神经网络,能够从蛋白质三维结构中学习并预测有益的氨基酸突变位点,指导具有不同功能蛋白质单位点突变和多位点突变设计,超 40% 的 PROTLGN 设计单点突变体蛋白质优于其野生型对应物。相关成果已发表在「JCM」。

查看完整报道:https://go.hyper.ai/6FkFu

2. 重塑锂电池性能边界,武汉理工大学康健强团队,基于集成学习提出简化电化学模型

武汉理工大学康健强团队提出了一种集成学习 (ELM) + FIE 的简化电化学模型模型。 ELM 精准预测了固相电极的锂离子浓度,比单个模型实现更准确的电压预测,其计算复杂度也远远低于 P2D 模型。 FIE 精准预测了正负极集流附近电解质中的锂离子浓度。

查看完整报道:https://go.hyper.ai/CWvce

3. 微电子加速迈向后摩尔时代!复旦大学梅永丰课题组集成 DNN 与纳米薄膜技术,精准分析入射光角度

复旦大学材料科学系梅永丰教授课题组提出了一种多级准静态有限元分析法,并设计构筑了六类硅/铬纳米薄膜组装三维微结构及相应的三维光探测器,验证了该技术的良好通用性和工业实践性。相关成果已发表在「Nature」。

查看完整报道:https://go.hyper.ai/2s73Q

热门百科词条精选

1. 核范数 Nuclear Norm

2. 掩码语言建模 MLM

3. 长短期记忆 Long Short-Term Memory

4. YOLOv10 实时端到端物体检测

5. Kolmogorov-Arnold Networks

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

B 站直播预告

苹果将于北京时间 6 月 11 日(下周二)举办 WWDC24,届时 HyperAI 超神经视频号和 B 站将实时转播,欢迎扫码预约直播↓

为了帮助大家深入了解 Apple 的相关信息,超神经 B 站直播间将持续直播「Apple 专题」视频,涉及:历年 WWDC 大会、高管访谈、相关纪录片等丰富内容。

下表为小编为大家精选的内容预告↓↓↓

日期时间内容
6 月 10 日星期一18:00乔布斯传
6 月 11 日星期二1:00Apple WWDC24
6 月 12 日星期三18:00是什么成就了 Apple
6 月 13 日星期四18:00iPhone 首次问世发布会
6 月 14 日星期五18:00史蒂夫·乔布斯的历史
6 月 15 日星期六18:00苹果如何在几乎破产时生存下来
6 月 16 日星期日18:00蒂姆·库克的历史

超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094

6 – 7 月截稿顶会

一站式追踪人工智能学术顶会:https://hyper.ai/events

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI 超神经 (hyper.ai)

HyperAI 超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

* 为 1200+ 公开数据集提供国内加速下载节点

* 收录 300+ 经典及流行在线教程

* 解读 100+ AI4Science 论文案例

* 支持 500+ 相关词条查询

* 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai