为了进一步推进 AI4S 的普适化,HyperAI 超神经策划了「Meet AI4S」系列直播栏目。第一期直播将于 7 月 17 日 19:00 准时上线!我们邀请到了浙江大学遥感与地理信息系统博士生丁佳乐,他的分享主题为「神经网络为房价的空间异质性提供新解释」,快来预约直播~
https://www.huodongxing.com/event/2762111401922
7 月 8 日-7 月 12 日,hyper.ai 官网更新速览:
* 优质公共数据集:10 个
* 优质教程精选:3 个
* 社区文章精选:5 篇
* 热门百科词条:5 条
* 7 月截稿顶会:2 个
访问官网:hyper.ai
公共数据集精选
该数据集专注于医疗领域的大型视觉问答评测,包含 118,010 张不同的图片,涵盖 12 种不同的模态,涉及超过 20 个人体不同的器官和部位,旨在为医学多模态大模型的发展提供评测基准。
直接使用:https://go.hyper.ai/vafuu
该数据集包含 200 个角色的设定和对话数据,由 GPT3.5 和 GPT4 生成组成。
直接使用:https://go.hyper.ai/IwTIW
HellaSwag 数据集包含 70,000 个问题,这些问题对人类来说非常简单(准确率超过 95%),但对于模型来说却很难(准确率约为 48%)。该数据集旨在通过构建一个对现有最先进模型具有挑战性的数据集,来探索深度预训练模型在常识推理方面的表现。
直接使用:https://go.hyper.ai/4WJGQ
该数据集涵盖了 70 种不同的语言,为低资源语言提供了更多的训练数据,含共计 182,000 个指令微调对,旨在提升大型语言模型在遵循指令方面的性能,特别是在多样化的语言和任务上。
直接使用:https://go.hyper.ai/1AY34
该数据集包含从 MyAnimeList 网站收集的热门动漫信息。它包括各种属性,可以详细描述每部动漫,可用于分析和研究动漫趋势、评分和其他相关因素。
直接使用:https://go.hyper.ai/mU04c
6. Magpie-Pro-300K-Filtered 高质量对齐数据集
该数据集是使用 Magpie 方法合成的高质量指令数据集,它是从 Llama-3 70B 中提取的。这个数据集包含约 300k 条高质量的对话,是通过一个自动化的自合成过程生成的,该过程利用了对齐的 LLMs 的自回归特性来生成用户查询和相应的回复。
直接使用:https://go.hyper.ai/YTDxI
该数据集包含 12k 个经过注释的视频,总共超过 420k 个剪辑片段。 Vript 数据集的每个片段都配有大约 145 个单词的标题。
直接使用:https://go.hyper.ai/7o2Ca
该数据集包含总计 664,487 颗树木的 1,920 张图像训练集和 480 张图像测试集,每张图像的平均包含 276 棵树木。
直接使用:https://go.hyper.ai/zTo63
9. AdaTreeFormer-London 伦敦高分辨率树木检测数据集
该数据集涵盖了各种城市和住宅环境,树木密度较高,具有不同的树木形状和大小。包含总计 95,067 颗树木的 452 张图像训练集和 161 张图像测试集,每张图像的平均包含 155 棵树木。
直接使用:https://go.hyper.ai/iVHO1
10. AdaTreeFormer-Yoesmite 约塞米蒂高分辨率树木检测数据集
该数据集主要覆盖木质山区,树木密度较低且地形复杂,包含总计 98,949 颗树木的 1,350 张图像训练集和 1,350 张图像测试集,每张图像的平均包含 36 棵树木,为模型在复杂地形中的性能提供了重要的测试环境。
直接使用:https://go.hyper.ai/ic1bO
更多公共数据集,请访问:
公共教程精选
1. 在线教程 | 清华大学强推!YOLOv10 实现更高效的目标检测
YOLOv10 是由清华大学研究人员基于 Ultralytics Python 包开发的实时目标检测方法,旨在解决之前 YOLO 版本在后处理和模型架构方面的不足。该教程,无需输入任何命令,一键克隆即可立即开启目标检测。
在线运行:https://go.hyper.ai/vtjgs
img2img-turbo 是一款高效的图像到图像转换模型,专为实现高效的视觉内容转换而设计。它能够轻松将单色图像赋予丰富的色彩,或将简单的草图转换为逼真的图像。本教程提供了一个直观的模型演示 Demo,简单几笔,即可让你体验到成为绘画高手的乐趣!
在线运行:https://go.hyper.ai/Ms5zH
3. ComfyUI StableDiffusion3 工作流在线教程
Stable Diffusion 3 是多模态扩散变换器 (MMDiT) 模型,专门用于将文本描述转化为图像,它在生成高质量图像、处理复杂布局以及解析复杂提示方面表现出色。本教程介绍了如何通过 ComfyUI 工作流来部署和使用 Stable Diffusion 3 。只需克隆容器,即可轻松通过 API 接口启动并运行模型。
在线运行:https://go.hyper.ai/sEQCW
社区文章精选
1. 登 Cell 子刊!清华大学张强锋课题组开发 SPACE 算法,组织模块发现能力领先同类工具
清华大学张强锋课题组开发了基于图自编码器深度学习框架的人工智能算法 SPACE,可从单细胞分辨率的空间转录组数据中,识别空间细胞类型并发现组织模块。 SPACE 在细胞类型识别和组织模块发现方面明显优于其他工具。本文是该研究的详细解读和分享。
查看完整报道:https://go.hyper.ai/IZE5Q
2. 上海交大余祥课题组发布可迁移深度学习模型,鉴定多类型 RNA 修饰、显著减少计算成本
上海交通大学生命科学技术学院长聘教轨副教授余祥课题组,联合上海辰山植物园杨俊 / 王红霞团队,开发了可迁移深度学习模型 TandemMod,实现了在 DRS 中鉴定多种类型的 RNA 修饰。本文是对实验过程的解读与分享。
查看完整报道:https://go.hyper.ai/qkS18
3. 通用机器人里程碑!MIT 提出策略组合框架 PoCo,解决数据源异构难题,实现机器人多任务灵活执行
麻省理工研究人员提出了机器人策略组合框架 PoCo,能够解决机器人在工具使用任务中的数据异构性、任务多样性问题。本文是对研究过程的解读与分享。
查看完整报道:https://go.hyper.ai/jrJNV
4. 中国科学院院士丁汉:人形机器人——机器人与人工智能结合的爆发点
近日,HyperAI 超神经深度对话丁汉院士,了解其在智能制造领域的深厚积累,以及他对工业机器人、人形机器人等研究领域的独到见解。本文是对丁汉院士访谈内容的详细解读与分享。
查看完整报道:https://go.hyper.ai/A883w
5. 20 个实验数据创造 AI 蛋白质里程碑!上海交大联合上海 AI Lab 发布 FSFP,有效优化蛋白质预训练模型
上海交通大学洪亮团队联合上海人工智能实验室青年研究员谈攀,提出了一个基于蛋白质预训练模型的微调训练方法 FSFP,能在只利用 20 个随机湿实验数据的情况下,高效训练蛋白质预训练模型,且能大幅提高模型的单点突变预测阳性率。本文是对论文的解读与分享。
查看完整报道:https://go.hyper.ai/5vKyf
热门百科词条精选
1. LlamaIndex
2. 终身学习 Lifelong Learning
3. 旋转位置编码 RoPE
4. 俄罗斯套娃表示学习 MRL
5. 三维高斯泼溅 3D Gaussian Splatting
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
B 站直播预告
「Meet AI4S」系列直播第一期将于 7 月 17 日 19:00 正式上线,我们有幸邀请到了浙江大学遥感与地理信息系统博士生丁佳乐,他将以「神经网络为房价的空间异质性提供新解释」为题,深入浅出地为大家介绍模型的设计思路与应用场景,并进一步分享地理加权回归的空间回归分析方法。
点击即可预约直播:https://www.huodongxing.com/event/2762111401922
嘉宾介绍
一站式追踪人工智能学术顶会:
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
下周再见!
关于 HyperAI 超神经 (hyper.ai)
HyperAI 超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
* 为 1300+ 公开数据集提供国内加速下载节点
* 收录 400+ 经典及流行在线教程
* 解读 100+ AI4Science 论文案例
* 支持 500+ 相关词条查询
* 托管国内首个完整的 Apache TVM 中文文档
访问官网开启学习之旅: