HyperAI超神经

近日，纽约大学计算机科学助理教授、 Yann LeCun 的学生——Alfredo Canziani 公开了自己的春季「AI 课程」，内容覆盖离散概率和朴素贝叶斯、感知机和逻辑回归、优化、统计和神经自然语言处理、神经网络分类、循环神经网络和卷积神经网络等主题。
本周 HyperAI 超神经将在 B 站 7×24h 直播该课程，一起来学习吧~

观看地址：

http://live.bilibili.com/26483094

6 月 24 日-6 月 28 日，hyper.ai 官网更新速览：

优质公共数据集：10 个
优质教程精选：3 个
社区文章精选：4 篇
热门百科词条：5 条
7 月截稿顶会：4 个

访问官网：hyper.ai

公共数据集精选

1. GeoChat Instruct 遥感多模态指令跟踪数据集

该数据集包含近 31.8 万条指令，旨在扩展多模态指令调整到遥感领域，以训练多任务会话助理。相关论文成果已被 CVPR 2024 接受。

直接使用：https://go.hyper.ai/CXu0K

2. RRSIS-D 大型遥感图像分割数据集

该数据集包含 17,402 个图像-描述-掩码三元组，覆盖多种空间分辨率和物体方向。相关论文成果已被 CVPR 2024 接受。

直接使用：https://go.hyper.ai/1VRQG

3. Earth Parser Dataset 遥感测绘数据集

该数据集是用于训练和评估大型、未经整理的空中 LiDAR 扫描的解析方法。数据集包含 7 个场景，覆盖面积超过 7.7 平方公里，总共 9,800 万个 3D 点。相关论文成果已被 CVPR 2024 接受。

直接使用：https://go.hyper.ai/3pFjm

4. Harvard-GF3300 视网膜神经疾病（青光眼）数据集

该数据集是一个包括 3,300 名受试者的视网膜神经疾病（青光眼）数据集，含有 2D 和 3D 图像数据，数据集中包含了来自 3 个主要种族群体（白人、黑人和亚洲人）相等数量的受试者，这避免了可能混淆公平学习问题的数据不平衡问题。

直接使用：https://go.hyper.ai/vIhu6

5. Dental X-ray Images for Analysis 牙科 X 射线图像数据集

该数据集包含各种各样的牙齿正畸断层扫描 (OPG) X 射线图像，70 个高质量样本。通过提供注释，此数据集可用于训练和测试机器学习模型，以进行牙齿类型分类、异常检测等牙科图像分析任务。

直接使用：https://go.hyper.ai/vK9zz

6. 多区域骨折 X 射线数据集

该数据集包含骨折和非骨折的 X 射线图像，涵盖所有解剖身体区域，包括下肢、上肢、腰椎、臀部、膝盖等。数据集分为训练、测试和验证文件夹，共 10,580 张放射图像（X 射线）数据。

直接使用：https://go.hyper.ai/Yk1bA

7. 水果蔬菜图像识别数据集

该数据集包含 10 种水果和 26 种蔬菜的图像，每种类别都分为了训练、测试和验证集，为图像识别任务提供了多样化的集合。

直接使用：https://go.hyper.ai/FdfRK

8. Character Codex 人物角色数据集

该数据集包含来自各种媒体类型和流派的 15,939 个热门角色信息。每个条目都包含有关角色、媒体来源和涉及角色的独特场景的详细信息。

直接使用：https://go.hyper.ai/wf1q1

9. RepLiQA 用于基准测试的可能问答数据集

RepLiQA 是一个包含「上下文-问题-答案」三元组的评估数据集，涵盖了 17 个主题或文档类别，旨在测试大型语言模型 (LLM) 在提供的文档中查找和使用上下文信息的能力。

直接使用：https://go.hyper.ai/ZkSYD

10. CS-Eval 大模型网络安全评测数据集

该数据集覆盖 11 个网络安全大类领域、 42 个子类领域，4,369 多项选择题、判断题、知识抽取题，提供知识型和实战型的综合评估任务，支持用户自主评测，同时为大模型落地网络安全提供参考和启发。

直接使用：https://go.hyper.ai/ziacf

更多公共数据集，请访问：

https://hyper.ai/datasets

公共教程精选

1. Bioclip 生物分类的层次预测 Demo

该教程 Demo 可以对给定的生物图片按科、属、种等进行分类，是 CVPR2024 的最佳学生论文「BioCLIP: A Vision Foundation Model for the Tree of Life」中模型的 Gradio 版本。

在线运行：https://go.hyper.ai/OEWk1
2. InstantStyle 风格一致的图像生成器

InstantStyle 是由小红书的 InstantX 团队开发的一种文本到图像生成框架，实现了风格迁移的同时保持内容的文本可控性。该教程已经为大家搭建好了相关环境，一键克隆即可体验！

在线运行：https://go.hyper.ai/E6GuW

3. 5 秒生成高质量文章，Llama 3-Chinese-Chat Demo 一键启动！

该模型是基于 Meta-Llama-3-8b-Instruct 模型专门针对中文进行微调的中文聊天模型。与原始的 Meta-Llama-3-8b-Instruct 模型相比，显著减少了「中文问题英文回复」以及中英文混合的问题。只需克隆并启动该容器，直接复制生成的 API 地址，即可对模型进行推理体验。

在线运行：https://go.hyper.ai/BLHcM

社区文章精选

1. 最强铁基超导磁体诞生！科学家基于机器学习设计新研究体系，磁场强度超过先前记录 2.7 倍

来自英国和日本的科学家利用机器学习技术，设计了一种将 researcher-driven 与 data-driven 方法相结合的研究体系，成功制造出世界上已知最强的铁基超导磁体。本文是该研究的详细解读和分享。

查看活动详情：https://go.hyper.ai/RxV9x

2. 北大医院副院长李建平：用 AI 解决临床心肌缺血预测的难点、卡点和痛点

在北京智源大会上，北京大学第一医院副院长、心血管研究所所长李建平教授以「临床心肌缺血预测手段及困难」为题，分享了 AI 在冠心病诊断以及临床心肌缺血预测等方面的全新探索与实践。这为冠心病病人的诊断与治疗提供了全新思路，并将目光从心脏拓宽至肾脏，有望让 AI 在临床医学方面发挥出更大的价值。本文是该演讲的详细汇总。

查看完整专访：https://go.hyper.ai/5X9jM

3. 1 亿参数的细胞大模型来了！登 Nature 子刊，清华大学团队发布 scFoundation：对 2 万基因同时建模

清华大学研究团队提出了名为 sc-Foundation 的细胞大模型，该模型基于 5 千万个细胞的基因表达数据进行训练，拥有 1 亿参数，能够同时处理约 2 万个基因。作为基础模型，它在细胞测序深度增强、细胞药物响应预测和细胞扰动预测等多种生物医学下游任务中，表现出卓越的性能提升。本文是该研究的详细解读和分享。

查看完整报道：https://go.hyper.ai/v5i5K

4. AI 从业者怎么做 Science？清华大学 AIR 周浩：从文本生成到蛋白质设计的跨界探索

近日，清华大学智能产业研究院周浩教授以计算机从业者的身份，向大家分享了 AI 人做蛋白质设计遇到的多重挑战，并从数据结构、生成算法、蛋白质预训练 3 个方面讲述了目前蛋白质领域的最新前沿研究。本文对周浩教授的深度分享进行了报道。

查看完整报道：https://go.hyper.ai/PTyAp

热门百科词条精选

1. 缩放定理 Scaling Law

2. 倒数排名融合 RRF

3. 神经辐射场 NeRF

4. 大规模多任务语言理解 MMLU

5. Kolmogorov-Arnold 表示定理

这里汇编了数百条 AI 相关词条，让你在这里读懂「人工智能」：

https://hyper.ai/wiki

B 站直播预告

AIfredo Canziani 是纽约大学计算机科学助理教授、 Yann LeCun 的学生。近日，他放出了自己的春季「AI 课程」视频，各章节讲授的知识点包括：离散概率和朴素贝叶斯；感知机和逻辑回归；优化、统计和神经自然语言处理；神经网络分类等。本周超神经电视台将 7×24h 直播该课程。

下表为小编为大家精选的内容预告↓↓↓

日期	时间	内容
7 月 1 日星期一	18:00	第 1 部分朴素贝叶斯简介
7 月 2 日星期二	18:00	第 2 部分朴素贝叶斯分类
7 月 3 日星期三	18:00	第 3 部分朴素贝叶斯参数估计和拉普拉斯平滑
7 月 4 日星期四	18:00	第 4 部分二元分类器评估
7 月 5 日星期五	18:00	第 5 部分多类感知器二元和多类逻辑回归
7 月 6 日星期六	18:00	第 6 部分优化和梯度上升
7 月 7 日星期日	18:00	Alfredo Canziani 演讲基于能量的自监督学习

超神经电视台 7×24h 不间断直播，点击即可收获 AI 领域的「电子榨菜」：

http://live.bilibili.com/26483094

一站式追踪人工智能学术顶会：https://hyper.ai/events

以上就是本周编辑精选的全部内容，如果你有想要收录 hyper.ai 官方网站的资源，也欢迎留言或投稿告诉我们哦！

下周再见！

关于 HyperAI 超神经 (hyper.ai)

HyperAI 超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区， 致力于成为国内数据科学领域的基础设施，为国内开发者提供丰富、优质的公共资源，截至目前已经：

为 1300+ 公开数据集提供国内加速下载节点
收录 400+ 经典及流行在线教程
解读 100+ AI4Science 论文案例
支持 500+ 相关词条查询
托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅：

https://hyper.ai

独家中字！LeCun 学生 Alfredo 春季 AI 课程开播；CVPR’24 遥感数据集下载