近日,纽约大学计算机科学助理教授、 Yann LeCun 的学生——Alfredo Canziani 公开了自己的春季「AI 课程」,内容覆盖离散概率和朴素贝叶斯、感知机和逻辑回归、优化、统计和神经自然语言处理、神经网络分类、循环神经网络和卷积神经网络等主题。
本周 HyperAI 超神经将在 B 站 7×24h 直播该课程,一起来学习吧~
观看地址:
http://live.bilibili.com/26483094
6 月 24 日-6 月 28 日,hyper.ai 官网更新速览:
访问官网:hyper.ai
公共数据集精选
1. GeoChat Instruct 遥感多模态指令跟踪数据集
该数据集包含近 31.8 万条指令,旨在扩展多模态指令调整到遥感领域,以训练多任务会话助理。相关论文成果已被 CVPR 2024 接受。
直接使用:https://go.hyper.ai/CXu0K
该数据集包含 17,402 个图像-描述-掩码三元组,覆盖多种空间分辨率和物体方向。相关论文成果已被 CVPR 2024 接受。
直接使用:https://go.hyper.ai/1VRQG
3. Earth Parser Dataset 遥感测绘数据集
该数据集是用于训练和评估大型、未经整理的空中 LiDAR 扫描的解析方法。数据集包含 7 个场景,覆盖面积超过 7.7 平方公里,总共 9,800 万个 3D 点。相关论文成果已被 CVPR 2024 接受。
直接使用:https://go.hyper.ai/3pFjm
4. Harvard-GF3300 视网膜神经疾病(青光眼)数据集
该数据集是一个包括 3,300 名受试者的视网膜神经疾病(青光眼)数据集,含有 2D 和 3D 图像数据,数据集中包含了来自 3 个主要种族群体(白人、黑人和亚洲人)相等数量的受试者,这避免了可能混淆公平学习问题的数据不平衡问题。
直接使用:https://go.hyper.ai/vIhu6
5. Dental X-ray Images for Analysis 牙科 X 射线图像数据集
该数据集包含各种各样的牙齿正畸断层扫描 (OPG) X 射线图像,70 个高质量样本。通过提供注释,此数据集可用于训练和测试机器学习模型,以进行牙齿类型分类、异常检测等牙科图像分析任务。
直接使用:https://go.hyper.ai/vK9zz
该数据集包含骨折和非骨折的 X 射线图像,涵盖所有解剖身体区域,包括下肢、上肢、腰椎、臀部、膝盖等。数据集分为训练、测试和验证文件夹,共 10,580 张放射图像(X 射线)数据。
直接使用:https://go.hyper.ai/Yk1bA
该数据集包含 10 种水果和 26 种蔬菜的图像,每种类别都分为了训练、测试和验证集,为图像识别任务提供了多样化的集合。
直接使用:https://go.hyper.ai/FdfRK
该数据集包含来自各种媒体类型和流派的 15,939 个热门角色信息。每个条目都包含有关角色、媒体来源和涉及角色的独特场景的详细信息。
直接使用:https://go.hyper.ai/wf1q1
RepLiQA 是一个包含「上下文-问题-答案」三元组的评估数据集,涵盖了 17 个主题或文档类别,旨在测试大型语言模型 (LLM) 在提供的文档中查找和使用上下文信息的能力。
直接使用:https://go.hyper.ai/ZkSYD
该数据集覆盖 11 个网络安全大类领域、 42 个子类领域,4,369 多项选择题、判断题、知识抽取题,提供知识型和实战型的综合评估任务,支持用户自主评测,同时为大模型落地网络安全提供参考和启发。
直接使用:https://go.hyper.ai/ziacf
更多公共数据集,请访问:
公共教程精选
该教程 Demo 可以对给定的生物图片按科、属、种等进行分类,是 CVPR2024 的最佳学生论文「BioCLIP: A Vision Foundation Model for the Tree of Life」中模型的 Gradio 版本。
在线运行:https://go.hyper.ai/OEWk1
2. InstantStyle 风格一致的图像生成器
InstantStyle 是由小红书的 InstantX 团队开发的一种文本到图像生成框架,实现了风格迁移的同时保持内容的文本可控性。该教程已经为大家搭建好了相关环境,一键克隆即可体验!
在线运行:https://go.hyper.ai/E6GuW
3. 5 秒生成高质量文章,Llama 3-Chinese-Chat Demo 一键启动!
该模型是基于 Meta-Llama-3-8b-Instruct 模型专门针对中文进行微调的中文聊天模型。与原始的 Meta-Llama-3-8b-Instruct 模型相比,显著减少了「中文问题英文回复」以及中英文混合的问题。只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。
在线运行:https://go.hyper.ai/BLHcM
社区文章精选
1. 最强铁基超导磁体诞生!科学家基于机器学习设计新研究体系,磁场强度超过先前记录 2.7 倍
来自英国和日本的科学家利用机器学习技术,设计了一种将 researcher-driven 与 data-driven 方法相结合的研究体系,成功制造出世界上已知最强的铁基超导磁体。本文是该研究的详细解读和分享。
查看活动详情:https://go.hyper.ai/RxV9x
2. 北大医院副院长李建平:用 AI 解决临床心肌缺血预测的难点、卡点和痛点
在北京智源大会上,北京大学第一医院副院长、心血管研究所所长李建平教授以「临床心肌缺血预测手段及困难」为题,分享了 AI 在冠心病诊断以及临床心肌缺血预测等方面的全新探索与实践。这为冠心病病人的诊断与治疗提供了全新思路,并将目光从心脏拓宽至肾脏,有望让 AI 在临床医学方面发挥出更大的价值。本文是该演讲的详细汇总。
查看完整专访:https://go.hyper.ai/5X9jM
3. 1 亿参数的细胞大模型来了!登 Nature 子刊,清华大学团队发布 scFoundation:对 2 万基因同时建模
清华大学研究团队提出了名为 sc-Foundation 的细胞大模型,该模型基于 5 千万个细胞的基因表达数据进行训练,拥有 1 亿参数,能够同时处理约 2 万个基因。作为基础模型,它在细胞测序深度增强、细胞药物响应预测和细胞扰动预测等多种生物医学下游任务中,表现出卓越的性能提升。本文是该研究的详细解读和分享。
查看完整报道:https://go.hyper.ai/v5i5K
4. AI 从业者怎么做 Science?清华大学 AIR 周浩:从文本生成到蛋白质设计的跨界探索
近日,清华大学智能产业研究院周浩教授以计算机从业者的身份,向大家分享了 AI 人做蛋白质设计遇到的多重挑战,并从数据结构、生成算法、蛋白质预训练 3 个方面讲述了目前蛋白质领域的最新前沿研究。本文对周浩教授的深度分享进行了报道。
查看完整报道:https://go.hyper.ai/PTyAp
热门百科词条精选
1. 缩放定理 Scaling Law
2. 倒数排名融合 RRF
3. 神经辐射场 NeRF
4. 大规模多任务语言理解 MMLU
5. Kolmogorov-Arnold 表示定理
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
B 站直播预告
AIfredo Canziani 是纽约大学计算机科学助理教授、 Yann LeCun 的学生。近日,他放出了自己的春季「AI 课程」视频,各章节讲授的知识点包括:离散概率和朴素贝叶斯;感知机和逻辑回归;优化、统计和神经自然语言处理;神经网络分类等。本周超神经电视台将 7×24h 直播该课程。
下表为小编为大家精选的内容预告↓↓↓
日期 | 时间 | 内容 |
---|---|---|
7 月 1 日星期一 | 18:00 | 第 1 部分朴素贝叶斯简介 |
7 月 2 日星期二 | 18:00 | 第 2 部分朴素贝叶斯分类 |
7 月 3 日星期三 | 18:00 | 第 3 部分朴素贝叶斯参数估计和拉普拉斯平滑 |
7 月 4 日星期四 | 18:00 | 第 4 部分二元分类器评估 |
7 月 5 日星期五 | 18:00 | 第 5 部分多类感知器二元和多类逻辑回归 |
7 月 6 日星期六 | 18:00 | 第 6 部分优化和梯度上升 |
7 月 7 日星期日 | 18:00 | Alfredo Canziani 演讲基于能量的自监督学习 |
超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:
http://live.bilibili.com/26483094
一站式追踪人工智能学术顶会:https://hyper.ai/events
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
下周再见!
关于 HyperAI 超神经 (hyper.ai)
HyperAI 超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
访问官网开启学习之旅: