近日,Meta 震撼发布了号称「开源 GPT-4」的大模型 Llama3,该模型惊动了整个 AI 圈,HyperAI 超神经也迫不及待想要体验一下!hyper.ai 官网现已在公共教程上线「一键部署 Llama3」!有没有人和我一样激动的搓手手?赶紧来运行一下~
4 月 22 日-4 月 26 日,hyper.ai 官网更新速览:
* 优质公共数据集:10 个
* 优质教程精选:3 个
* 社区文章精选:5 篇
* 热门百科词条:5 条
访问官网:hyper.ai
公共数据集精选
COCONut 是由字节跳动发布的首个大规模人工标注的全景图像分割数据集,包含约 383K 图像和 518 万个经过人工标注的全景分割掩码。该成果已入选 CVPR2024 。
直接使用:https://go.hyper.ai/43gIy
2. Solar System Planets 太阳系行星数据集
该数据集包含太阳系所有行星的 .jpg 格式图片,数据集分为训练集、测试集和验证集。每个集都包含 9 个不同行星的子集:地球、水星、金星、地球、火星、木星、土星、天王星和海王星。
直接使用:https://go.hyper.ai/awnIo
3. Chinese medical dialogue data 中文医疗问答数据集
该数据集为中文医疗问答数据集,包含 6 个不同医疗科室的问答数据文件夹,每个文件夹下有一个 csv 文件。
直接使用:https://go.hyper.ai/scsmp
TAL-SCQ5K 是一组高质量中文数学竞赛数据集,包含 5K 道中文数学竞赛题目(3K 道用于训练,2K 道用于测试),提供中文和英文两种语言。
直接使用:https://go.hyper.ai/RqwbX
该数据集包含 15.6 万条安徽电信问答数据,包括用户提问、网友回答、最佳回答,数据集来源为百度知道,适用于 FAQ 问答系统任务。
直接使用:https://go.hyper.ai/CMkpM
该数据集包含来自 1,119 位不同艺术家、 27 种风格的 80,020 张独特图像,数据来源于 WikiArt.org,WikiArt 数据集只能用于非商业研究目的。
直接使用:https://go.hyper.ai/nCKMw
该数据集包含世界上 50 个最令人惊叹的地标,这些地标均选自著名的新七大奇迹列表。数据集信息包括地标的:名称、类型、位置、维基百科链接、图片链接和建造年份。
直接使用:https://go.hyper.ai/qQLA4
8. Google Landmarks Photos 谷歌地标图片数据集
该数据集包含约 12 万个地标图片的 URL,每个地标图片都有唯一的 ID,有助于实例识别和图像检索任务。
直接使用:https://go.hyper.ai/fJ5kO
9. GIS World Data File GIS 世界数据文件数据集
该数据集为世界地图的形状数据集,包含国家边界、一级行政管理(省、州等)、有争议的地区、海岸线、人口稠密地区等各种比例级别的地图。
直接使用:https://go.hyper.ai/hcwKe
该数据集为论文「基于时空机器学习的卫星全球海表氧气测绘与解释」中使用的数据。基于该论文研究搭建的框架 DOsurface-Pred Framework,研究团队生成了跨越 2010-2018 年的大规模海表溶解氧数据集,包含卫星数据、固定船只和电导仪测量数据。
直接使用:https://go.hyper.ai/d9w8B
更多公共数据集,请访问:
公共教程精选
1. 使用 Ollama 和 Open WebUI 部署 Llama3-8B-Instruct
该教程为 Ollama + Open WebUI 一键运行包,只需按步骤输入命令即可运行 Llama3-8B-Instruct 大模型。
在线运行:https://go.hyper.ai/7lZyb
2. 使用 Ollama 和 Open WebUI 部署 Llama3-70B
该教程通过 Ollama 和 Open WebUI 工具来一键运行模型,仅需按步骤输入命令即可运行 Llama3-70B 大模型。虽然模型参数较大,但经过平台部署后使用单卡 A6000 即可使用,仅占用 1.07 GB 存储。
在线运行:https://go.hyper.ai/u4XHj
3. 在线教程丨刘强东数字人首秀交易额破 5 千万!用 GeneFace++ 生成实时说话数字人
GeneFace++ 作为一种通用且稳定的实时音频驱动 3D 说话人脸生成技术,可以通过改进唇形同步、视频质量和系统效率,实现实时说话人的生成。「GeneFace++ 数字人 Demo」教程现已上线 hyper.ai 官网,并且为大家搭建好环境,简化了数字人的制作流程,无需担心环境配置、硬件需求和版本兼容等问题,点击在线运行即可一键启动。
在线运行:https://go.hyper.ai/4BwgN
社区文章精选
1.【数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等
干货来了!hyper.ai 汇总了 10 个数学分类数据集,内含天才数学家陶哲轩力荐的数据集资源,助力 AI for Math 的发展研究。
查看详细干货:https://go.hyper.ai/6Vhrb
2. 基于美日 627 例患者的临床数据,谷歌证实 AI 辅助肺癌筛查的群体有效性
基于 AI 的快速发展,谷歌团队研究了机器学习模型如何有效地将研究结果传达给放射科医生,评估了广义人工智能辅助系统在特定工作流程环境、设备和国家特定指南和评分/管理协议下对肺癌筛查工作流程的影响,并在美国和日本进行测试。结果表明,在人工智能辅助下,平均每位病例筛查时间可减少 14 秒。研究论文已经发表于「Radiology AI」期刊。
查看完整报道:https://go.hyper.ai/wiCl0
3.【活动汇总】纽约大学 AI Meets Science;第十六届生物信息学和生物医学技术国际会议;Bio-IT World2024
HyperAI 超神经网罗了海内外 AI for Science 垂类会议,并整理会议信息与链接,一键直达官方主页,不错过任何一场重量级活动!本文为近期的活动汇总。
查看完整文章:https://go.hyper.ai/HTGNG
4. 纳米尺度下的单粒子追踪,厦门大学方宁团队用 AI 奏响「细胞里的摇滚」
厦门大学方宁教授团队基于深度学习研发了一种自动化、高速、多维的单粒子追踪系统,打破了细胞微环境中纳米颗粒旋转追踪的局限性,实现了在纳米尺度下,全方位、精准追踪活细胞内单分子/单个纳米颗粒。本文是该研究的详细解读和分享该论文已经发表于权威期刊「Nano Letters」。
查看完整报道:https://go.hyper.ai/G4k2e
5. 解构海洋缺氧:浙大 GIS 实验室融合机器学习及卫星测绘,发布全球海表溶解氧综合建模框架
浙大 GIS 实验室研究人员将机器学习技术与卫星产品相结合,开发了一个全球海表溶解氧综合建模框架 DOsurface-Pred Framework,证实了即使在氧气充足的海表区域,其溶解氧含量也出现了下降趋势,而这种趋势主要归因于海表温度的变化。研究论文已经发表于「ACS Publications」。
查看完整报道:https://go.hyper.ai/NlRmn
热门百科词条精选
1. 故障词元 Glitch Token
2. 多模态大语言模型 MLLM
3. 掩码语言建模 MLM
4. 分组查询注意力 GQA
5. 变分自编码器 VAE
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
B 站直播预告
Google 日前宣布将于当地时间 5 月 14 日举办 2024 年度 I/O 开发者大会,为了帮助大家深入了解,超神经直播间将持续直播「Google 专题」视频,涉及:Google I/O 历年发布会、高管访谈、相关纪录片等丰富内容。
下表为小编为大家精选的内容预告↓↓↓
日期 | 时间 | 内容 |
4 月 29 日 星期一 | 18:00 | Google 历年 I/O 发布会 |
4 月 30 日星期二 | 18:00 | Google Cloud NEXT 历年大会 |
5 月 1 日星期三 | 18:00 | TIME100 访谈 Sundar Pichai |
5 月 2 日星期四 | 18:00 | Google 首席执行官谈中美人工智能竞赛 |
5 月 3 日星期五 | 18:00 | AlphaGo 纪录片 |
5 月 4 日星期六 | 18:00 | Google 纪录片背后创始人的故事 |
5 月 5 日星期日 | 18:00 | BBC 纪录片没有 Google 的世界 |
超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:
http://live.bilibili.com/26483094
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
下周再见!
关于 HyperAI 超神经 (hyper.ai)
HyperAI 超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
* 为 1400+ 公开数据集提供国内加速下载节点
* 收录 300+ 经典及流行在线教程
* 解读 100+ AI4Science 论文案例
* 支持 500+ 相关词条查询
* 托管国内首个完整的 Apache TVM 中文文档
访问官网开启学习之旅: