PhotoMaker 是由腾讯与南开大学联合开发的 AI 图像生成工具,不仅能够捕捉人物的面部特征,还能根据喜好生成逼真的人物图像,将个性化定制推向了新高度。无论是想要一个全新的社交媒体头像,还是为游戏设计独特的角色都能满足。
该项目的一键运行 Demo 教程现已上线 hyper.ai 官网,为了让大家更方便快捷地体验该模型,还上线了 ComfyUI 工作流版本,生成速度更快!更多自定义形式可选!快来体验一下~
6 月 17 日-6 月 21 日,hyper.ai 官网更新速览:
* 优质公共数据集:10 个
* 优质教程精选:2 个
* 社区文章精选:4 篇
* 热门百科词条:5 条
* 6-7 月截稿顶会:5 个
访问官网:hyper.ai
公共数据集精选
该数据集拥有超过 1,000 万张图像,涵盖生命之树中的 45.4 万个分类单元,是迄今为止最大的 ML 生物有机体图像及其相关分类标签的数据集。研究成果论文为 CVPR 2024 的最佳论文。
直接使用:https://go.hyper.ai/jimyx
该数据集是一个基包含 15 种不同类别的人类活动,约 12k+ 张标记图像(包括验证图像),每个图像只有一个人类活动类别,旨在理解人类行为并为每个动作分配标签。
直接使用:https://go.hyper.ai/3jmf1
该数据集为 Linux 中国原创技术文章+翻译技术文章的数据集,提供了文章标题、内容等多个字段。
直接使用:https://go.hyper.ai/KgFgf
4. DroneVehicle 大规模无人机航拍车辆检测数据集
该数据集由无人机采集的共 56,878 幅图像组成,其中一半为 RGB 图像,其余为红外图像。该数据集为智能城市交通管理和灾难救援提供了支持。
直接使用:https://go.hyper.ai/KhbuB
该数据集是一个专注于钢琴演奏手势生成的基准测试数据集,涵盖了从鸟瞰视角拍摄的 116 小时的钢琴演奏视频,并包含了 1,000 万个标注的手部姿势。这些数据提供了丰富的资源以探索钢琴音乐与手部动作之间的关联。
直接使用:https://go.hyper.ai/QAOi8
该数据集是首个面向法律领域的大型指令数据集,涵盖了 17 个司法管辖区和 24 种语言,包含 1200 万个训练示例,覆盖问答、蕴含、摘要和信息提取等多种法律任务。
直接使用:https://go.hyper.ai/ARN3n
该数据集包含了美国手语的字母图像,这些图像被分为 29 个类别,代表不同的手语字母和符号。数据集中的图像尺寸统一为 200×200 像素,训练数据集包含 87,000 张图像。
直接使用:https://go.hyper.ai/IhhZc
该数据集是一个大规模的英文手写字母图像集合,专为手写识别任务而设计,可以用于训练各种图像识别模型。
直接使用:https://go.hyper.ai/28lwk
该数据集包含超过 9,000 张带有面部特征注释的猫图像。每张图片都有猫头的注释,其中有 9 个点:1 个表示嘴巴,2 个表示眼睛,6 个表示耳朵。
直接使用:https://go.hyper.ai/MkmTu
10. Audio Cats and Dogs 猫狗音频数据集
该数据集包含上百个猫和狗的音频类别「wav」文件:其中猫有 164 个 WAV 文件,对应 1,323 秒的音频;狗有 113 个 WAV 文件,对应 598 秒的音频。所有「wav」文件都包含 16KHz 音频并且长度可变。
直接使用:https://go.hyper.ai/e0RGg
更多公共数据集,请访问:
公共教程精选
1. PhotoMaker 任意风格化图像生成 Demo
PhotoMaker 是一个高效的人像定制文生图模型,可以快速地根据人物照生成定制的人物照片和艺术照片。除了生成个性化人物照片以外,它还能改变人物的年龄和性别,整合不同人物的特征创造新的人物信息,是一款非常使用的 AI 绘画工具。该教程已经搭建好了环境,方便大家运行体验。
在线运行:https://go.hyper.ai/3B5Rd
2. ComfyUI PhotoMaker ZHO 图像生成工作流
该教程是 PhotoMaker 的 ComfyUI 工作流运行方法,和 Gradio 版的 Demo 相比,ComfyUI 工作流版本具有生成速度更快、支持节点拆分和自定义尺寸等优势。超神经已经为大家搭建好了相关环境,一键克隆即可运行。
在线运行:https://go.hyper.ai/XdSoQ
该教程用基模型 HuBERT 来演示如何使用预训练的音频模型执行音频分类任务,通过在预训练模型上进行微调,实现音乐风格分类。
在线运行:https://go.hyper.ai/7QjRj
我们还建立了 Stable Diffusion 教程交流群,欢迎小伙伴们扫码备注【SD 教程】,入群探讨各类技术问题、分享应用效果~
社区文章精选
1. AI 编译器技术分享会:上海交大/中科院计算所/微软亚研/智源,他们来了!
HyperAI 超神经将于 7 月 6 日(周六)在中国科学院计算技术研究所,举办 Meet AI Compiler 技术沙龙的第 5 期线下聚会。本次 Meetup 分为技术分享和圆桌讨论两个环节,嘉宾分别来自上海交通大学、中国科学院计算技术研究所、微软亚洲研究院、北京智源人工智能研究院,期待新的聚会能为大家带来新的技术收获,结交新的同行好友。点击「阅读原文」即可报名参与!
查看活动详情:https://go.hyper.ai/oAsLQ
2. 对话华师大上海人工智能金融学院院长邵怡蕾:AI 时代,人文见长的学校会非常有优势
全球首家围绕人工智能与金融跨界交叉打造的教育和研究机构——华东师范大学上海人工智能金融学院,近日正式揭牌成立。 HyperAI 超神经有幸与邵怡蕾院长进行了一次深度访谈,进一步了解到了新学院的愿景与发展规划。
查看完整专访:https://go.hyper.ai/bp4Po
3. 可抑制癌细胞增殖!慧湖药学院联手天津医科大,研发新型肿瘤抑制蛋白降解剂 dp53m
西交利物浦大学慧湖药学院吴思晋教授联合天津医科大学总医院谢松波教授、钟殿胜教授团队研发了一种具有选择性的 p53-R175H 降解剂—dp53m,该降解剂可特异性识别突变 p53-R175H 蛋白,并对其靶向降解,有显著的抗肿瘤功效,且无明显毒性反应。 dp53m 还能增强癌细胞对化疗药物顺铂的敏感性,对癌症的治疗至关重要。本文是该研究的详细解读和分享。
查看完整报道:https://go.hyper.ai/k80er
4. 精准预测武汉房价!浙大 GIS 实验室提出 osp-GNNWR 模型:准确描述复杂空间过程和地理现象
浙江大学 GIS 实验室的研究人员引入了一种神经网络方法,对观测点间的多种空间邻近性度量进行非线性耦合,得到优化的空间邻近性度量,提升了模型对房价预测的准确性。研究还将 OSP 与地理神经网络加权回归方法结合,构建 osp-GNNWR 模型,通过解算因变量与自变量的空间非平稳回归关系实现神经网络的训练。本文是该研究的详细解读和分享。
查看完整报道:https://go.hyper.ai/kWmHC
热门百科词条精选
1. 函数调用 Function Calling
2. 脉冲神经网络 SNN
3. 上下文位置编码 CoPE
4. 俄罗斯套娃表示学习 MRL
5. Kolmogorov-Arnold 表示定理
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
B 站直播预告
Jeff Dean 是谷歌的高级研究员和计算机科学家,以其在分布式系统和人工智能领域的开创性工作而闻名,包括开发 MapReduce 和 TensorFlow,是谷歌技术发展的关键人物之一。本周超神经电视台将为大家直播 Jeff Dean 相关的演讲和访谈。
下表为小编为大家精选的内容预告↓↓↓
日期 | 时间 | 内容 |
6 月 24 日星期一 | 18:00 | Jeff Dean 谈机器学习五大趋势 |
6 月 25 日星期二 | 18:00 | 让 AI 服务于每个人 |
6 月 26 日星期三 | 18:00 | Jeff Dean 对 AI 未来的积极看法 |
6 月 27 日星期四 | 18:00 | Jeff Dean 于斯坦福医学大数据会议的演讲 |
6 月 28 日星期五 | 18:00 | Jeff Dean 关于深度学习的演讲 |
6 月 29 日星期六 | 18:00 | Google Brain & Brain Residency |
6 月 20 日星期日 | 18:00 | 如何利用深度学习解决问题 |
超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:
http://live.bilibili.com/26483094
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
下周再见!
关于 HyperAI 超神经 (hyper.ai)
HyperAI 超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
* 为 1300+ 公开数据集提供国内加速下载节点
* 收录 400+ 经典及流行在线教程
* 解读 100+ AI4Science 论文案例
* 支持 500+ 相关词条查询
* 托管国内首个完整的 Apache TVM 中文文档
访问官网开启学习之旅: