AI 如何赋予静态人像生命力,使其微笑、眨眼、甚至微妙的面部表情都栩栩如生?近日,快手团队开源了 LivePortrait,只需上传一张静态照片,它就能变身为表情丰富的动态肖像,在 GitHub 上已狂揽 9K stars。该教程现已在 HyperAI超神经上线,快来急速体验一下!
LivePortrait 教程链接:
7 月 29 日-8 月 2 日,hyper.ai 官网更新速览:
- 优质公共数据集:11 个
- 优质教程精选:3 个
- 社区文章精选:4 篇
- 热门百科词条:5 条
- 8 月截稿顶会:4 个
访问官网:hyper.ai
公共数据集精选
SA-V 数据集是由 Meta 公司于 2024 年构建的一个大规模视频分割数据集,用于训练和评估 Meta Segment Anything Model 2,包含了约 51,000 个真实世界视频和 643K 个时空遮罩注释,在大小上比其他同类数据集大 50 倍左右。
直接使用: https://go.hyper.ai/X4DGI
2. LAB Bench 生物学基准数据集丨覆盖 8 大任务,超 2.4K 选择题
为促进生物学领域对 AI 系统的有效开发,FutureHouse Inc. 的研究人员推出了语言 Agent 生物学基准数据集 LAB-Bench,该数据集用于评估 AI 系统在文献检索和推理、图表解释、DNA 和蛋白质序列的理解和处理等实际生物学研究的表现,成果已提交至顶会 NeurlPS 2024。
直接使用: https://go.hyper.ai/UznkS
该数据集包含 860k+ 数学竞赛问题-解答对,每个解答都使用了思维链 (Chain of Thought, CoT) 推理模板。数据集的来源包括中国高中数学练习题、美国和国际数学奥林匹克竞赛题。数据主要收集自在线试卷 PDF 和数学讨论论坛。
直接使用: https://go.hyper.ai/svElx
该数据集包含手游 App TapTap 上约 300 款游戏的标签评论,共 4,888 个数据示例,可用于情感分析的任务。其中用户评论低于 3 星(最多 5 星)被视为 0(不满意),其他为 1(满意)。这两个类别的比例大约是 1:1 。
直接使用: https://go.hyper.ai/ISf7c
CCPD 数据集是一个大型的、多样化的、经过仔细标注的车牌识别数据集。该数据集主要在中国合肥市的停车场采集得到,包含了多种复杂环境下的车牌照片,例如模糊、倾斜、阴雨天和雪天等,使得数据集在车牌识别任务中更具挑战性。
直接使用: https://go.hyper.ai/gZ37Y
该数据集是一个由 GPT-3.5 和 GPT-4 生成的短篇故事合成数据集,包含的词汇量限定在 3 至 4 岁儿童理解的范围内。可以使用该数据集训练模型生成流畅、一致、多样化且语法近乎完美的短故事。
直接使用: https://go.hyper.ai/m9ouS
该数据集由 AI for Mankind 与 HPWREN 于 2019 年合作发布,共包含 737 张图片,其中有 516 张训练图片、147 张验证图片和 74 张测试图片,标注格式为 COCO。旨在提高模型区分云/雾和烟雾的能力,建立端到端反馈循环。
直接使用: https://go.hyper.ai/ofGHZ
这是一个公共领域语音数据集,包含 13,100 个简短的音频片段,其中单个说话者朗读 7 本非小说类书籍中的段落。每个片段都提供转录。片段的长度从 1 秒到 10 秒不等,总长度约为 24 小时。
直接使用: https://go.hyper.ai/Eo1bK
9. Chinese Zodiac Signs 十二生肖数据集
该数据集包含中国十二个生肖类别,共 8,508 张图片。数据集已事先分割为训练、验证和测试,比例为 85:7.5:7.5 。
直接使用: https://go.hyper.ai/ps2es
10. DISC-Law-SFT 高质量中文法律监督微调数据集
该数据集包含近 30 万条训练数据,专为中文法律领域设计,旨在提高模型在法律文本处理、法律推理思维以及司法领域知识检索遵循等方面的能力。
直接使用: https://go.hyper.ai/zh9Ij
11. Free Spoken Digit Dataset (FSDD) 数字识别音频数据集
Free Spoken Digit Dataset (FSDD) 是一个音频数据集,由 8kHz 采样率的 wav 文件中的数字语音录音组成。这些录音经过裁剪,以尽量减少开头和结尾的沉默时间。
直接使用: https://go.hyper.ai/HZ00d
更多公共数据集,请访问:
公共教程精选
1. 教程上新 | 文生图、图生图、图像修复三合一神器,HiDiffusion 一键启动教程现已上线!
HiDiffusion 是旷世科技开源的高分辨率框架,不仅支持文生图、图生图,还具备图像修复功能。HyperAI超神经现已上线「HiDiffusion 可快速生成高质量 8k 图像 Demo」教程,无需输入任何命令,一键克隆即可启动。
在线运行: https://go.hyper.ai/yZ5K5
2. LivePortrait 快手开源图生视频数字人 Demo
LivePortrait 是一个人像视频生成框架,主要功能包括从单一图像生成生动动画、精确控制眼睛和嘴唇的动作、处理多个人物肖像的无缝拼接、支持多风格肖像、生成高分辨率动画等。该教程为 LivePortrait 一键运行 Demo,相关环境和依赖已经安装完毕,一键克隆启动即可体验。
在线运行: https://go.hyper.ai/oTs66
3. AuraSR 基于 GAN 的超分辨率图像放大 Demo
AuraSR 是一款基于深度学习的图片高清修复模型,能够智能识别图片中的细节信息,并在放大图片的同时,自动补充缺失的细节。与传统的图片放大方法相比,AuraSR 不仅效果更加出色,而且操作简便,无需专业技能即可轻松上手。一键克隆即可体验模型。
在线运行: https://go.hyper.ai/y2wIU
社区文章精选
1.Meta/东京电子/FPT 软件等共同贡献,Aitomatic 发布首个半导体行业开源大模型,「锁死」企业技术自主权
工业领域 AI 革新领军企业 Aitomatic 宣布推出世界上首个专为半导体行业设计的开源 AI 大语言模型 SemiKong。该公司此前还曾推出名为 aiKO 的 AI Agent,基于企业用户的专业知识、数据,为其构建专属 Agent,企业对于其 Agent 拥有「完全所有权」。
查看完整报道: https://go.hyper.ai/A7eCi
7 月 30 日凌晨,在第 51 届 SIGGRAPH 图形大会上,英伟达创始人兼 CEO 黄仁勋和 Meta 创始人兼 CEO 马克·扎克伯格进行了一次「围炉夜话」。HyperAI超神经为汇总了精华片段和完整中文字幕视频。
查看完整报道: https://go.hyper.ai/rbU2u
3. 入选 ICML!麻省理工团队基于 AlphaFold 实现新突破,揭示蛋白质动态多样性
麻省理工学院的研究团队重新利用 AlphaFold 和 ESMFold 等高精度的单态预测器,并在自定义流匹配 (Flow Matching) 框架下对其进行微调,以获得序列条件的蛋白质结构生成模型,称为 AlphaFLOW 和 ESMFLOW。本文是对相关论文的详细解读与分享。
查看完整报道: https://go.hyper.ai/qupG9
4. 水平直逼高级病理学家!清华团队提出AI基础模型ROAM,实现胶质瘤精准诊断
清华大学自动化系生命基础模型实验室与中南大学湘雅医院合作,提出了一种基于大区域兴趣和金字塔 Transformer 的精准病理诊断 AI 基础模型 ROAM,用于胶质瘤的临床级诊断和分子标志物发现,并可拓展到其他类型肿瘤的病理诊断。
查看完整报道: https://go.hyper.ai/w4tsr
热门百科词条精选
1. 神经辐射场 NeRF
2. 分组查询注意力 GQA
3. 数据增强 Data Augmentation
4. 大规模多任务语言理解 MMLU
5. 长短期记忆 Long Short-Term Memory
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
一站式追踪人工智能学术顶会:https://go.hyper.ai/event
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
下周再见!
关于 HyperAI超神经 (hyper.ai)
HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
- 为 1300+ 公开数据集提供国内加速下载节点
- 收录 400+ 经典及流行在线教程
- 解读 100+ AI4Science 论文案例
- 支持 500+ 相关词条查询
- 托管国内首个完整的 Apache TVM 中文文档
访问官网开启学习之旅: