AlphaFold2 自发布以来就在 AI4S 领域引起轰动,更拿下了今年的诺贝尔奖。AlphaFold3 作为其升级版,不仅能够预测蛋白质的结构,还能够预测蛋白质与其他各种生物分子相互作用的结构,包括配体(小分子)、核酸(DNA 和 RNA)如何聚集在一起并相互作用。
就在上个月,Google DeepMind 开源了 AlphaFold3 模型权重及其依赖数据库供学术研究。HyperAl超神经现已上线 AlphaFold3 依赖数据库,欢迎大家在阅读论文的同时体验 AlphaFold3 带来的技术突破!
在线使用:https://go.hyper.ai/wVItz
12 月 9 日-12 月 13 日,hyper.ai 官网更新速览:
- 优质公共数据集:10 个
- 优质教程精选:3 个
- 社区文章精选:5 篇
- 热门百科词条:5 条
- 1 月截稿顶会:9 个
访问官网:hyper.ai
公共数据集精选
该数据库包含 AlphaFold 3 依赖的大量蛋白质和 RNA 数据库,包括 BFD small 、 MGnify、 PDB、 PDB seqres、 UniProt、 UniRef90、 NT、 RFam 和 RNACentral 这 9 个数据库。
直接使用:https://go.hyper.ai/wVItz
2. Mol-Instructions 大规模生物分子指令数据集
该数据集包含 3 种指令:分子导向指令、蛋白质导向指令和生物分子文本指令,旨在提供丰富的指令数据,以增强大语言模型在生物分子领域的理解和预测能力。
直接使用:https://go.hyper.ai/Gut1y
数据集示例
CoSQL 包含 3k+ 组对话,共计 10k+ 个标注过的 SQL 查询,内容横跨 200 个数据库,且不同组数据所用到的数据库没有交集,以考察模型的鲁棒性。
直接使用:https://go.hyper.ai/9Blzy
数据集示例
该数据集包含两个部分:WikiHop 和 MedHop,旨在构建能够执行多跳推理的阅读理解方法,即在不同文档中分散的事实需要通过多个步骤的推理来得出新的事实。
直接使用:https://go.hyper.ai/u1qRw
MedHop 数据集示例
该数据集包含了约 700 项中医药古籍文本,涵盖了从先秦至清末民国的历代医药典籍。这些文献不仅包括了医学理论、方剂学、药物学等内容,还包含了丰富的临床案例和医学百科知识。
直接使用:https://go.hyper.ai/8Vh6A
该数据集是一个专门针对医疗健康领域研究和应用的高质量数据资源库,经过严格的筛选和清洗流程,确保了数据的准确性和可靠性。它广泛覆盖了医疗健康领域的多种数据类型,包括病历记录、医学文献和患者反馈等,为研究人员和开发者提供了一个全面的视角来探索和创新。
直接使用:https://go.hyper.ai/G9qn2
该数据集包含 3 个基础自然语言处理 (NLP) 数据集和 5 个高级能力专项数据集,涵盖了代码生成、知识理解、数学推理、逻辑推理和指令跟随等任务。
直接使用:https://go.hyper.ai/qbzhv
8. ShenNong TCM Dataset 神农中医药数据集
该数据集包含超 11 万个的指令数据,这些数据通过以实体为中心的自指令方法 (entity-centric self-instruct) 生成,围绕中医药领域的核心实体和不同意图场景,不仅能够提升模型在中医药相关问题的回答能力,还能辅助中医诊断,提供个性化的医疗建议。
直接使用:https://go.hyper.ai/Okruv
该数据集包含了 1k 个源自 StackOverflow 的实际数据科学问题,覆盖了 Python 中 7 个广泛使用的数据科学库,如 NumPy 、 Pandas 、 TensorFlow 等。
直接使用:https://go.hyper.ai/AL4h0
10. IndustryCorpus2-tourism-geography 旅游地理数据集
本数据集是智源行业数据集 IndustryCorpus2 的旅游地理数据集子集,广泛覆盖了旅游地理领域的多种数据类型,包括景点介绍、旅行攻略、游客评论和地理信息等,为自然语言处理、机器学习、数据挖掘以及旅游推荐系统等多种研究和应用领域提供了丰富的应用场景。
直接使用:https://go.hyper.ai/FIAM9
公共教程精选
Allegro 具备将基础文本输入转化为高清晰度视频内容的能力,具体表现为 720p 分辨率、每秒 15 帧的流畅度以及最长 6 秒的视频长度。 该模型在视频合成领域内展现出卓越的性能,在质量和时间连贯性方面均表现优异。
该教程为模型推理教程,由于模型生成视频耗时较长,本教程可生成 5 秒视频效果。
在线运行:https://go.hyper.ai/MgUVZ
效果示例
IC-Light 全称为 Imposing Consistent Light,旨在通过机器学习模型实现图像重新照明的项目。该教程为 IC-Light v2 升级版,相比于原版 IC-Light,该版本是基于 Flux 模型训练的,这使得它能够更准确地识别图像的光照色调特征,实现更细致、逼真的融合效果。
进入下方链接,按照教程指引即可控制图像中的光照效果。
在线运行:https://go.hyper.ai/hg0cM
效果示例
Hunyuan3D 是 3D 生成扩散模型模型,包括一个轻量版和一个标准版,均支持从文本和图像输入生成高质量的 3D 资产。经过定性和定量的多维度评估,Hunyuan3D-1.0 在几何细节、纹理细节、纹理-几何一致性、 3D 合理性、指令遵循等方面的表现都非常出色。
本教程是 Hunyuan3D 轻量版,点击下方链接,按照教程指引即可体验 3D 模型生成。
在线运行:https://go.hyper.ai/Rsrno
效果示例
社区文章精选
1. AI 教父 Hinton 坐镇,材料初创公司 CuspAI 成为最值得关注的英国初创公司之一
作为一家初创公司,CuspAI 实力不容小觑。其种子轮融资高达 3 千万美元,成为该年欧洲规模最大的种子轮融资之一。此外,机器学习大牛 Max Welling 是公司联合创始人之一,而诺贝尔奖和图灵奖双料得主 Geoffrey Hinton 则是其公司的董事会顾问。本文是对 CuspAI 的详细介绍。
查看完整报道:https://go.hyper.ai/3fQFG
2. 破解时间序列预测的「黑盒」问题!华中科技大学提出 CGS-Mask,揭秘患者存活率关键指标
随着 AI 技术在我们日常生活中的广泛应用,模型的「可解释性」逐渐成为一个亟待解决的问题。在时间序列预测任务上,这一问题尤为突出。为了让时间序列预测成为一个可以「看得见」的过程,华中科技大学陆枫团队联合悉尼大学 Zomaya 院士团队、同济医院,提出了一种新的方法——CGS-Mask,通过将时间序列预测与可解释性结合,该方法既能提高模型预测精度,又能使预测结果更加直观和可解释。本文是对论文的详细解读与分享。
查看完整报道:https://go.hyper.ai/TFEsd
3. 抢先体验 Demo!基因组基础模型 Evo 登 Science 封面,实现从分子到基因组尺度的预测与生成
斯坦福大学联合美国 Arc 研究所的研究团队提出了一种基因组基础模型 Evo ,以封面文章的形式登上 Science 。其能够在 DNA、RNA 和蛋白质的多模态任务中实现零样本预测和高精度生成。HyperAI超神经教程版块现已上线「Evo:从分子到基因组规模的预测和生成」,一键克隆即可快速体验!
查看完整报道:https://go.hyper.ai/5WPGm
4. AI 教父辛顿出生天才家庭,却是辍学惯犯,年过七旬接连斩获图灵奖与诺奖
AI 教父辛顿出生天才家庭,却是辍学惯犯;初创公司只有 3 人,却被谷歌斥资 4,400 万美元收购;花费小半个世纪开发神经网络,却直言后悔·····是什么样的人生经历造就了如今的他?本文是对辛顿的深度报道。
查看完整报道:https://go.hyper.ai/EHWs6
5. 首个 vLLM 中文文档上线!最新版本吞吐量再提高 2.7 倍,延迟减少 5 倍,让大语言模型推理更快速!
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费。最新版本 v0.6.4 引入了多步调度和异步输出处理,进一步优化了 GPU 的利用率并提高了处理效率。为了帮助国内开发者更加便捷地获悉 vLLM 的版本更新及前沿动态,HyperAI超神经社区完成了 vLLM 中文文档本土化。
查看vLLM 中文文档:https://vllm.hyper.ai/
热门百科词条精选
1. 梅尔倒谱 MFCCs
2. 倒数排序融合 RRF
3. 掩码语言建模 MLM
4. 帕累托前沿 Pareto Front
5. 数据增强 Data Augmentation
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
一站式追踪人工智能学术顶会:https://go.hyper.ai/event
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
下周再见!