深度学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

深度学习

深度学习（英语：deep learning）是机器学习的分支，是一种以人工神经网络为架构，对数据进行表征学习的算法。

关注标签

关注数

11

内容数

2310

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

超神经HyperAI · 4月29日

入选ICLR 2025 Oral，清华AIR周浩团队提出蛋白质预训练新范式，解密蛋白质家族进化

清华大学 AIR GenSI 研究组联合清华大学药学院共同提出了一种用于蛋白质家族特异性生成建模的工具——ProfileBFN（即轮廓贝叶斯流网络）。...

0 阅读 1.1k
V · 4月29日

零训练成本优化 LLM： 11 种 LLM 权重合并策略原理与 MergeKit 实战配置

随着大语言模型的快速发展，如何在不消耗大量计算资源的情况下优化模型性能成为业界关注焦点。模型权重合并技术提供了一种零训练成本的...

0 阅读 1.1k
超神经HyperAI · 4月28日

开发迄今最大的遥感指令数据集，IBM研究院等提出专为地球观测数据设计的VLM，入选CVPR 2025

地球观测领域正经历着一场变革性的发展浪潮，其重要性与日俱增。从产业规模看，2024 年 5 月世界经济论坛报告显示，其潜在经济价值将从 ...

1 阅读 3.7k
V · 4月28日

NoProp：无需反向传播，基于去噪原理的非全局梯度传播神经网络训练，可大幅降低内存消耗

反向传播算法自四十年前问世以来一直作为深度学习的基石，然而仍然面临两项关键技术挑战：首先由于必须存储中间激活值用于梯度计算，导...

2 阅读 1.4k
超神经HyperAI · 4月27日

效率提升73倍！日本研究团队基于机器学习成功制备10种光驱动有机晶体

光驱动有机晶体 (Photo-actuated organic crystals) 在受到光照时能够发生形变，这种将外部刺激转换为机械运动的能力使其成为制备执行器...

2 阅读 855
V · 4月27日

GenPRM：思维链+代码验证，通过生成式推理的过程奖励让大模型推理准确率显著提升

过程奖励模型(PRMs)作为验证机制在提升大型语言模型(LLMs)性能方面展现出显著潜力。而当前 PRMs 框架面临三个核心技术挑战：过程监督和...

0 阅读 969
超神经HyperAI · 4月25日

最大化挖掘临床MRI数据价值，UCL团队提出MindGlide模型，实现多发性硬化症病变量化

多发性硬化症 (Multiple sclerosis, MS) 是一种以中枢神经系统白质炎性脱髓鞘病变为主要特点的慢性致残疾病，多以青壮年人群为目标，故...

2 阅读 1.1k
V · 4月25日

SmolVLM：资源受限环境下的高效多模态模型研究

SmolVLM 是专为资源受限设备设计的一系列小型高效多模态模型。尽管模型规模较小，但通过精心设计的架构和训练策略，SmolVLM 在图像和视...

2 阅读 1.3k
V · 4月24日

KG4MM：融合知识图谱与多模态数据预测药物相互作用

知识图谱（Knowledge Graph, KG）作为表示不同实体间复杂关系的有效工具，已得到广泛应用。通过将信息编码为节点（实体）和边（关系），...

1 阅读 1.4k
超神经HyperAI · 4月23日

30分钟内输出结果，新加坡国立大学/MIT等基于SVM构建微生物污染检测模型

细胞治疗产品 (CTP) 作为先进治疗药物 (ATMPs) 的重要组成部分，正为罕见病和疑难杂症患者带来希望。然而，其生产过程极易受到微生物的...

2 阅读 2.5k
V · 4月23日

CLIMB 自举框架：基于语义聚类的迭代数据混合优化及其在 LLM 预训练中的应用

尽管优化预训练数据混合对大型语言模型(LLM)的性能有显著影响，但确定最优数据配比仍然是一个亟待解决的挑战。为应对这一问题，英伟达提...

2 阅读 964
V · 4月22日

10 招立竿见影的 PyTorch 性能优化技巧，让模型训练速度翻倍

PyTorch 作为深度学习研究与工程领域的主流框架，拥有强大的性能潜力，但许多高级性能特性往往隐藏在文档深处，未被充分利用。本文基于...

0 阅读 867
V · 4月18日

2025年GitHub平台上的十大开源MCP服务器汇总分析

随着人工智能生态系统的迅速演进，模型与工具之间的无缝通信已成为技术发展的关键环节。在这一背景下，模型上下文协议（Model Context P...

12 阅读 2.2k
超神经HyperAI · 4月17日

上海交大团队发布一站式蛋白质工程设计平台VenusFactory，一键部署教程已上线

随着人工智能计算和数据驱动方法的快速发展，蛋白质工程正在迈向 AI 辅助设计阶段。研究人员比以往任何时候都更需要全面、高质量的蛋白...

1 阅读 2.7k
V · 4月17日

Crawl4AI：为大语言模型打造的开源网页数据采集工具

随着大型语言模型(LLMs)的快速发展，高质量数据供给已成为智能系统的关键基础架构。为使人工智能系统能够生成有实际价值的分析结果，它...

0 阅读 1.2k
V · 4月16日

Triton 入门教程：安装与编写和运行简单 Triton 内核

Triton 是一款开源的 GPU 编程语言与编译器，为 AI 和深度学习领域提供了高性能 GPU 代码的高效开发途径。本指南将全面阐述 Triton 的核...

1 阅读 1.3k
超神经HyperAI · 4月15日

在线教程丨开源代码推理模型 DeepCoder-14B-Preview 狂揽 3k stars

4 月 9 日凌晨，Agentica 团队携手 Together AI 联合开源了名为 DeepCoder-14B-Preview 的代码推理模型，这个仅需 14B 即可媲美 OpenAI ...

0 阅读 696
V · 4月15日

用离散标记重塑人体姿态：VQ-VAE 实现关键点组合关系编码

在人体姿态估计领域，传统方法通常将关键点作为基本处理单元，这些关键点在人体骨架结构上代表关节位置（如肘部、膝盖和头部）的空间坐...

1 阅读 1k
超神经HyperAI · 4月14日

酶动力学参数预测，瓶颈识别……中科院深圳先进技术研究院罗小舟分享AI在酶领域的创新应用

蛋白质，作为生命的基石，在生命活动中发挥着关键作用，其结构和功能的研究，对创新药物研发、合成生物学、酶制剂生产等领域，有着极其...

0 阅读 773
V · 4月14日

MCP 与 A2A 协议比较：人工智能系统互联与协作的技术基础架构

在人工智能领域的快速迭代发展中，两种协议已成为构建新一代 AI 系统的关键基础设施：模型上下文协议（Model Context Protocol，MCP）和...

1 阅读 1.2k

上一页
1
…
4
5
6
7
8
…
下一页

本月贡献榜

超神经HyperAI

贡献 85 声望

天罡智算杨旭颖

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息