强化学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

强化学习

强化学习（英语：Reinforcement learning，简称 RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。

关注标签

关注数

3

内容数

481

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

超神经HyperAI · 8月4日

登Nature子刊，基于基因测序和机器学习的废水流行病学评估，病毒检出时间最高提前4周

在过去的数年中，全球公共卫生安全面临严峻挑战。尤其自新冠疫情爆发以来，其病原体——严重急性呼吸综合征冠状病毒 2 型（SARS-CoV-2）持...

1 阅读 2.1k
超神经HyperAI · 7月22日

数据降噪/生物信号强化/缓解 dropout，SUICA 实现空间转录组切片中任一位置基因表达的预测

东京大学郑银强老师组，麦吉尔大学丁俊老师组共同提出了一种针对空间转录组数据建模的方法 SUICA 。 SUICA 是一个基于隐式神经表征（imp...

0 阅读 1.5k
超神经HyperAI · 7月21日

字节跳动郑思泽详解 Triton-distributed 框架，实现大模型高效分布式通信与计算融合

2025 年，由 HyperAI 超神经主办的 Meet AI Complier 技术沙龙已经行至第 7 期，在社区小伙伴和多位行业专家的支持下，我们在北京、上海...

0 阅读 1.3k
超神经HyperAI · 7月17日

从架构特性到生态建设，沐曦董兆华深度剖析国产 GPU 上的 TVM 应用实践

7 月 5 日，由 HyperAI 超神经主办的 Meet AI Compiler 技术沙龙第 7 期圆满落幕。从 GPU 架构的底层创新，到跨硬件编译生态的顶层设计...

0 阅读 1.4k
超神经HyperAI · 7月16日

在线教程 | 150种专业工具/59个数据库，Biomni在8类真实研究任务中超越专家级效率

现代生物医学研究正陷入「数据爆炸与效率瓶颈」的矛盾中。一方面，基因测序、单细胞分析等技术的发展，催生了海量多模态数据——从基因组...

0 阅读 1.2k
超神经HyperAI · 7月15日

同时处理蛋白质主链和侧链信息，斯坦福等基于消息传递神经网络实现全原子结构建模

蛋白质侧链构象（Protein sidechain conformation），是指蛋白质中氨基酸残基的侧链在三维空间中的具体空间排布方式。研究蛋白质侧链构...

1 阅读 858
超神经HyperAI · 7月11日

在线教程丨FLUX.1 Kontext可实现图像编辑/风格迁移/文本编辑/角色一致性编辑

2025 年 5 月底，沉寂已久的 Black Forest Labs 发布了新模型 FLUX.1 Kontext，并于近日宣布开源。其基于流匹配架构，支持上下文内图像...

0 阅读 716
超神经HyperAI · 7月9日

OmniGen2 多模态推理引领图像生成新范式；TreeOfLife-200M 解锁物种认知新维度

近年来，生成式 AI 技术在图像领域取得显著突破，如 Stable Diffusion 系列、 DALL-E3 等模型通过扩散模型实现了高质量文本到图像生成。...

0 阅读 1.6k
超神经HyperAI · 7月8日

专治AI审稿？论文暗藏好评提示词，谢赛宁呼吁关注AI时代科研伦理的演变

这厢，AI 审稿人上岗，席卷多类期刊甚至顶会；那厢，作者开始在论文中插入隐藏指令，引导 AI 给好评。所谓「上有政策下有对策」，这究竟...

0 阅读 1.4k
超神经HyperAI · 7月4日

CASP或将停办！蛋白质结构预测风向标大赛因NIH断供而前途未卜

一项名为「蛋白质结构预测关键评估（Critical Assessment of protein Structure Prediction）」的竞赛面临停办风险——正是那个 AlphaFold...

0 阅读 1.5k
超神经HyperAI · 7月2日

内含教程丨医疗VLM新突破！HealthGPT对复杂MRI模态理解准确率达99.7%

现代医学诊断与研究高度依赖医学影像的解读与生成，从 X 光片的病灶识别到 MRI 向 CT 的图像转换，每一个环节都对 AI 系统的多模态处理...

0 阅读 2k
超神经HyperAI · 7月1日

蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务

蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设...

1 阅读 1.2k
超神经HyperAI · 6月30日

ICML 2025 丨慕尼黑工业大学等基于 SD3 开发卫星图像生成方法，构建当前最大规模遥感数据集

卫星图像是通过卫星遥感技术获取的地球表面影像，它通过建立「太空视角」将地球信息数字化，实现了大范围检测、动态追踪和数据支撑。在...

1 阅读 1.3k
V · 6月27日

小模型当老师效果更好：借助RLTs方法7B参数击败671B，训练成本暴降99%

Sakana AI提出的强化学习教师模型（Reinforcement-Learned Teachers, RLTs）代表了一种全新的训练范式。该方法颠覆了传统强化学习需要模...

1 阅读 334
超神经HyperAI · 6月27日

在线教程丨北大施柏鑫团队联合贝式计算提出视频实例重绘方法 VIRES，多项性能指标达 SOTA

众所周知，视频编辑难度极高，若想要调整或替换主体，变换场景、色彩或是移除一个物体，往往意味着无数帧的手动标注、遮罩绘制和精细调...

1 阅读 1k
超神经HyperAI · 6月26日

DeepMind发布AlphaGenome，1秒内完成所有模态和细胞类型的变异效应预测

谷歌 DeepMind 的 Alpha 系列再添新成员——AlphaGenome，其能够更全面、准确地预测人类 DNA 序列中单个变异或突变，如何影响一系列调控基...

1 阅读 1.1k
V · 6月26日

融合贝叶斯生存模型与Transformer注意力机制的电商客户重参与策略优化

本文提出了一个集成三种核心技术的下一代智能优惠券分发系统：基于贝叶斯生存模型的重购概率预测、采用注意力机制的Transformer利润预测...

0 阅读 2.7k
超神经HyperAI · 6月25日

从全心脏模型到基于 LLM 的疾病网络分析，清华长庚医院李栋从数据视角剖析医疗大模型发展趋势

随着人工智能技术的不断深入成熟，AI 也赋予了医疗领域一场深刻的变革——通过整合多源数据与智能算法，为医疗行业的效率提升、精准诊断都...

0 阅读 863
超神经HyperAI · 6月24日

继 Evo 2 之后，Arc Institute 发布首个虚拟细胞模型 STATE

众所周知，人体由不同类型的细胞组成——免疫细胞在感染发生时可引发炎症反应以抵御病原体；干细胞具有分化潜能，可生成多种组织类型；而...

0 阅读 752
超神经HyperAI · 6月23日

入选ICML 2025！哈佛医学院等推出全球首个HIE领域临床思维图谱模型

在人工智能技术突飞猛进的当下，大型视觉-语言模型（LVLMs）正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域，这类模...

0 阅读 711

上一页
1
2
3
4
5
…
下一页

本月贡献榜

超神经HyperAI

贡献 95 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息