强化学习下最新的文章 - 极术社区 - 连接开发者与智能计算生态

强化学习

强化学习（英语：Reinforcement learning，简称 RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。

关注标签

关注数

3

内容数

481

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

AI学习者 · 2020年08月25日

最前沿：深度强化学习的强者之路

近几年来，以DeepMind和OpenAI为首的AI明星公司基于深度强化学习创造了前所未有的突破，包括AlphaGo，AlphaStar，OpenAI Five, OpenAI R...

2 阅读 5.8k
科创人 · 2020年08月03日

【科创人独家】华旦天使张洁：风口是创业者的造物，投资本质是件农活

在投资界活跃着一批乘风破浪的姐姐们，江湖人敬称一声“花姐”的华旦天使投资创始人张洁是个中代表：言谈飒爽，举止利落，洞察力十足。技...

0 阅读 1.9k
DeepRL · 2020年07月17日

《深度强化学习》面试题汇总

不知不觉中求职季已经进行了很长时间，算法岗位的招聘可以说是非常火爆，但目前强化学习的面试题目相对来说比较少，本文整理了大约50多...

7 阅读 4k
Rocky X · 2020年07月03日

如何将深度学习方法用于SLAM等三维视觉领域？牛津大学发布最全面综述

作者：SFXiang首发：AI算法修炼营这是目前为止最全面、最科学的有关深度学习SLAM方法的总结。论文地址： [链接]代码地址： [链接]基于深...

7 阅读 3.3k
DeepRL · 2020年07月02日

Advanced Topics in Deep Reinforcement learning 开课啦

【高级强化学习课程+项目】Advanced Topics in Deep Reinforcement learning开课啦！

5 阅读 2.8k
DeepRL · 2020年06月30日

基于模块化和快速原型设计的Huskarl深度强化学习框架

Huskarl是一种基于TensorFlow 2.0构建的深度强化学习的框架，其专注于模块化和快速原型设计。设计中尽可能使用了tf.keras API以实现简洁...

2 阅读 2.4k
DeepRL · 2020年06月28日

【Seaborn绘图】深度强化学习实验中的paper绘图方法

强化学习实验中的绘图技巧-使用seaborn绘制paper中的图片，使用seaborn绘制折线图时参数数据可以传递ndarray或者pandas,不同的源数据对...

2 阅读 4.5k
DeepRL · 2020年06月16日

深度强化学习系列之--OpenAI-Baselines的使用方法

OpenAI，由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后，决定共同创建OpenAI，希望能够...

5 阅读 3.9k
DeepRL · 2020年06月08日

ICML-2020 || 126篇"强化学习"论文完整汇总

ICML 2020放榜了。入选论文创新高，共有1088篇论文突出重围。然而，接收率却是一年比一年低，这次仅为21.8%（去年为22.6%，前年为24.9%...

3 阅读 5.1k
DeepRL · 2020年06月05日

Google发布"强化学习"框架"SEED RL"

报道：深度强化学习实验室资料来源：Google Research 编辑：DeepRL本框架是Google发布于ICLR2020顶会上，这两天发布于Google Blog上论...

4 阅读 3.5k
DeepRL · 2020年06月01日

强化学习的三种范例

许多研究人员认为，基于模型的强化学习（MBRL）比无模型的强化学习（MFRL）具有更高的样本效率。但是，从根本上讲，这种说法是错误的。...

2 阅读 2k
DeepRL · 2020年05月28日

基于强化学习的自动交易系统研究与发展综述

近年来，强化学习在电子游戏、棋类、决策控制领域取得了巨大进展，也带动着金融交易系统的迅速发展，金融交易问题已经成为强化学习领域...

3 阅读 2.8k
DeepRL · 2020年05月14日

前沿技术 || UC Berkeley开源RAD来改进强化学习算法

【导读】从视觉观察中学习是强化学习（RL）中的一个基本但具有挑战性的问题。尽管算法与卷积神经网络相结合已被证明是成功的秘诀，但当...

4 阅读 2.5k
腾讯技术工程 · 2020年05月14日

腾讯Elasticsearch海量规模背后的内核优化剖析

来源：腾讯技术工程微信号作者：黄华，腾讯 TEG 云架构平台部研发工程Elasticsearch 在腾讯内部广泛应用于日志实时分析、结构化数据分...

1 阅读 2.5k
腾讯技术工程 · 2020年05月09日

2 周流量激增百倍的腾讯课堂后台扩容和性能优化实战

来源：腾讯技术工程微信号作者：andyawang，腾讯 CSIG 后台开发工程师疫情期间，学校网课需求激增，腾讯课堂 2 天上线极速版，2 周内支...

1 阅读 2k
InfoQ · 2020年05月09日

AGI=终结者天网？别怕，现在的AI连猫狗都可能认错

原文最初发布在 SICARA 博客，经原作者 Etienne Bennequin 授权，InfoQ 中文站翻译并分享。

3 阅读 2.5k
一路奔跑 · 2020年04月24日

快速配置xdebug+phpstrom实现断点调试

简单说一下断点调试的使用场景当业务代码很复杂，想要知道每一步的变量及对应的值。学习一个新框架，熟悉框架的执行流程不确定代码会运...

0 阅读 1.9k
深度学习与先进智能决策 · 2020年04月15日

【NIPS 2017】基于深度强化学习的想象力增强智能体

论文题目：Imagination-Augmented Agents for Deep Reinforcement Learning

2 阅读 2.2k
深度学习与先进智能决策 · 2020年04月15日

伯克利，斯坦福，宾大联合发表：从观察和交互中学习预测模型

论文题目：Learning Predictive Models From Observation and Interaction

2 阅读 1.9k
深度学习与先进智能决策 · 2020年04月15日

【ICLR 2018】模型集成的TRPO算法【附代码】

论文题目：model-ensemble trust-region policy optimization

0 阅读 2.1k

上一页
1
…
16
17
18
19
20
下一页

本月贡献榜

超神经HyperAI

贡献 95 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息