导读:极术社区与E-learning平台联合推出极术通讯,引入行业媒体和技术社区、咨询机构优质内容,定期分享产业技术趋势与市场
芯方向
· 【WarpDrive】GPU加速RL:一块V100运行上千个智能体、数千个环境,这个「曲率引擎」框架实现RL百倍提速
在强化学习研究中,一个实验就要跑数天或数周,有没有更快的方法?近日,来自 SalesForce 的研究者提出了一种名为 WarpDrive(曲率引擎)的开源框架,它可以在一个 V100 GPU 上并行运行、训练数千个强化学习环境和上千个智能体。实验结果表明,与 CPU+GPU 的 RL 实现相比,WarpDrive 靠一个 GPU 实现的 RL 要快几个数量级。(来源:极术社区深度强化学习专栏)
· 详细解读TPH-YOLOv5 | 让目标检测任务中的小目标无处遁形
本文在YOLOv5的基础上加入了一些新的技术,比如ViT、CBAM和一些Tricks(数据增广、多尺度测试等),最终命名为TPH-YOLOv5的目标检测器,比较适合无人机小目标的检测和应用。(来源:极术社区嵌入式AI专栏)
旷视开源深度学习框架旷视天元 MegEngine 近日开源了 MegFlow 流式计算框架。MegFlow 是面向计算机视觉应用的流式计算框架,提供了一套可快速完成 AI 应用部署的视觉解析服务方案。AI 应用开发者可以基于 MegFlow 提供的图像和视频解析服务,最快 15 分钟即可完成客制化所需功能,例如发票扫描、明火检测等。此外,MegFlow 还内置了开箱即用的 AI 应用,如宠物围栏检测和电瓶车检测。(来源:极术社区旷视研究院专栏)
· NVMe-oF以太网SSD:三星说第一家,东芝/Marvell两年前就有了?
在ODCC 2021开放数据中心峰会上,三星展出了Ethernet(以太网)SSD,这可能是它的实物第一次公开亮相。三星宣称自己是“世界第一个原生以太网SSD”。以太网链路是双端口25G(向下兼容10G),我理解这个速率比较匹配U.2双端口PCIe 3.0(x2)NVMe SSD;如果想达到PCIe 4.0双端口NVMe的性能,用将来的50GbE IP合适。(来源:极术社区企业存储技术专栏)
芯观察
Arm通过与汽车供应链领先企业展开协作,推出新的软件架构和参考实现——面向嵌入式边缘的可扩展开放架构(Scalable Open Architecture for Embedded Edge, SOAFEE),以及两款新的参考硬件平台,旨在加速实现汽车产业软件定义的未来。(来源:极术社区Arm技术博客专栏)
Arm正在努力为 Arm Mali 产品线引入光线追踪能力 -- Mali 作为世界范围内最受欢迎的移动 GPU,迄今已被游戏玩家手中数十亿部移动设备所采用。这篇文章中将阐述Arm如何与合作伙伴 腾讯 和 MediaTek 共同开发移动光线追踪内容,从而帮助开发者更好地探索光线追踪可为移动游戏带来的益处。(来源:极术社区全面计算Total Compute专栏)
前一阵子,IBM商业价值研究院发布了《我们所熟知的通信服务时代已经结束》洞察报告,5G 和边缘计算将如何帮助界定谁能在蓬勃发展的数字经济中获胜。本文同时附PDF文件下载。(来源:极术社区边缘计算专栏)
软件和硬件,既相互依存又需要某种程度上的相互独立。通过软件和硬件之间的接口把两者连接在一起。软硬件接口,有很多含义:比如指令集是CPU软件和硬件之间的接口;比如一些硬件模块(包括IO接口模块、GPU、各种加速引擎等)暴露出来的可读写寄存器,则为控制接口;再比如,CPU和GPU或其他硬件模块之间通过DMA进行数据交互的(软硬件间的)数据传输接口。软硬件接口,是个非常庞大的命题。本文是《软硬件融合》图书内容的节选,聚焦在软件和硬件之间的数据交互接口。(来源:极术社区软硬件融合专栏)
2018年 到 2019年 是 AI、NPU 的机会,2020年是 GPGPU 的窗口,2021年 是 DPU 的天时,我个人预计 2022 年将是中国 CPU 的启动之年,无论是 ARM 派的 CPU,还是 RISC-V 派的 CPU,都有机会各领风骚。(来源:极术社区Winnie看世界专栏)
相关阅读