导读:极术社区推出极术通讯,引入行业媒体和技术社区、咨询机构优质内容,定期分享产业技术趋势与市场应用热点。
芯方向
Arm Neoverse N1 核性能分析方法 - 使用硬件PMU事件进行性能分析
随着许多 Arm 硬件和软件合作伙伴开发应用程序并将其工作负载移植到基于 Arm 的云实例上,Arm Neoverse 生态系统正在快速发展。随着 Neoverse N1 系统的广泛可用,与传统系统相比,许多真实世界的工作负载显示出非常有竞争力的性能和显著的成本节省。一些最近的例子包括:H.264 视频编码、memcached、Elasticsearch、NGINX 等等。本文介绍了一种使用 Neoverse N1 CPU 上的性能监测单元(PMU)进行工作负载特性分析的方法,以找出和消除性能瓶颈。(来源:极术社区Arm CPU 构架专栏)
YOLO-NAS | YOLO新高度,引入NAS,出于YOLOv8而优于YOLOv8
受启发于YOLOv6、YOLOv7以及YOLOv8,DECI的研究人员构建了YOLO-NAS-S,YOLO-NAS-M,YOLO-NAS-L。YOLO-NAS达成目标检测任务新高度,取得了最佳的精度-延迟均衡。值得一提,YOLO-NAS与TensorRT推理引擎完全兼容,且支持INT8量化,达成前所未有的运行时性能。本文对YOLO-NAS模型进行了详细解读。(来源:极术社区AIWalker专栏)
随着云的兴起,计算变得高度分布式。工作负载可以在许多计算节点上运行,并且通常跨越多个数据中心。工作负载由代码和数据的组合组成,两者通常都是有价值和敏感的。数据中心通常由第三方管理,如云服务提供商(CSP),并且可能位于与工作负载所有者不同的法律管辖区。在云中托管日益敏感的工作负载的需求推动了机密计算的发展。Arm在2021年宣布了Realm Management Extension(RME)是Armv9-a架构的主要补充 Arm机密计算架构(Arm CCA),用于帮助实现支持机密计算的基于虚拟机监控程序的平台。本文简要概述了可以用来构建 支持机密计算的平台,其中包括Arm在Armv9-a架构中添加的最新功能的摘要,以及Arm支持的参考软件架构的详细信息。(来源:极术社区Arm软件开发者
专栏)
强化学习(Reinforcement Learning,RL)是机器学习领域的一个重要分支,它关注智能体如何通过与环境的交互来学习和优化策略,以实现长期回报的最大化。强化学习已经在许多领域取得了显著的成功。本文从最开始的 K 臂老虎机入手讲解了强化学习的基本原理,然后切入到 Q-learning 中学习如何使用 Q 表来进行强化学习,最后再借助神经网络将 Q 表替换成用函数来拟合计算 Q 值。(来源:极术社区腾讯技术工程专栏)
本文涵盖了从初学者到专家级别的FPGA 项目及IP,侧重点在领域的IP辅以工程或者仿真验证。所有 FPGA 项目都带有开源的源代码。(来源:极术社区FPGA 的逻辑专栏)
芯观察
随着近年来 AI 技术的兴起,视频监控、汽车、智能家居、移动设备及数据中心等对高清视频处理有了越来越高的要求。安谋科技全新视频处理器——“玲珑”V6/V8,针对主流市场的视频流媒体技术进行了大量投入,通过一系列智能权衡实现了极大优化,为所有合作伙伴提供灵活的组合和选择。LiveVideoStackCon 2022北京站邀请到了安谋科技多媒体产品经理董峰,为我们分享“玲珑”编解码融合架构助力视频多元化需求。(来源:极术社区LiveVideoStack专栏)
三大运营商都在积极地推广“算力网络”的相关技术概念落地,互联网公司有类似的概念叫“分布式云”。个人理解,两个概念的技术实现基本相同,不同点在于:算力网络站在基础计算环境的视角,着眼于算力资源的整合;分布式云从业务服务的视角,着眼于计算以何种形式提供。本文就来探讨一下宏观视角的算力网络的底层算力体系。(来源:极术社区软硬件融合专栏)
在汽车领域,分析或者介绍一个控制器,一般都从其最顶层需求(功能)入手。对自动驾驶域控而言,它的顶层需求是“实现一定的辅助驾驶功能”,一切都是为这个目标服务的。受制于成本,不同的域控能实现的功能自然是不同的,于是对辅助驾驶功能需要分级介绍;为了实现这些辅助驾驶功能,还需要有不同的传感器配置方案作为基础;基于不同的传感器配置,要选择与之相匹配的自动驾驶芯片,确保芯片算力能够实时处理传感器的海量数据;最后,不同的自动驾驶芯片进行各种排列组合,就形成了目前行业内琳琅满目的自动驾驶域控方案。本文根据以上逻辑主线来介绍域控制器。(来源:极术社区汽车电子与软件专栏)
CMOS 逻辑和存储器共同构成了半导体器件生产的绝大部分。本文考虑的内存类型是 DRAM 和非易失性内存 (NVM)。重点是商品、独立芯片,因为这些芯片往往会推动内存技术。然而,嵌入式存储芯片预计将遵循与商品存储芯片相同的趋势,通常会有一些时间滞后。对于 DRAM 和 NVM,都考虑了详细的技术要求和潜在的解决方案。本文对存储芯片以及发展路线进行了详细地分析。(来源:极术社区半导体行业观察专栏)
2023年中国所有的电动汽车国家补贴全部退出,车企需要承担补贴退坡的压力(纯电动车单车补贴减少约1万元,而插电式混合动力汽车单车补贴减少0.48万元)。在此背景下,虽然车企的降价策略有助于电动汽车进一步挑战燃油车市场,提高销量和市场份额。但这些措施可能对车企的利润和财务状况产生影响,特别是在2023年第一季度只有少数车企取得了较好的业绩。本文将对2023年过去的四个月的发展进行梳理,并对未来几个月的走势进行展望。(来源:极术社区芝能汽车电子设计专栏)
芯方向
Arm Neoverse N1 核性能分析方法 - 使用硬件PMU事件进行性能分析
随着许多 Arm 硬件和软件合作伙伴开发应用程序并将其工作负载移植到基于 Arm 的云实例上,Arm Neoverse 生态系统正在快速发展。随着 Neoverse N1 系统的广泛可用,与传统系统相比,许多真实世界的工作负载显示出非常有竞争力的性能和显著的成本节省。一些最近的例子包括:H.264 视频编码、memcached、Elasticsearch、NGINX 等等。本文介绍了一种使用 Neoverse N1 CPU 上的性能监测单元(PMU)进行工作负载特性分析的方法,以找出和消除性能瓶颈。(来源:极术社区Arm CPU 构架专栏)
YOLO-NAS | YOLO新高度,引入NAS,出于YOLOv8而优于YOLOv8
受启发于YOLOv6、YOLOv7以及YOLOv8,DECI的研究人员构建了YOLO-NAS-S,YOLO-NAS-M,YOLO-NAS-L。YOLO-NAS达成目标检测任务新高度,取得了最佳的精度-延迟均衡。值得一提,YOLO-NAS与TensorRT推理引擎完全兼容,且支持INT8量化,达成前所未有的运行时性能。本文对YOLO-NAS模型进行了详细解读。(来源:极术社区AIWalker专栏)
随着云的兴起,计算变得高度分布式。工作负载可以在许多计算节点上运行,并且通常跨越多个数据中心。工作负载由代码和数据的组合组成,两者通常都是有价值和敏感的。数据中心通常由第三方管理,如云服务提供商(CSP),并且可能位于与工作负载所有者不同的法律管辖区。在云中托管日益敏感的工作负载的需求推动了机密计算的发展。Arm在2021年宣布了Realm Management Extension(RME)是Armv9-a架构的主要补充 Arm机密计算架构(Arm CCA),用于帮助实现支持机密计算的基于虚拟机监控程序的平台。本文简要概述了可以用来构建 支持机密计算的平台,其中包括Arm在Armv9-a架构中添加的最新功能的摘要,以及Arm支持的参考软件架构的详细信息。(来源:极术社区Arm软件开发者专栏)
强化学习(Reinforcement Learning,RL)是机器学习领域的一个重要分支,它关注智能体如何通过与环境的交互来学习和优化策略,以实现长期回报的最大化。强化学习已经在许多领域取得了显著的成功。本文从最开始的 K 臂老虎机入手讲解了强化学习的基本原理,然后切入到 Q-learning 中学习如何使用 Q 表来进行强化学习,最后再借助神经网络将 Q 表替换成用函数来拟合计算 Q 值。(来源:极术社区腾讯技术工程专栏)
本文涵盖了从初学者到专家级别的FPGA 项目及IP,侧重点在领域的IP辅以工程或者仿真验证。所有 FPGA 项目都带有开源的源代码。(来源:极术社区FPGA 的逻辑专栏)
芯观察
随着近年来 AI 技术的兴起,视频监控、汽车、智能家居、移动设备及数据中心等对高清视频处理有了越来越高的要求。安谋科技全新视频处理器——“玲珑”V6/V8,针对主流市场的视频流媒体技术进行了大量投入,通过一系列智能权衡实现了极大优化,为所有合作伙伴提供灵活的组合和选择。LiveVideoStackCon 2022北京站邀请到了安谋科技多媒体产品经理董峰,为我们分享“玲珑”编解码融合架构助力视频多元化需求。(来源:极术社区LiveVideoStack专栏)
三大运营商都在积极地推广“算力网络”的相关技术概念落地,互联网公司有类似的概念叫“分布式云”。个人理解,两个概念的技术实现基本相同,不同点在于:算力网络站在基础计算环境的视角,着眼于算力资源的整合;分布式云从业务服务的视角,着眼于计算以何种形式提供。本文就来探讨一下宏观视角的算力网络的底层算力体系。(来源:极术社区软硬件融合专栏)
在汽车领域,分析或者介绍一个控制器,一般都从其最顶层需求(功能)入手。对自动驾驶域控而言,它的顶层需求是“实现一定的辅助驾驶功能”,一切都是为这个目标服务的。受制于成本,不同的域控能实现的功能自然是不同的,于是对辅助驾驶功能需要分级介绍;为了实现这些辅助驾驶功能,还需要有不同的传感器配置方案作为基础;基于不同的传感器配置,要选择与之相匹配的自动驾驶芯片,确保芯片算力能够实时处理传感器的海量数据;最后,不同的自动驾驶芯片进行各种排列组合,就形成了目前行业内琳琅满目的自动驾驶域控方案。本文根据以上逻辑主线来介绍域控制器。(来源:极术社区汽车电子与软件专栏)
CMOS 逻辑和存储器共同构成了半导体器件生产的绝大部分。本文考虑的内存类型是 DRAM 和非易失性内存 (NVM)。重点是商品、独立芯片,因为这些芯片往往会推动内存技术。然而,嵌入式存储芯片预计将遵循与商品存储芯片相同的趋势,通常会有一些时间滞后。对于 DRAM 和 NVM,都考虑了详细的技术要求和潜在的解决方案。本文对存储芯片以及发展路线进行了详细地分析。(来源:极术社区半导体行业观察专栏)
2023年中国所有的电动汽车国家补贴全部退出,车企需要承担补贴退坡的压力(纯电动车单车补贴减少约1万元,而插电式混合动力汽车单车补贴减少0.48万元)。在此背景下,虽然车企的降价策略有助于电动汽车进一步挑战燃油车市场,提高销量和市场份额。但这些措施可能对车企的利润和财务状况产生影响,特别是在2023年第一季度只有少数车企取得了较好的业绩。本文将对2023年过去的四个月的发展进行梳理,并对未来几个月的走势进行展望。(来源:极术社区芝能汽车电子设计专栏)
相关阅读
更多内容可关注极术通讯专栏