啥都吃的豆芽 头像

啥都吃的豆芽

3095 声望
他还没有填写个人简介
关注了
1
粉丝数
45
最新动态
  • 发布了文章 ·
    倚天710性能监控 —— PCIe PMU子系统

    《倚天710性能监控 —— CMN PMU概述》、《倚天710性能监控 —— DDR PMU子系统》等文章我们介绍了倚天710 CMN PMU子系统和DDR PMU子系统,本文介绍倚天PCIe PMU子系统。

    摘要图
  • 发布了文章 ·
    倚天710性能监控 —— DDR PMU子系统

    文章《倚天710性能监控 —— CMN Flit Traffic Trace with Watchpoint Event》我们介绍了如何利用倚天710 CMN的PMU,统计总线的跨Die带宽和跨Socket带宽。本文介绍如何利用倚天710的DDR子系统的PMU(DDR Sub-System Performance Monitoring Unit),统计DDR带宽。

    摘要图
  • 发布了文章 ·
    倚天710性能监控——CMN互联带宽监测的PMU事件

    CMN是倚天710的总线互联,所有的Filt Traffic都会经过CMN。通过CMN,我们可以统计Die to Die (D2D),以及Socket to Socket (S2S) 之间的互连带宽。根据《倚天710性能监控 —— CMN PMU概述》我们知道,CMN中不同Node的功能不同,而负责D2D和S2S流量的,是CCG。

    摘要图
  • 发布了文章 ·
    倚天710性能追踪——CMN Wathpoint事件

    文章《倚天710性能监控 —— CMN PMU概述》我们介绍了如果使用CMN的PMU事件,统计带宽,但是带宽统计到的是包含了Request,Response,Snoop和Data,本文介绍如何使用watchpoint事件,过滤统计Data,并验证此方法的准确性。

    摘要图
  • 发布了文章 ·
    倚天710性能监控 —— CMN PMU概述

    Arm Neoverse CMN-700(Coherent Mesh Network )是一种高性能、低延迟的互连,旨在满足未来广泛市场和使用案例中基础设施的需求。Neoverse CMN-700 IP可针对以下方面进行优化:

    摘要图
  • 发布了文章 ·
    倚天710性能监控 —— 如何使用perf arm-SPE检测cacheline竞争

    Statistical Profiling Extension 是 ARMv8.2 中的可选功能。本文将描述它的工作原理及优势。并介绍如何使用SPE特性检测cacheline竞争,以此优化代码,提高程序性能。

    摘要图
  • 发布了文章 ·
    倚天710性能监控 —— 自顶向下的CPU架构性能瓶颈分析方法-Topdown

    目前的 CPU 越来越复杂,应用了许多方法使得 CPU 跑得越来越快,也使得 CPU 越来越难以被分析。普通的用户、软件开发人员,很少有精力去弄懂整个 CPU 架构,去了解每一个 CPU 模块。若有一种分析方法,可以帮助用户快速了解定位当前应用在 CPU 上的性能瓶颈,用户便可以有针对性地修改自己的程序,以充分利用当前的硬件...

    摘要图
  • 发布了文章 ·
    倚天710性能监控 —— 导读

    在过去的几十年里,计算系统的复杂性大大增加。分层缓存子系统(Hierarchical cache subsystems)、非统一内存(non-uniform memory)、同步多线程(simultaneous multithreading)、乱序执行(out-of-order execution)、推测执行(speculative execution)等对现代处理器的性能和计算能力有着巨大的影响。

    摘要图
  • 发布了文章 ·
    2022年数据中心CPU市场总结:AMD增长 62%,ARM处理器市场首次超过10 亿美元

    根据 Counterpoint半导体服务公司的最新研究,2022 年全球数据中心 CPU 市场收入同比下降 4.4% 。宏观经济逆风和能源成本增加影响了这一年数据中心 CPU 的销售。此外,从架构的角度来看,在服务器中为工作负载添加加速器限制了对服务器额外 CPU 的需求。

    摘要图
  • 发布了文章 ·
    AVH 技术干货 | 如何应对 IoT 领域 CI/CD 测试挑战?

    本期小编将带大家回顾极狐 GitLab 大讲坛之“极狐 GitLab CI/CD 和 MLOps 在 IoT 开发中的实践”课程。

    摘要图
  • 发布了文章 ·
    AVH 动手实践 (二) | 在 Arm 虚拟硬件上部署 PP-OCR 模型

    经典的深度学习工程是从确认任务目标开始的,我们首先来简单地介绍一下 OCR 中的文本识别任务以及本期部署实战课程中我们所使用的工具和平台。

    摘要图
  • 关注了专栏 ·
    图标
    Arm虚拟硬件

    Arm虚拟硬件相关技术干货,欢迎关注

  • 发布了文章 ·
    AVH 动手实践 (一) | 在 Arm 虚拟硬件上部署 PaddlePaddle 模型

    简要介绍在物联网时代下,深度学习应用在工业化落地过程中所面临的种种挑战,并详细分析 AVH 如何与 PaddlePaddle 相结合激发更高效的 MLOps 工作流,从而加速边缘侧机器学习应用的开发。

    摘要图
  • 发布了文章 ·
    新纪录!阿里云磐久服务器M系列刷新SPEC CPU 2017 最好成绩

    近日,SPEC官网公布最新一期的SPEC CPU 2017测试结果。阿里云磐久服务器M系列在SPECrate®2017 Integer base基准测试中取得510分,刷新了单路服务器在该项测试中的最好成绩。

    摘要图
  • 赞了文章 ·
    AI 换脸术「Deepfakes」8年进化史

    AI 伪造图像与视频,,即 Deepfake,在近年迎来一波发展高潮。在本文中,我们将深入探究这段历史,并回顾期间的一个个重要里程碑。

    摘要图
  • 关注了专栏 ·
    图标
    IC设计

    主要交流IC以及SoC设计流程相关的技术和知识

  • 关注了专栏 ·
    图标
    脑极体

    写让你脑洞大开且能看懂的人工智能、流媒体、海外科技

  • 关注了专栏 ·
    图标
    半导体行业观察

    最有深度的半导体新媒体,实讯、专业、原创、深度,50万半导体精英关注。专注观察全球半导体最新资讯、技术前沿、发展趋势。

  • 发布了文章 ·
    干货:Arm架构代码移植实战分享

    经历过2个项目的业务代码从X86服务器迁移到aarch64泰山服务器上,以前没有相关经验摸索了好久,踩了很多坑,现在迁移工作也差不多收尾了,Taishan服务器上跑比X86的溜多了。写了一篇代码迁移经验总结,欢迎大家参考。

    摘要图
  • 发布了文章 ·
    AWS Graviton2 上的 Memcached 性能基准测试显示超过 50% 的性价比提升

    正如AWS re:Invent 2020中所强调的那样,许多客户正在获得使用 Arm Neoverse 支持的 AWS Graviton2 处理器的性价比优势。与基于 x86 的 Amazon EC2 实例相比,Amazon EC2 M6g、C6g、R6g 和 C6gn 实例的性价比最高可提高 40%。

    摘要图
认证与成就
获得 531 次点赞
2019年07月16日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息