派大星 头像

派大星

925 声望
微信公众号:NeuralTalk 展开

微信公众号:NeuralTalk

收起
关注了
2
粉丝数
9
最新动态
  • 发布了文章 ·
    嵌入式AI简报 (2020-08-06):CoreML更新/韩松团队MCUNet/OneFlow发布

    导读:本次18条。【业界新闻】CoreML更新支持更多模型且CPU支持fp16,SoC方面联发科发布中端芯片天玑720,三星猎户座1000首次曝光将搭载AMD GPU等,Adreno GPU驱动升级Vulkan性能再提升,MLPerf发布含谷歌第四代TPU与NVIDIA A100性能比较,TensorFlow曝用户自定义层无法更新bug;【论文】韩松团队提出MCUNet及相应设计架...

    摘要图
  • 关注了专栏 ·
    图标
    极术公开课订阅

    订阅极术公开课,即时获取最新技术公开课信息

  • 关注了专栏 ·
    图标
    Arm 技术博客

    Arm相关的技术博客,提供最新Arm技术干货,欢迎关注

  • 发布了文章 ·
    端侧推理引擎Tengine初识:安卓平台交叉编译并跑通MobileNetV1

    前阵子看到Tengine为OpenCV4.3版本贡献了ARM CPU底层汇编代码,加速深度学习计算。最近也看到Tengine的不少同学在做相关PR。可能有小伙伴不了解Tengine。根据ARM官网也有介绍Tengine,其介绍如下。Tengine 是OPEN AI LAB 针对前端智能设备开发的软件开发包,核心部分是一个轻量级,模块化,高性能的AI 推断引擎,并支持...

    摘要图
  • 赞了文章 ·
    Int8量化-Winograd量化原理及实现

    2019年已经过半,今年人工智能-计算机视觉方向在边缘计算、移动终端、嵌入式终端的产品落地进入白热化阶段。终端落地的很大一个指标依旧是Inference Time,网络模型压缩的需求越来越大,其中网络模型量化(低比特量化)开始大规模在终端设备上部署并取得了较好的市场认可,同时上游芯片设计公司依次推出了针对低比特量化...

    摘要图
  • 发布了文章 ·
    嵌入式AI简报 (2020-03-02)

    导读:本次内容20条。「业界新闻」Face++即将开源自己的深度学习框架,国产5G SoC新星虎贲T7520都值得关注,两家国外AI芯片边缘端创业公司,多多少少都与Cortex-M系列有关。压缩剪枝相关的「论文」有两篇,其中一篇采取无训练的剪枝非常有创意,还有篇「博文」讲的压缩实战很有意思,「博文」部分的《春秋到战国—论Nerva...

    摘要图
  • 关注了用户 ·
  • 发布了文章 ·
    百度轻量深度学习推理引擎Paddle Lite,极致的 ARM CPU 性能优化

    Paddle Lite为Paddle-Mobile的升级版,定位支持包括手机移动端在内更多场景的轻量化高效预测,支持更广泛的硬件和平台,是一个高性能、轻量级的深度学习预测引擎。作者:开心的派大星首发微信公众号:NeuroMem转自:[链接]

    摘要图
  • 赞了文章 ·
    详解Winograd变换矩阵生成原理

    本文想把有关Winograd这个算法背后所涉及到的数学知识用比较通俗的方式给读者描述一遍,并且在这的过程中也会添加一些我个人的理解。作者:梁德澎首发知乎:[链接]

    摘要图
  • 关注了专栏 ·
    图标
    嵌入式AI

    嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:gg15319381845(备注:嵌入式)

  • 发布了文章 ·
    嵌入式AI简报 (2020-02-16)

    导读:本次内容20条。ARM 和 恩智浦 在低功耗Cortex-M和单片机上地动态、AI测温产业非常值得关注。ARM 发布 Cortex-M55 和 Ethos-U55 系列,适合语音AI模型推理,ARM也发布用Cortex-M系列部署机器学习、Cortex-M结合CMSIS-NN 部署卷积网络模型的白皮书等等,NXP工程师也在 MCU 上实现并发布人脸识别、性别识别Demo及相关...

    摘要图
  • 赞了文章 ·
    移动端arm cpu优化学习笔记第2弹--常量阶时间复杂度中值滤波

    在复现 Side window 中值滤波的时候就在思考中值滤波能怎么优化,直观上看中值滤波好像没什么可优化的点,因为中值滤波需要涉及到排序,而且半径越大,排序的耗时也越大。那么中值滤波能否进一步加速呢?或者像均值滤波一样,可以不受滤波半径的影响呢?作者:梁德澎首发知乎:[链接]

    摘要图
  • 赞了文章 ·
    CVPR2019 Oral|Side Window Filtering 论文解读和C++实现

    本文复现的是CVPR2019 Oral论文Side Window Filtering。作者:梁德澎首发知乎:[链接]

    摘要图
  • 关注了用户 ·
    图标
    梁德澎

    github:[链接]知乎:[链接]

  • 发布了文章 ·
    阿里轻量级的深度神经网络推理引擎MNN

    MNN是一个轻量级的深度神经网络推理引擎,在端侧加载深度神经网络模型进行推理预测。作者:开心的派大星首发:微信公众号:NeuroMem转自:[链接]

    摘要图
  • 发布了文章 ·
    TensorFlow Lite概述:转换器、解释器、XLA和2019年路线图

    导读:虽然TensorFlow用户众多,但是推理框架这方面,其他家做的都很好。就从我的角度来看,市面上较为知名的如腾讯的NCNN,因其开源早,且社区一直有作者在维护,文档详细、例子充分、业内使用最为广泛,也基于Vulkan支持手机GPU。再就是小米自研的MACE,整体代码和文档质量高,不仅支持CPU、GPU(高通Adreno GPU的实现...

    摘要图
  • 发布了文章 ·
    嵌入式AI简报 (2020-01-27)

    导读:本次内容20条,关于BERT有4条。「业界新闻」搜狗的手机AR实景导航挺有意思,其中「论文」三篇BERT量化/加速方面的文章,「开源项目」基于端MNN的上层SDK MNNKit、浏览器端BLAS库值得关注,「博文」关于兼顾速度精度与工程实现的CNN结构设计的技巧值得一看,以及TFLITE端侧基于部分层训练的迁移学习实战!微信公众...

    摘要图
  • 关注了专栏 ·
    图标
    嵌入式AI

    关注模型压缩、低比特量化、移动端推理加速优化、部署

认证与成就
获得 41 次点赞
1月17日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息