圈圈虫 头像

圈圈虫

752 声望
他还没有填写个人简介
关注了
1
粉丝数
26
最新动态
  • 发布了文章 ·
    Tengine 支持 NPU 模型部署-YOLOX

    YOLOv5 自从问世以来,让多目标检测任务在速度和精度上都达到了非常好的表现效果。所以最近被国内优秀的人工智能产品和解决方案公司[链接]

    摘要图
  • 发布了文章 ·
    Tengine 支持 NPU 第4篇-NVDLA

    NVDLA(NVIDIA Deep Learning Accelerator),是英伟达开源的深度学习加速器的软硬件参考方案,通过其模块化架构,NVDLA 具有可扩展性和高度可配置性的特点,实现降低深度学习加速器的设计门槛。让更多行业能够快速的将 AI 加速能力融合进自己的 AI SoC 中。

    摘要图
  • 发布了文章 ·
    Tengine 支持 PaddlePaddle 模型部署

    Tengine 组负责模型转换工具的小伙伴愉快的开始支持 PaddlePadde 2.0 的静态图模型。

    摘要图
  • 发布了文章 ·
    Tengine 支持 NPU 模型部署-YOLOv5s

    今天我们试着基于 AI 边缘计推理框架 Tengine 在 Khadas VIM3 的 AI 加速器上部署 YOLOv5s。

    摘要图
  • 发布了文章 ·
    Tengine 新增支持 NPU ——完美适配TIM-VX

    2020年以来由于特殊的国际环境的影响下,原本在 AI边缘计算占有绝对优势的海思平台Hi35xx系列SoC 最终一货难求,导致国内其他AI SoC平台如同雨后春笋般激增。无论是真正的自主研发,还是套壳NVDLA,或直接购买已有NPU IP,只要能解决行业刚需问题,就是一颗优秀的AI SoC。本文主要介绍国内优秀的NPU IP供应商最新开源的T...

    摘要图
  • 发布了文章 ·
    Tengine 支持 NPU 第3篇-TIM-VX

    2020年以来由于特殊的国际环境的影响下,原本在 AI边缘计算 占有绝对优势的海思平台 Hi35xx 系列 SoC 最终一货难求,导致国内其他 AI SoC 平台如同雨后春笋般激增。无论是真正的自主研发,还是套壳NVDLA,或直接购买已有 NPU IP,只要能解决行业刚需问题,就是一颗优秀的 AI SoC。本文主要介绍国内优秀的 NPU IP 供应商—...

    摘要图
  • 发布了文章 ·
    Tengine 支持 AML、RK NPU 第2篇-A311D

    背景2020年风云变幻,原本以为嵌入式端侧 AI 芯片“大菊已定”。但国内最大智能电视芯片厂商——晶晨半导体(Amlogic)却在从2019年开始,陆陆续续(悄悄咪咪)发布了S905D3,A311D,C308X 等几款能覆盖边缘计算盒子、智能IPC应用场景的 AI SoC。参数对比先简单介绍下当前国内可满足采用 NPU方案的 IPC 或 边缘计算盒子,市...

    摘要图
  • 发布了文章 ·
    OverNet | 速度快&高性能&任意尺度超分

    点击上方“AIWalker”,选择加“星标”    精品干货,瞬时送达标题&作者团队paper:[链接]【Happy导语】该文提出了一种轻量型任意尺度超分方案,它将任意尺度数据制作思路引入到OSM设计中。作者通过实验证实了所提OSM的有效性,性能比MetaSR更高,速度更快。那么你还有什么理由不去了解一下呢?AbstractDCNN在超分领域取得了...

    摘要图
  • 发布了文章 ·
    OverNet | 速度快&高性能&任意尺度超分

    点击上方“AIWalker”,选择加“星标”    精品干货,瞬时送达标题&作者团队paper:[链接]【Happy导语】该文提出了一种轻量型任意尺度超分方案,它将任意尺度数据制作思路引入到OSM设计中。作者通过实验证实了所提OSM的有效性,性能比MetaSR更高,速度更快。那么你还有什么理由不去了解一下呢?AbstractDCNN在超分领域取得了...

    摘要图
  • 发布了文章 ·
    Tengine 支持 AML、RK NPU 第1篇-闲聊

    各种机缘巧合来到深圳,抓住人工智能火箭尾巴,挂着 嵌入式Linux驱动工程师 的羊头,卖起了 NNIE 的狗肉。当初团队的理想很丰满:借 Hi3559AV100 神器,造超一流 AI Camera。事与愿违,PoC版本不到一周,项目却光速下马……后来转战 arm neon 优化圈子,成为一名 土法 HPCer + 野生调优师。

    摘要图
  • 关注了专栏 ·
    图标
    极术公开课订阅

    订阅极术公开课,即时获取最新技术公开课信息

  • 关注了专栏 ·
    图标
    Arm技术博客

    Arm相关的技术博客,提供最新Arm技术干货,欢迎关注

  • 赞了文章 ·
    是什么引起了各个框架 Resize 操作的结果不同?——来自 ONNX 的标准化尝试

    炼丹师在转换模型的时候,经常会发现给转换前后的模型输入同样的图片,模型结果有微小的差别。其中的原因有数值算法的误差、不同 jpeg 解码库产生的结果不同等等,也有不同框架内部对某些算子的实现差异。

    摘要图
  • 赞了文章 ·
    端侧推理引擎Tengine初识:安卓平台交叉编译并跑通MobileNetV1

    前阵子看到Tengine为OpenCV4.3版本贡献了ARM CPU底层汇编代码,加速深度学习计算。最近也看到Tengine的不少同学在做相关PR。可能有小伙伴不了解Tengine。根据ARM官网也有介绍Tengine,其介绍如下。Tengine 是OPEN AI LAB 针对前端智能设备开发的软件开发包,核心部分是一个轻量级,模块化,高性能的AI 推断引擎,并支持...

    摘要图
  • 发布了文章 ·
    Int8量化-Winograd量化原理及实现

    2019年已经过半,今年人工智能-计算机视觉方向在边缘计算、移动终端、嵌入式终端的产品落地进入白热化阶段。终端落地的很大一个指标依旧是Inference Time,网络模型压缩的需求越来越大,其中网络模型量化(低比特量化)开始大规模在终端设备上部署并取得了较好的市场认可,同时上游芯片设计公司依次推出了针对低比特量化...

    摘要图
  • 发布了文章 ·
    Int8量化-ncnn社区Int8重构之路

    本文是对NCNN社区int8模块的重构开发,再也不用担心溢出问题了,速度也还行。作者:圈圈虫首发知乎传送门ncnnBUG1989/caffe-int8-convert-tools从去年8月初首次向社区提交armv7a版本的int8功能模块到现在过去半年了,中途经过N次迭代。原本以为提交后就可以去别处摸鱼打望,谁知已掉进不断自己挖坑填坑的过程。中间多次...

    摘要图
  • 赞了文章 ·
    详解Winograd变换矩阵生成原理

    本文想把有关Winograd这个算法背后所涉及到的数学知识用比较通俗的方式给读者描述一遍,并且在这的过程中也会添加一些我个人的理解。作者:梁德澎首发知乎:[链接]

    摘要图
  • 关注了专栏 ·
    图标
    嵌入式AI

    嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:gg15319381845(备注:嵌入式)

  • 赞了文章 ·
    基于EAIDK-310和SoundAI Azero的语音交互系统

    语音交互技术的发展,给我们的生活带来了很大的改变,智能音箱就是其典型的应用产品,比如现在常见的小爱、小度、天猫精灵等智能音箱。我们通过与智能音箱对话,就可以实现听歌、听书、听新闻等等功能。

    摘要图
  • 赞了文章 ·
    转载 | 使用OpenCV中的universal intrinsics为算法提速 (3)

    OpenCV 4.x中提供了强大的统一向量指令(universal intrinsics),使用这些指令可以方便地为算法提速。所有的计算密集型任务皆可使用这套指令加速,非计算机视觉算法也可。目前OpenCV的代码加速实现基本上都基于这套指令。

    摘要图
认证与成就
获得 21 次点赞
2019年07月24日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息