爱笑的小姐姐 头像

爱笑的小姐姐

1775 声望
嵌入式 AI,让AI无处不在。欢迎加入微信交流群,微信号:gg15319381845(... 展开

嵌入式 AI,让AI无处不在。欢迎加入微信交流群,微信号:gg15319381845(备注:嵌入式)

收起
关注了
7
粉丝数
14272
最新动态
  • 发布了文章 ·
    这才是Self-Attention与CNN正确的融合范式,性能速度全面提升

    Convolution和Self-Attention是两种强大的表征学习方法,它们通常被认为是两种彼此不同的方法。在本文中证明了它们之间存在着很强的潜在关系,因为这两个方法的大部分计算实际上是用相同的操作完成的。具体来说:因此,两个模块的第一阶段都包含了类似的操作。更重要的是,与第二阶段相比,第一阶段的计算复杂度(通道的平...

    摘要图
  • 发布了文章 ·
    即插即用 | 5行代码实现NAM注意力机制让ResNet、MobileNet轻松涨点(超越CBAM)

    识别不显著特征是模型压缩的关键。然而,这一点在注意力机制中却没有得到研究。在这项工作中提出了一种新的基于规范化的注意力模块(NAM),它抑制了较少显著性的权值。它对注意力模块应用一个权重稀疏惩罚,因此,在保持类似性能的同时,使它们更有效地计算。通过与ResNet和MobileNet上其他三种注意力机制的比较,表明本...

    摘要图
  • 发布了文章 ·
    OpenCV+MediaPipe五分钟搞定人脸3D点云提取

    上一篇文章介绍了MediaPipe中手势关键点检测与简单的手势识别,本文介绍如何试用MediaPipe实现人脸3D点云数据提取,提取的数据为人脸468点位, 相关的论文来自这里:

    摘要图
  • 发布了文章 ·
    高分遥感图像解决方案

    中科星途遥感图像解译大赛今年有六个赛道,涵盖检测、分割、跟踪等任务。其中检测主赛道依托中科院新发布的百万级实例的FAIR1M数据集。具体赛道情况如下:比赛分为初赛和决赛,分别有各自的测试集。所有模型性能都是线下训练,在线评估打分和排序。初赛截止时需要提交技术报告,排名前列的队伍进入决赛。决赛前6为优胜队...

    摘要图
  • 发布了文章 ·
    基于Tengine的开源加速器工具链

    在之前的文章里笔者已经记述了怎样在FPGA上映射由英伟达开源的加速器NVDLA。但是NVDLA的官方发布的工具链很弱,只能端到端地运行极为简单的分类网络,而现在在绝大部分的深度神经网络应用里分类往往只是其中一小部分。例如我现在想利用加速器去运行yolo,但其中有许多加速器并不支持的算子,加速器支持的convolution、po...

    摘要图
  • 发布了文章 ·
    【从零开始学深度学习编译器】十六,MLIR ODS要点总结上篇

    在【从零开始学深度学习编译器】十二,MLIR Toy Tutorials学习笔记一 中提到MLIR是通过Dialect来统一各种不同级别的IR,即负责定义各种Operation(算子)。然后对Dialect和Operation的定义又是通过TabelGen规范构造的,通过TableGen驱动MLIR的Operation定义也被称作ODS( Operation Definition Specification) 。我们目...

  • 发布了文章 ·
    重新思考空洞卷积 | RegSeg超越DeepLab、BiSeNetv2让语义分割实时+高精度

    语义分割的最新的一些研究通常采用ImageNet预训练Backbone,在其后面加上特殊的上下文模块,以快速增加感受野。虽然取得了一定的效果,但是Backbone也带来了大部分计算。最近的一些进展解决了这个问题,方法是快速降低Backbone的分辨率,同时拥有一个或多个具有更高分辨率的平行分支。作者采用了不同的方法,设计了一个...

    摘要图
  • 发布了文章 ·
    全新数据增强 | TransMix 超越Mix-up、Cut-mix方法让模型更加鲁棒、精度更高

    基于Mixup的数据增强已经被证明在训练过程中对模型进行泛化是有效的,特别是对于Vision transformer(ViT),因为它们很容易过拟合。然而,以往基于Mixup的方法有一个潜在的先验知识,即目标的线性插值比率应该与输入插值中提出的比率保持一致。这可能会导致一种奇怪的现象,有时由于增广的随机过程,Mixup图像中没有有效...

    摘要图
  • 发布了文章 ·
    【Tengine部署】NPU初体验 踩坑最全总结

    在Khadas官网下载VIM3 Ubuntu固件,我选择安装 Linux4.9内核固件 桌面版 EMMC安装,文件大约780MB 网址

    摘要图
  • 发布了文章 ·
    OpenGait:首个步态识别框架开源了!

    远远地,看一眼你走路方式,就知道你是谁!这就是步态识别技术。首个步态识别框架OpenGait正式发布了!OpenGait由南方科技大学计算机系于仕琪科研团队开发,银河水滴公司予以支持。欢迎大家三连:使用,反馈和建议。项目主页:[链接]

    摘要图
  • 发布了文章 ·
    Tengine推理引擎 | 异构计算 源码解读

    之前已经通过四篇文章对Tengine推理引擎的api、graph、调度策略、切图策略做了讲解,本文继续对Tengine的异构计算的NPU部分的核心代码进行简单介绍。

  • 发布了文章 ·
    Tengine推理引擎 | 切图 源码解读

    Tengine-lite 源码阅读已经出了三期的文章了,在对每个部分解读的过程中也对tengine的运行机制有了一些认识。本期 切图 的源码解读应该是Tengine的非常核心的机制之一。

  • 发布了文章 ·
    Tengine推理引擎 | Scheduler源码解读

    虫叔说第三个要学的是预运行,但我没准确的找到预运行是在哪,只找到scheduler里有预运行相关的函数,而且scheduler也是Tengine的四大核心模块之一,于是就看了看这部分的。

    摘要图
  • 发布了文章 ·
    Tengine推理引擎 | Graph源码解读

    文章很长,大部分读者是不愿意花大量时间看的,这些我也都清楚。不过当我们在实际部署的时候难免会遇到各种各样问题,能提前对底层实现有所了解,遇到问题能够及时发现问题来源,还能提issue,和虫叔讨论,我觉得也是很不错的学习路线。

    摘要图
  • 发布了文章 ·
    Tengine 推理引擎 | API源码解读

    Tengine由OPEN AI LAB主导开发,该项目实现了深度学习神经网络模型在嵌入式设备上的快速、高效部署需求。为实现在众多AIoT应用中的跨平台部署,本项目使用C 语言进行核心模块开发,针对嵌入式设备资源有限的特点进行了深度框架裁剪。同时采用了完全分离的前后端设计,有利于 CPU、GPU、NPU 等异构计算单元的快速移植和部...

    摘要图
  • 发布了文章 ·
    Tengine lite Windows Clion 配置

    虽然标题写的是用Clion通过cmake编译,但是在安装tengine的时候还是离不开Visual Studio的

    摘要图
  • 发布了文章 ·
    项目实践 | 从零开始边缘部署轻量化人脸检测模型——训练篇

    在模型大小上,默认FP32精度下(.pth)文件大小为 1.04~1.1MB,推理框架int8量化后大小为 300KB 左右。

    摘要图
  • 发布了文章 ·
    大规模预训练模型如何赋能代码智能

    大规模预训练模型已经在自然语言处理领域取得了巨大的成功,国内外各大人工智能巨头纷纷开始在该方向发力,其中比较有代表性的有:OpenAI的GPT[1]、华为的盘古[2]、百度的ERNIE[3]等。然而,大规模预训练模型的落地场景一直是个很大的挑战,最近,OpenAI和github、微软合作,基于CodeX[4]模型(GPT-3的编程语言版本)发...

    摘要图
  • 发布了文章 ·
    详细解读 | CVPR 2021轻量化目标检测模型MobileDets(附论文下载)

    构建在深度卷积上的Inverted bottleneck layers已经成为移动设备上最先进目标检测模型的主要构建模块。在这项工作中,作者通过回顾常规卷积的实用性,研究了这种设计模式在广泛的移动加速器上的最优性。

    摘要图
  • 发布了文章 ·
    为什么MindSpore这样设计图算融合架构

    还记得一年前的MindSpore 0.5版本中,我们怀着忐忑的心情首次发布了图算融合β特性;其实往前回溯的话,在设计MindSpore图算融合架构的时候,我们更是经过了长期的讨论—图算融合优化的架构应该怎样设计。

    摘要图
认证与成就
获得 53 次点赞
2020年02月20日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息