JackLi 头像

JackLi

2239 声望
一个有情有趣有用有品的“四有”好青年~~ 展开

一个有情有趣有用有品的“四有”好青年~~

收起
关注了
44
粉丝数
33
最新动态
  • 发布了文章 ·
    HVX 指令介绍

    随着骁龙多核AI引擎的发展,异构计算算力有了巨大提升,为了发挥CDSP HVX在AI和CV的优势,开发者必须熟练掌握HVX的指令。但是HVX指令多而复杂,基础指令就有上百条及一些复杂的特殊指令,写起来更是费劲。为了发挥其性能高的优势,开发者必须使用intrinsic或汇编的方式编排代码,因此完全掌握HVX指令至关重要。

    摘要图
  • 发布了文章 ·
    GPU 优化技术-OpenCL 运行时 API 介绍

    OpenCL 作为一套通用异构平台编程框架,由两个部分组成:其一是在主机处理器(Host)执行的运行时 API;其二是基于 C99 标准扩展的 OpenCL C 语言,用于编写在设备处理器(OpenCL device)运行的内核(kernel)代码。

    摘要图
  • 发布了文章 ·
    GPU 优化技术-OpenCL 介绍

    如今的时代是一个数据爆炸的时代,如何处理海量的数据是各行各业不得不面临的一个重要问题。随着摩尔定律的失效,支持大量并行计算的异构处理器开始大放异彩。其中,无论是在 PC 端还是移动端,GPU 无疑是其中最璀璨的明星。

    摘要图
  • 发布了文章 ·
    CPU 优化技术-NEON 自动向量化

    SIMD 作为一种重要的并行化技术,在提升性能的同时也会增加开发的难度。目前大多数编译器都具有自动向量化的功能,将 C/C++ 代码自动替换为 SIMD 指令。

    摘要图
  • 发布了文章 ·
    CPU 优化技术-NEON 指令介绍

    ARM NEON 可以提升计算机视觉等计算密集型程序的性能,编译器可以将 C/C++ 代码自动转换为 NEON 指令。但是想要有更好的性能还是需要手工编写 NEON 代码,熟练掌握 NEON 指令是第一步。

    摘要图
  • 发布了文章 ·
    CPU 优化技术-NEON 介绍

    ARM NEON 是适用于 ARM Cortex-A 和 Cortex-R 系列处理器的一种 SIMD(Single Instruction Multiple Data)扩展架构。

    摘要图
  • 发布了文章 ·
    HVX 优化技术-HVX 开发环境介绍

    原文:知乎文章发表于知乎专栏《移动端算法优化》作者:高性能计算学院本篇以 HVX 的开发环境配置以及应用实例编译测试为主进行讲述。

    摘要图
  • 发布了文章 ·
    HVX 优化技术-HVX 架构简介

    Hexagon 也称为 QDSP6,代表“第六代数字信号处理器”。 第一代 QDSP6 V1 在 2006 年便已经推向市场,距现在已经过去十几年。据高通称,Hexagon 架构旨在为各种应用提供低功耗的性能,用于高通骁龙芯片,面向智能手机、汽车、可穿戴设备和其他移动设备,也用于蜂窝电话网络的组件。

    摘要图
  • 发布了文章 ·
    移动端算法优化概述

    Hi,大家好,我们是小米手机影像算法部门的算法加速团队,负责小米手机影像算法的优化和落地的工作,在过去几年内,我们在移动端影像算法优化方向投入了很多的精力和资源,在这个领域积累一定的经验,撰写这个移动端算法优化技术专栏,与大家分享和交流。

    摘要图
  • 发布了文章 ·
    OWOD:开放世界目标检测,更贴近现实的检测场景 | CVPR 2021 Oral

    不同于以往在固定数据集上测试性能,论文提出了一个更符合实际的全新检测场景Open World Object Detection,需要同时识别出未知类别和已知类别,并不断地进行增量学习。论文还给出了ORE解决方案,通过对比聚类和基于能量的分类器来进行开放开放世界的检测训练来源:晓飞的算法工程笔记 公众号

    摘要图
  • 发布了文章 ·
    OpenSitUp开源项目:零基础开发姿态估计APP

    1.项目开源地址[链接]OpenSitUp qq讨论群:965762751**2.项目简介计算机视觉中有一个应用分支叫做姿态估计,通过人体关键点的方式来估计出一个/多个人的姿态信息。如下图所示: OpenSitUp是一个基于姿态估计的开源项目,旨在帮助对姿态估计感兴趣的朋友,能够从零开始搭建一个在android手机上运行的仰卧起坐计数APP。主...

    摘要图
  • 发布了文章 ·
    实战:使用Mask-RCNN的停车位检测

    我最近做了一个项目,根据安全摄像头的照片来检测停车位是否可用或被占用。我的工作有局限性,我将进一步详细介绍这些局限性,但一旦这些问题得到解决,这个项目可能是一个低成本的解决方案,以优化停车位的可用性。安装这些额外的设备肯定是有潜力的。

    摘要图
  • 发布了文章 ·
    PLDI 2021论文分析(二):DNNFusion一种深度学习框架算子层融合与加速工具

    本次小伙伴们带来的是PLDI 2021的论文《DNNFusion-Accelerating Deep Neural Networks Execution with Advanced Operator Fusion》分析,里面对fusion做了一个分类,很有参考价值

    摘要图
  • 关注了专栏 ·
    图标
    极术公开课订阅

    订阅极术公开课,即时获取最新技术公开课信息

  • 发布了文章 ·
    OpenCV Webinar 2丨如何在OpenCV中调用Tengine推理,实现开发效率翻倍

    这个月,OPEN AI LAB的合作伙伴OpenCV 20岁了!值此之际,OpenCV中国团队推出系列OpenCV Webinar,在全球范围内定期邀请OpenCV专家来作报告,与大家交流OpenCV的各项技术。

    摘要图
  • 赞了文章 ·
    初次尝试Tengine 适配 Ncnn FP32 模型

    初次尝试Tengine 适配 Ncnn FP32 模型,相较于mnn,ncnn而言,这个框架对于多框架模型有着很好的支持性 – Caffe,Tensorflow,TF-Lite, Mxnet, Onnx, darknet。首发知乎:[链接]作者:空域

  • 赞了文章 ·
    Tengine 算子调度分析

    上一篇简述了Tengine如何适配ncnn模型,其实本质上Tengine算是一个新的IR,可对各种框架进行适配,虽然不同框架对不同算子有不同的实现方式,但是经过Tengine团队的不懈努力,可以支持nchw与nhwc的计算格式。

    摘要图
  • 赞了文章 ·
    Tengine armv8.2 with ncnn serializer

    自从arm家Cortex-A系列的armv8.2发布以来,让端侧AI推理框架开源社区比较感兴趣的也就两个点:

    摘要图
  • 赞了文章 ·
    Tengine Plugin 简介

    这几天学习了Tengine的整个框架功能,发现了里面一个功能 -- 插件功能。首先看下下部分的图,Tengine整体框架的介绍.

    摘要图
  • 赞了文章 ·
    Tengine Debug 技巧

    最近一直在运用Tengine做前端推理。在运用与适配模型中遇到了很多的问题,如何对一个框架进行Debug在本人觉得是一个很重要的技巧,好的 Debug技巧会大大缩减开发周期。下面就基于本人的Tengine使用经验来分享下如何对Tengine框架进行Debug。

    摘要图
认证与成就
获得 359 次点赞
2019年07月16日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息