AI学习者 头像

AI学习者

3349 声望
嵌入式,CV,NLP,数字芯片设计学习中~ 展开

嵌入式,CV,NLP,数字芯片设计学习中~

收起
关注了
75
粉丝数
24
最新动态
  • 赞了文章 ·
    中奖名单公布 | 夏日福利:81份礼品免费领取啦(含开发板、嵌入式书籍等)

    极术社区联合RT Thread开发者社区、公众号Arm中国学堂、嵌入式客栈和玩转嵌入式推出的夏日福利活动中奖名单公布啦~~~

    摘要图
  • 赞了文章 ·
    Jetson Nano 2GB 系列文章(27): DeepStream 简介与启用

    NVIDIA所提供的开发资源,大多属于库(library)或API级别,包括CUDA、CUDNN、CuFFT、CuBLAS、TensorRT等,需要具备足够的C++/Python编程语言基础的开发人员,才有能力发去挥GPU/CUDA的并行计算优势,这个特性某种程度限制了并行计算相关应用的普及。

    摘要图
  • 发布了文章 ·
    让检测告别遮挡 | 详细解读NMS-Loss是如何解决目标检测中的遮挡问题?

    非极大值抑制(Non-Maximum Suppression, NMS)在目标检测中至关重要,它通过合并假阳性(FP)和假阴性(FN)影响目标检测结果,尤其是在人群遮挡场景中。在本文中提出了NMS造成的训练目标和评估指标之间的弱连接问题,并提出了一种新的损失函数NMS-loss,使NMS过程可以端到端地被训练而不需要任何附加的网络参数。

    摘要图
  • 赞了文章 ·
    FPGA如何进行片上调试?

    FPGA与STM32等嵌入式开发最大的一个优点就是,可以在时序仿真阶段验证超过90%的功能,发现90%的问题。当所有的仿真没问题了,才能进行最后一步:板级调试。如果仿真都不对,那就没必要下载到芯片里了。

    摘要图
  • 赞了文章 ·
    R329开箱 简单上手(一)

    板子非常小巧,颜值高,我很喜欢这种板子正面是小屏幕,背面是核心板屏幕背后是磁贴,可以掀开(拔插摄像头可以掀开捏住板子)

    摘要图
  • 赞了文章 ·
    【R329测评】全志 R329 板子跑 mobilenetv2

      本教程详细介绍了在全志 R329 板子上跑 mobilenetv2 的流程,能达到 20 fps。

    摘要图
  • 赞了文章 ·
    【芯视野】出货将达5000万颗 快充加持的GaN正一飞冲天

    2018年Anker发布全球首款GaN快充产品至今已有将近3年的时间,原本只用在军事等特定领域的这种半导体新材料已经在消费电子领域扎根开花。特别是2020全年,手机快充市场的爆发成为GaN大幅增长的主要贡献者。进入2021年,这种趋势仍未停止,各种GaN快充产品更是层出不穷,而随着苹果入局的可能性不断增长,无比巨大的市场空...

  • 赞了文章 ·
    DeepMind 提出无需批归一化的网络:NFNet

    在本文中,我们将讨论无需批归一化的网络,即 NFNet。DeepMind 的论文介绍了无归一化网络(Normalizer-Free Net)家族,与具有归一化层的最佳网络相比,它的训练速度更快,性能更具竞争力。

    摘要图
  • 赞了文章 ·
    r329开发板部署aipu模型

    上篇文章r329模拟仿真实现了在模拟器上仿真网络,现在申请到了开发板,就有机会在上面测试下了。本文需要的原材料r329开发板sd 卡sd卡读卡器typec的usb线一台windows电脑一台linux电脑开发板全貌:包括了主板, 屏幕和usb摄像头,小巧迷你刷机&配置从这篇文章下载已经编译好的镜像链接:[链接]提取码:4tni里面包含了编...

    摘要图
  • 赞了文章 ·
    【芯调查】小米OV“造芯” 为何都盯上ISP?

    在两年前甚至更早的时间,小米OV的自研芯片计划便开始酝酿,如今迎来阶段性收获期。自小米推出自研芯片澎湃C1后,OPPO、vivo的首款自研芯片产品也相继曝光,中国一线手机厂商悉数加入“造芯”大军。

  • 赞了文章 ·
    基于 FPGA 的数字表示

    文章目录基于 FPGA 的数字表示零、计数系统框架一 、整数的表示1.1 二进制反码1.2 二进制补码二、 非整数值的表示2.1 定点二进制数2.2 定点量化2.4 小数部分截断2.5 一种不同的方法 Trounding三、 浮点数定义及表示3.1 标 准 浮 点 数 表 述3.2 浮点数的短指数表示3.3 浮点数的应用OVER-在FPGA系统中有两个基本准则非常...

    摘要图
  • 赞了文章 ·
    ARM系列 -- CHI(三)

    开始之前,先回顾一下。一个message可以是transaction request,data response,snoop request,由一个或多个packet构成;packet是ICN和端点间的传输粒度,一个packet由一个或多个flit组成;flit是最小的流控单位,一个flit由一个或多个phit组成;phit是物理层传输单位,被定义为两个相邻网络设备之间的一次传输。

    摘要图
  • 赞了文章 ·
    高性能计算软件平台在多域融合下的挑战与实践

    汽车智能化正以一种不可阻挡之势席卷全球,无数的资源、人才、科技巨头纷纷涌入这个赛道。他们的加入,从根本上改变了智能汽车的生态链和竞争格局。智能汽车从单纯的提供自动驾驶功能,转变到了通过用户服务和商业价值来驱动产品创新与迭代,整个行业呈现出“乱花渐欲迷人眼”的形势。这对于传统汽车供应链和研发人员是一...

    摘要图
  • 发布了文章 ·
    MindSpore AI科学计算系列(3):SciML分析

    SciML是由NumFOCUS组织赞助的AI科学计算开源软件包。该组织旨在开发和维护的一套功能丰富和高性能的科学机器学习工具集,拥有非常活跃的社区并且聚集了大批优秀的开发者。与SimNet不同的是,SciML主要是基于Julia语言开发。该语言源于高性能数值分析和科学计算的需要而设计。正因如此,SciML具有非常优秀的并行和分布式...

    摘要图
  • 发布了文章 ·
    详细解读 Transformer的即插即用模块 | MoE插件让ViT模型更宽、更快、精度更高

    本文提出Transformer更宽而不是更深,以实现更高效的参数部署,并将此框架实现为WideNet。首先通过在Transformer块之间共享参数来压缩可训练参数和深度,并用MoE层替换了FFN层。实验表明,WideNet通过较少的可训练参数实现了最佳性能,优于ViT等网络。 作者单位:新加坡国立大学

    摘要图
  • 发布了文章 ·
    盘古大模型的推理解决方案:增量推理+分布式推理

    鹏程.盘古的基础结构是Transformer的Decoder模块,这种自回归(Auto-regressive)的语言模型会根据上文预测下一个字,因此在推理时会根据输入的文本逐字(词)生成。显然这种方式会导致每一步推理的网络输入shape在不断变大。

    摘要图
  • 发布了文章 ·
    超越MobileNet V3 | 详解SkipNet+Bias Loss=轻量化模型新的里程碑

    近年来,Compact卷积神经网络(CNNs)的性能有了显著的提高。然而,在参数众多的情况下,它们仍然无法提供与普通CNN相同的预测能力。这些层捕获的多样且丰富的特征是这些CNN的一个重要特征。

    摘要图
  • 发布了文章 ·
    【从零开始学深度学习编译器】十,TVM的整体把握

    大概4个月前开始接触TVM,虽然是0经验开始看,但目前对TVM的IR以及Pass,Codegen,Scheduler等也有了一些基础的认识。所以这篇文章的目的是梳理一下TVM的整体架构,复盘一下自己学到了什么,以及为想学习TVM的小伙伴们提供一个整体思路。「从零开始学深度学习编译器」这个专题的文章和实验代码都被我汇总放到了[链接]\_l...

    摘要图
  • 发布了文章 ·
    聊一聊AI框架前端

    现在Python可以说是AI框架默认的宿主语言,开发者喜欢其易用性和灵活性,但是框架需要解决Python灵活性和性能的矛盾(如何进行Python加速)。

    摘要图
  • 发布了文章 ·
    遮挡人脸问题 | 详细解读Attention-Based方法解决遮挡人脸识别问题

    在非约束性环境(如大量人群)中捕获的人脸照片,仍然对当前的人脸识别方法构成挑战,因为人脸经常被前景中的物体或人遮挡。然而,很少有研究涉及到识别部分面孔的任务。

    摘要图
认证与成就
获得 55 次点赞
2019年08月04日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息