AI学习者 头像

AI学习者

11399 声望
嵌入式,CV,NLP,数字芯片设计学习中~ 展开

嵌入式,CV,NLP,数字芯片设计学习中~

收起
关注了
76
粉丝数
8942
IP 属地广东
最新动态
  • 发布了文章 ·
    【测评报告汇总】SiRider S1芯擎工业开发板试用测评报告

    本篇文章为SiRider S1芯擎工业开发板试用测评报告汇总,持续更新,欢迎关注。SiRider S1芯擎工业开发板测评+1.防止黑客入侵通信监控系统(PSA)SiRider S1芯擎工业开发板测评+2防止黑客入侵盗用操控劫持篡改摄像头&OpenSSL加密解密SiRider S1: 启动 Ubuntu 24.04玩转SiRider S1:启动芯引擎【SiRider S1芯擎工业开发板测...

  • 发布了文章 ·
    YOLOv10 正式发布!原理、部署、应用一站式齐全

    标题:YOLOv10: Real-Time End-to-End Object Detection 论文:[链接] 源码:[链接]

    摘要图
  • 发布了文章 ·
    轻量级 YOLO v8:YoloTag 目标检测器的实时性能分析 !

    利用环境中的 fiducial 标记作为视觉地标,无人机(UAVs)可以快速构建精确的地图并安全高效地导航空间,从而解锁与人类流畅协作和共存的可能性。现有的 fiducial 标记方法依赖于手工制作的特征提取,这牺牲了准确性。另一方面,用于标记检测的深度学习 Pipeline 无法满足导航应用程序所需的实时运行时限制。在这项工作...

    摘要图
  • 发布了文章 ·
    vLLM源码之模型并行

    关于vLLM,之前介绍过vLLM框架(vLLM源码之框架执行)和PagedAttention的算子(vLLM源码之PagedAttention),本文主要结合代码,希望可以图文并茂的方式分析vLLM的模型并行(vLLM版本为v0.5.1)。

    摘要图
  • 发布了文章 ·
    【PyTorch 奇淫技巧】Async Checkpoint Save

    在PyTorch 2.4之后,我们可以尝试使用PyTorch开发的异步Checkpoint保存功能,这个功能是和IBM联合开发的,在7B的大模型训练中,Checkpoint保存的时间从平均 148.8 秒缩短至 6.3 秒,快了 23.62 倍。这可以转化为以下两种好处:

    摘要图
  • 发布了文章 ·
    CAF-YOLO | 融合卷积与 Transformer 的优势,实现微小生物实体的高精度检测 !

    在生物医学图像分析中,目标检测尤为重要,尤其是在病变识别方面。尽管目前的方法在识别和定位病变方面表现出色,但往往缺乏必要的精确性,无法检测到微小的生物实体(如异常细胞,小于3毫米的肺结节),这在血液和肺部病理学中至关重要。为了解决这个问题,作者提出了一种基于YOLOv8架构的CAF-YOLO方法,这是一种快速而...

    摘要图
  • 发布了文章 ·
    打造全场景、跨领域、多模态的AI标注工作流,X-AnyLabeling v2.4.0 正式发布!

    不知不觉,从去年的 first commit 到 v2.4.0 版本的发布,X-AnyLabeling 如同四季轮回,已悄然走过了春华秋实的岁月。这如同亲手撒下的一颗种子,在春的温暖中萌芽,于夏的热烈中成长,经历秋的收获,沉淀在冬的宁静中,最终绽放出属于自己的光彩。

    摘要图
  • 发布了文章 ·
    SimD:自适应相似度距离策略提升微小目标检测性能 !

    微小目标检测成为计算机视觉中最具挑战性的任务之一,这是由于物体尺寸有限和信息不足所致。标签分配策略是影响目标检测准确性的关键因素。尽管有一些针对微小物体的有效标签分配策略,但它们大多数关注降低对边界框的敏感性以增加正样本数量,并且需要设置一些固定的超参数。然而,更多的正样本并不一定会导致更好的检...

    摘要图
  • 发布了文章 ·
    NVidia GPU指令集架构-浮点运算

    计算机算数是计算机工程的一个重要分支,现代计算类的软件多是构造在浮点运算之上的。了解浮点数和浮点运算对于我们理计算类任务,提升计算精度和效率有很大的帮助。NVidia GPU上Tensor Core和CUDA Core都提供了浮点计算能力,本文只专注CUDA Core部分(后续有专门章节介绍Tensor Core指令集),重点介绍了计算机上的浮...

    摘要图
  • 发布了文章 ·
    SOD-YOLOv8来袭 | 让YOLOv8家族成为了小目标检测的克星 !

    凡本公众号注明“来源:XXX(非集智书童)”的作品,均转载自其它媒体,版权归原作者所有,如有侵权请联系我们删除,谢谢。

    摘要图
  • 发布了文章 ·
    【翻译】使用 Triton 核心加速 Llama3 FP8 推断

    我们提出了一种优化的Triton FP8 GEMM(通用矩阵乘法)kernel TK-GEMM,它利用了SplitK并行化。对于小batch size推理,在NVIDIA H100 GPU上针对Llama3-70B,TK-GEMM相比基础Triton矩阵乘法实现可提供高达1.94倍的性能提升,比cuBLAS FP8快1.87倍,比cuBLAS FP16快1.71倍。

    摘要图
  • 发布了文章 ·
    TensorRT-LLM初探(三)最佳部署实践

    本篇文章根据NVIDIA AI技术开放日 2024 夏[1]中TRT-LLM 最佳部署实践[2]的演讲,结合自己的一些经验整理成本篇文章,算是TensorRT-LLM初探第三篇——最佳部署实践。

    摘要图
  • 发布了文章 ·
    【Q&A】SiRider S1芯擎工业开发板

    问题1:不知道资料是否丰富,教程有没有中文的?答:资料还算是比较丰富的,后续会有详细的中文产品使用手册。问题2:内存最大可以做多少个G?答:内存最大支持16G。问题3:是否可以支持固态硬盘?答:支持固态硬盘,开发板有一个M-KEY的插槽,可以支持SSD扩展的。问题4:想了解一下核间的实时通信如何实现的?答:RPMSG...

  • 发布了文章 ·
    CAS-ViT 提升图像分类、目标检测、语义分割等任务性能,可部署到手机端!!

    视觉 Transformer (ViTs)与它们的标记混合器的强大全局上下文能力标志着神经网络的革命性进步。然而,标记之间的双向亲和力和复杂的矩阵运算限制了它们在资源受限的场景和实时应用(如移动设备)上的部署,尽管在以前的工作中已经做出了显著的努力。在本论文中,作者提出CAS-ViT:卷积加性自注意力视觉 Transformer ,...

    摘要图
  • 发布了文章 ·
    大模型训练:Megatron-Kwai中的内存优化

    除了通信优化,对于大模型训练来说,内存优化也是非常重要的问题。在这篇文章里,我们会结合快手发表在今年ATC上的工作(Megatron-Kwai[1]),简单介绍一下内存优化技术。

    摘要图
  • 发布了文章 ·
    【资料汇总】SiRider S1芯擎工业开发板资料/产品介绍/教程等

    本篇文章为SiRider S1芯擎工业开发板资料/产品介绍/教程等汇总文,持续更新,欢迎关注。参考资料直播回放SiRider S1芯擎工业开发板深度解析及免费试用测评介绍NPU相关:CVResnet:resnet50训练部署教程PyTorch ResNet实现图像分类(从模型的训练到Android部署)Inception:Cloud TPU 教程Inception系列理解Resnext:ResNeX...

  • 发布了文章 ·
    遥遥领先!手把手带你用国产香橙派部署清华AI语言模型,比肩GPT,树莓派做得到吗?

    感谢 @顾子韵 ,Tass及其他朋友的帮助,缺少他们的帮助无法完成该教程。感兴趣的朋友私聊我或他进群一起学习。

    摘要图
  • 发布了文章 ·
    GiantPandaCVARM Neon Intrinsics 学习指北:从入门、进阶到学个通透

    【GiantPandaCV导语】Neon是手机普遍支持的计算加速指令集,是AI落地的工程利器。Neon Intrinsics 的出现,缓解了汇编语言难学难写的难题,值得工程师们开发利用。

    摘要图
  • 发布了文章 ·
    DPRNN 学习

    双路径循环语音分离神经网络(Dual-Path RNN)由三个处理阶段组成, 编码器、分离和解码器。首先,编码器模块用于将混合波形的短段转换为它们在中间特征空间中的对应表示。然后,该表示用于在每个时间步估计每个源的乘法函数(掩码)。最后利用解码器模块对屏蔽编码器特征进行变换,重构源波形。 DPRNN被广泛的应用在语音...

    摘要图
  • 发布了文章 ·
    DeepSpeech理论与实战

    本文介绍基于CTC的End-to-End语音识别系统——DeepSpecch,包括简单的原理介绍和代码介绍。阅读本文之前需要了解CTC的基本原理。更多文章请点击深度学习理论与实战:提高篇。

    摘要图
认证与成就
获得 113 次点赞
2019年08月04日 加入
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息