AI 应用

安谋科技自研产品

SoC 芯片设计

IoT 与嵌入式

教育与职场

合作伙伴

不限文章问答人工智能 AI 芯片自动驾驶计算机视觉语音识别大模型 ...
V · 1月2日

分布匹配蒸馏：扩散模型的单步生成优化方法研究

扩散模型在生成高质量图像领域具有显著优势，但其迭代去噪过程导致计算开销较大。分布匹配蒸馏（Distribution Matching Distillation，D...

0 阅读 695
爱笑的小姐姐 · 2024年12月18日

实时 4K 图像修复：TSFormer 以 3.38M 参数达 40fps 高性能，推动技术落地

超高分辨率（UHD）图像修复对于需要出色视觉保真度的应用至关重要，然而现有方法往往在修复质量和效率之间存在权衡，限制了其实际部署。...

0 阅读 1.3k
爱笑的小姐姐 · 2024年12月13日

视觉 Transformer 与目标检测的完美融合：解读 ViTOC 架构 !

本文提出 ViTOC（视觉 Transformer 和目标感知描述生成器），一种用于图像描述的视觉语言模型，可解决生成描述的准确性和多样性的挑战。...

0 阅读 1.1k
爱笑的小姐姐 · 2024年12月10日

预训练视觉 Transformer （ViT）的核心：特征表示还是注意力模式？

传统智慧认为，预训练视觉 Transformer （ViT）通过学习有用的表示可以提高下游性能。这是否真的如此？作者对此进行了调查，发现预训练...

0 阅读 805
爱笑的小姐姐 · 2024年12月05日

精确修正 ViT，针对视觉 Transformer 预测错误的纠正策略！

模型编辑旨在数据高效地纠正大型预训练模型的预测错误，同时确保对相邻故障的泛化以及对局部性的关注，以最大限度地减小对无关示例的意...

6 阅读 924
爱笑的小姐姐 · 2024年11月12日

复旦提出CTA-Net |卷积与Transformer的协同，通过轻量级多尺度特征融合提升视觉识别！

卷积神经网络（CNNs）和视觉 Transformer （ViTs）已成为计算机视觉领域中局部和全局特征提取的必备工具。然而，将这两种架构聚合到现有...

0 阅读 2.4k
爱笑的小姐姐 · 2024年10月09日

FMRFT 融合Mamba和 DETR 用于查询时间序列交叉鱼跟踪 !

鱼的生长、异常行为和疾病可以通过图像处理方法进行早期检测，这对工厂水产养殖具有重要意义。然而，水下反射和某些鱼类因素（如高相似...

0 阅读 951
地瓜机器人 · 2024年09月09日

地瓜直播间 | 基于X5平台智能双目深度算法详解

你是否曾经好奇过，机器是如何像人类一样通过双眼来感知三维世界的？双目深度感知技术，是一种模拟人类双眼视觉的高级技术，通过两个摄...

2 阅读 1.3k
AI学习者 · 2024年09月02日

SimD：自适应相似度距离策略提升微小目标检测性能！

微小目标检测成为计算机视觉中最具挑战性的任务之一，这是由于物体尺寸有限和信息不足所致。标签分配策略是影响目标检测准确性的关键因...

1 阅读 1.4k
AI学习者 · 2024年08月09日

GiantPandaCVARM Neon Intrinsics 学习指北：从入门、进阶到学个通透

【GiantPandaCV导语】Neon是手机普遍支持的计算加速指令集，是AI落地的工程利器。Neon Intrinsics 的出现，缓解了汇编语言难学难写的难...

3 阅读 1.4k
AI学习者 · 2024年08月09日

【3D计算机视觉】PU-Net：点云上采样网络（CVPR2018-6）

由于点云数据的稀疏性和不规则性，所以用深度神经网络学习和分析3D点云一直以来是一个具有挑战性的工作。这篇文章中我们提出了一种数据...

1 阅读 1.3k
AI学习者 · 2024年08月09日

ESPCN：亚像素卷积神经网络

什么是亚像素亚像素(Sub Pixel)：面阵摄像机的成像面以像素为最小单位，像素中心之间的距离有几个至十几个微米不等。为了最大限度利用图...

1 阅读 1.6k
AI学习者 · 2024年08月09日

语义分割专栏（一）解读FCN

前言本文将介绍全卷积神经网络（Fully Convolutional Network，简称FCN）的基础知识，包括它的网络结构、起源、应用、输入输出格式和py...

1 阅读 1.5k
微帧Visionular · 2024年08月09日

终端增强技术实现真正落地！微帧科技与天猫精灵联手打造的精灵原画-AI视效增强

8月5日，天猫精灵高端品牌暨新品发布会圆满举行，会上正式发布了天猫精灵全新高端品牌“哇哦”，并携手知名歌手周深作为品牌代言人，共同...

0 阅读 903
AI学习者 · 2024年08月08日

关于CenterNet移动端部署的思考（for ncnn）

本文主要是参考 arlencai 大佬的博文，对于cneternet在ncnn平台移植的实操和分析，先mark一下，准备后续有空闲尝试将这一思路在nvidia的...

0 阅读 1.1k
AI学习者 · 2024年08月08日

ResNeX

ResNeXt是由何凯明团队在2017年CVPR会议上提出来的新型图像分类网络。ResNeXt是ResNet的升级版，在ResNet的基础上，引入了cardinality的...

0 阅读 1k
超神经HyperAI · 2024年08月07日

全球首个！清华/上海交大等联合构建面向糖尿病诊疗的视觉-大语言模型，登 Nature 子刊

糖尿病是全球上升最快的主要慢性病，可造成失明、肾功能衰竭、截肢、脑卒中、心肌梗死等，亦与肿瘤感染等密切相关。其中，糖尿病视网膜...

0 阅读 1.2k
K_b0KBsM · 2024年07月04日

模型案例 | 玉米病害识别模型！

玉米是我国主要粮食作物，种植区域广泛，玉米在不同生长阶段都需要进行病虫害防治。玉米锈病主要侵害叶片，也为害玉米苞叶和叶鞘，严重...

1 阅读 4.1k
V · 2024年06月20日

Pixel Transformer：用像素代替补丁可以提升图像分类精度

在快速发展的人工智能领域，ViTs已成为各种计算机视觉任务的基础模型。ViTs通过将图像划分为小块并将这些小块作为标记来处理图像。6月刚...

0 阅读 3.7k
vesperW · 2024年06月12日

Arm发布单片机计算机视觉库CMSIS-CV

CMSIS-CV是针对嵌入式系统优化的计算机视觉库。并且针对M内核的 Helium 或者A核的 Neon 都做了专门支持。下载地址，授权方式Apach2.0

8 阅读 2.6k
K_b0KBsM · 2024年06月03日

创客项目秀｜基于Grove Vision AI的面部追踪风扇

今天小编给大家带来的是来自seeed工程师制作面部追踪风扇项目，该项目基于Grove Vision AI模块和XIAO 开发板制作，可以自动追踪人脸实现...

24 阅读 1.6k
Wa · 2024年06月01日

FPGA图像处理--CLAHE算法(一)

在介绍CLAHE算法之前必须要先提一下直方图均衡化，直方图均衡化算法是一种常见的图像增强算法，可以让像素的亮度分配的更加均匀从而获得...

1 阅读 2.8k
爱笑的小姐姐 · 2024年05月28日

YOLOv10开源｜清华用端到端YOLOv10在速度精度上都生吃YOLOv8和YOLOv9

在过去几年中，YOLO系列模型已成为实时目标检测领域的主导范式，这得益于它们在计算成本和检测性能之间的有效平衡。研究行人探索了YOLOs...

1 阅读 3.8k
K_b0KBsM · 2024年05月17日

创客项目秀 | 基于树莓派的四足灭火机器人

今天小编给大家带来的是来自B-AROL-O团队带来的基于树莓派的四足喷水机器人，该机器人可以在农场环境中自主导航，识别需要浇水的植物并...

3 阅读 5.6k
NVIDIA英伟达嵌入式系统 · 2024年05月14日

视觉语言智能和边缘 AI 2.0

VILA 是 NVIDIA 研究部门与麻省理工学院共同开发的高性能视觉语言模型系列。最大的模型约有 400 亿参数，最小的模型约有 30 亿参数，并...

4 阅读 3.3k
K_b0KBsM · 2024年05月06日

创客项目秀 | 基于Seeed XIAO 的智能宠物猫砂盆

今天小编给大家带来的项目是来自国内的Maker制作的智能宠物猫砂盆，通过记录宠物进入猫砂盆排便的次数来提前预知猫咪的健康状况。

16 阅读 2.9k
K_b0KBsM · 2024年04月30日

创客项目秀 | 基于XIAO ESP32S3 sense的宠物猫检测项目

今天小编给大家带来的是矽递科技和硬禾学堂联合举办的寒假在家练活动的第三个项目，基于XIAO ESP32S3 sense的宠物猫检测项目，该项目使...

3 阅读 4.5k
爱笑的小姐姐 · 2024年04月30日

工业异常检测视觉大模型AnomalyGPT来了

异常GPT是第一种基于视觉大模型（LVLM）的工业异常检测方法，该方法可以在不需要手动指定阈值的情况下检测工业图像中的异常。现有的工业...

4 阅读 4.3k
AI学习者 · 2024年04月26日

干货 | 图像分割概述 & ENet 实例

本文为 AI 研习社编译的技术博客，原标题：Image Segmentation Overview & ENet Implementation作者 | Aviv Shamsian翻译 | sherry3255...

5 阅读 4.3k
K_b0KBsM · 2024年04月25日

基于XIAO esp32S3 Sensor的图像分类处理

今天小编给大家带来的是圣地亚哥的Maker Marcelo Rovai 使用 XIAO ESP32S3 Sensor 搭配Edge Impulse 实现的图像分类的项目。

1 阅读 4.1k

上一页
1
2
3
4
5
…
下一页

频道介绍

聚焦中国智能计算生态，探索智联世界的无限可能。

提问题写文章

推荐专栏

安谋科技

146 篇内容 · 17664 关注

Arm技术博客

1097 篇内容 · 23761 关注

此芯AI PC开发套件瑞莎“星睿O6”

40 篇内容 · 3430 关注

腾讯技术工程

263 篇内容 · 8178 关注

灵动Mini-F5375-OB开发板

32 篇内容 · 1797 关注

推荐用户

极术小姐姐

贡献 64602 声望

baron

贡献 5975 声望

徽州骆驼

贡献 12455 声望

vesperW

贡献 3115 声望

爱笑的小姐姐

贡献 7725 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息