AI 应用

安谋科技自研产品

SoC 芯片设计

IoT 与嵌入式

教育与职场

合作伙伴

不限文章问答人工智能 AI 芯片自动驾驶计算机视觉语音识别大模型 ...
微帧Visionular · 9月12日

菲律宾最大广播电视媒体集团ABS-CBN与微帧正式达成合作，为亚太地区观众提供极致视觉服务

ABS-CBN是菲律宾最大的radio broadcaster、娱乐电视制作公司、节目联合发行提供商和媒体集团。它由阿尔托广播系统（ABS）和纪事广播网（...

1 阅读 1.1k
AI学习者 · 6月30日

微小目标检测新标杆 | DPNet首创动态神经网络范式，微小目标检测效率跃升35%！

1. 微小目标检测的精度与效率平衡问题：在复杂环境中，精确检测微小物体至关重要，但单纯放大图像会显著增加计算成本和负样本数量，严重...

0 阅读 1.4k
爱笑的小姐姐 · 6月26日

HMPE革新Transformer检测，小目标mAP飙升1.9%，解码器砍掉5层，推理速度翻倍

Query生成不足：现有基于Transformer的检测方法在生成Query时未能充分利用位置、类别和边界框信息，导致在有限数据集上训练时性能欠佳。

0 阅读 1.4k
AI学习者 · 6月23日

小目标检测新标杆，SimAM无参数注意力+NWD指标完胜YOLOv7

红外图像检测中存在复杂背景、低信噪比、小目标尺寸和弱亮度等问题，导致传统方法难以准确检测红外小目标。

1 阅读 1.3k
爱笑的小姐姐 · 6月5日

Soft 最近邻插值 SNI 对齐特征 +ESD 增强空间保留，效率精度双突破

特征错位问题：传统 FPN 类范式在多尺度检测中通过逐点融合不同层级的特征图，容易导致特征错位问题，从而影响模型性能。

0 阅读 2.2k
AI学习者 · 5月20日

SAM突破多模态分割 | SAM2+语义记忆模块，实现跨模态语义理解登顶DELIVER

研究主要集中在多模态语义分割（MMSS）领域，其中像素级预测是通过由不同传感器捕获的多个视觉模态得出的。最近，大型视觉模型Segment A...

0 阅读 1.2k
nihui · 4月23日

【“星睿O6”评测】CPU GPU NPU 摄像头实时 RVM 人像分割和 http 推流

项目开源地址 [链接]cpu/gpu推理：ncnnnpu推理：cix-noe cppusb摄像头、http串流：opencv-mobileusb摄像头型号：m5stack AtomS3R-CAM完...

8 阅读 1.1k
mlbo · 4月23日

【“星睿O6”AI PC】Ultra Fast Lane Detection V2 NPU部署

文章原名【“星睿O6”AI PC开发套件评测】Ultra Fast Lane Detection V2 NPU部署

2 阅读 1k
nihui · 4月15日

【“星睿O6”评测】RVM人像分割torch➡️ncnn-CPU/GPU和o6-NPU部署全过程

标题精简了，原标题是【“星睿O6”AI PC开发套件评测】RVM人像分割torch➡️pnnx➡️cix量化➡️o6-NPU和ncnn-CPU/GPU部署全过程

20 阅读 1.3k
蓝松抠图SDK · 4月15日

OBS直播，怎么在画面中添加时钟

在OBS（Open Broadcaster Software）直播中，添加时钟到直播画面是一个非常实用的功能，特别是对于需要展示实时时间信息的教学、会议、...

0 阅读 948
蓝松抠图SDK · 4月11日

OBS绿幕直播时，绿色物体被抠透明了怎么办

在OBS绿幕直播中，遇到绿色物体被抠透明的问题，无疑是许多主播和直播运营者常常面临的困扰。这一问题不仅影响了直播的专业性，还可能让...

0 阅读 876
超神经HyperAI · 4月10日

上海AI Lab等提出首个全模态医疗图像重识别框架，在11个数据集上的评测达SOTA

在 AI 驱动的医疗影像管理领域，医疗图像重识别 (MedReID) 作为一项关键技术，旨在自动关联来自不同模态、不同时间的患者影像数据，进而...

0 阅读 1k
爱笑的小姐姐 · 4月9日

视觉反馈驱动+动态规则细化，7B模型性能跃升50%，碾压10倍大模型

大型视觉-语言模型（LVLMs）通常遵循两阶段训练范式——预训练和监督微调。最近，从语言领域衍生出的偏好优化已成为一种有效的后训练强化...

1 阅读 1.1k
Happy · 4月8日

Adobe 提出 TurboFill！快速图像修复新方法！4 步即可修复高清图像！

论文名：TurboFill: Adapting Few-step Text-to-image Model for Fast Image Inpainting论文链接：[链接]开源代码：[链接]

0 阅读 1.3k
nihui · 4月4日

【“星睿O6”评测】三套OpenCV，OpenCL/KleidiCV/JPG硬件编码加速测试

【“星睿O6”AI PC开发套件评测】三套OpenCV性能测试，OpenCL加速测试，KleidiCV加速测试，JPG硬件编码加速测试

7 阅读 2.4k
爱笑的小姐姐 · 3月28日

32B 本地部署！阿里开源最新多模态模型：主打视觉语言，数学推理也很强

就在 DeepSeek-V3 更新的同一夜，阿里通义千问 Qwen 又双叒叕一次梦幻联动了——发布Qwen2.5-VL-32B-Instruct。此前开源家族视觉语言模型 ...

1 阅读 1.1k
Happy · 3月26日

ContinuousSR：从离散低分图像中重建连续高分辨高质量信号

中国科学技术大学、华为诺亚实验室、港科大、清华大学等单位联合提出了一种超快速的任意尺度超分方法，ContinuousSR。

0 阅读 1.2k
Happy · 3月21日

CVPR`25 | 让暗光照片秒变电影大片！全球首个可训练的HVI色彩空间，突破低光增强瓶颈！

亮点直击为 LLIE 任务引入了一种新的全球首个可训练的颜色空间，该空间由极化的 HS 和可训练的强度唯一定义。这提供了一个有效工具，消...

9 阅读 2.1k
Happy · 3月13日

面向真实场景图像复原，字节跳动提出扩散复原适配器，表现卓越！

扩散模型在生成高度复杂图像分布方面表现出强大的图像生成能力，可作为图像恢复的有力先验。现有方法常利用 ControNet 等技术，以低质量...

1 阅读 1.1k
Happy · 3月11日

英伟达提出首个 Mamba-Transformer 视觉骨干网络！打破精度/吞吐瓶颈

【新智元导读】CVPR 2025，混合新架构 MambaVision 来了！Mamba+Transformer 混合架构专门为 CV 应用设计。MambaVision 在 Top-1 精度和...

10 阅读 1.5k
爱笑的小姐姐 · 3月6日

革新文本-图像检索，视觉 Prompt 预测+轻量训练性能超 BLIP2

本文的目标是提升文本到图像检索的性能。为此，作者提出了一种新的框架，该框架能够提升大规模预训练视觉语言模型的表现，使其能够用于...

1 阅读 1.4k
爱笑的小姐姐 · 3月4日

ViT架构革新，Jumbo增强CLS Token，小模型性能涨13.5%，跨模态推理高效无损

作者提出了一种对全局处理视觉Transformer（ViT）的简单增强方法，以在保持吞吐量的同时提高准确性。ViT+Jumbo创建了一个更宽的CLS Toke...

0 阅读 1.6k
爱笑的小姐姐 · 2月17日

基于 Yolact 的检测优化，训练优化不损推理效率，解决边缘模糊问题！

确保自主驾驶列车在铁路表面的障碍物避免至关重要，其第一步是分割铁路区域。作者选择在 Yolact 的基础上进行工作。为了解决模型预测的...

0 阅读 1k
爱笑的小姐姐 · 2月10日

LLM 与 BiomedCLIP 携手提升图像 Prompt 学习的准确性与泛化性 !

最近，视觉语言模型（VLMs）如 CLIP 在视觉任务的自监督表示学习方面取得了显著成功。然而，有效地将 VLMs 应用到下游任务仍具有挑战性...

0 阅读 1.1k
爱笑的小姐姐 · 1月21日

EFTViT: 在资源受限的边缘设备上对带遮罩图像的视觉变换器的高效联合训练！

联邦学习的研究最近从卷积神经网络（CNNs）转向了视觉 Transformer （ViTs），因为 ViTs 具有更优越的能力。由于 ViTs 缺乏 CNN 固有的 ...

2 阅读 830
爱笑的小姐姐 · 1月17日

武大提出 Point Teacher，两阶段去噪，让小物体点标注检测更可靠！

细小物体由于其有限的空间分辨率，往往呈现出点状分布的特点。因此，使用点级监督进行边界框预测自然且成本效益高，成为传统框级监督的...

0 阅读 1.2k
地瓜机器人 · 1月14日

探索具身智能边界，地瓜机器人邀你共战ICRA 2025 Sim2Real挑战赛

清华大学智能产业研究院（AIR）联合地瓜机器人和求之科技，将在机器人领域旗舰会议ICRA 2025上主办第四届Sim2Real挑战赛（以下简称 "S2R...

0 阅读 1k
地瓜机器人 · 1月13日

开放词汇检测新晋SOTA：DOSOD实时检测算法详解

在计算机视觉领域，目标检测技术一直是研究的热点与难点。随着应用场景的不断拓展，传统的闭集检测逐渐显露出其局限性，开放词汇检测（O...

0 阅读 979
超神经HyperAI · 1月9日

从计算机视觉走向医疗AI，对话上海交大谢伟迪：定义问题比解决问题更重要

2012 年，在传说中的「末日之年」，移动互联网迎来了爆发期。随着 3G 网络的普及、智能手机价格下探，加之微信、米聊为代表的类通信应用...

1 阅读 561
爱笑的小姐姐 · 1月3日

突破无配对难题，N2D3 助力夜间图像日间化！

夜间到日间翻译（Night2Day）旨在实现夜间场景的日间视觉。然而，在无配对条件下处理具有复杂降质的夜间图像仍然是一个重大的挑战。之前...

0 阅读 1k

上一页
1
2
3
4
5
…
下一页

频道介绍

聚焦中国智能计算生态，探索智联世界的无限可能。

提问题写文章

推荐专栏

安谋科技

147 篇内容 · 17762 关注

Arm技术博客

1097 篇内容 · 23767 关注

此芯AI PC开发套件瑞莎“星睿O6”

40 篇内容 · 3529 关注

腾讯技术工程

263 篇内容 · 8180 关注

灵动Mini-F5375-OB开发板

32 篇内容 · 1894 关注

推荐用户

极术小姐姐

贡献 68372 声望

baron

贡献 5975 声望

徽州骆驼

贡献 12545 声望

vesperW

贡献 4890 声望

爱笑的小姐姐

贡献 9435 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息