计算机视觉下最新的文章 - 极术社区 - 连接开发者与智能计算生态

计算机视觉

人工智能细分领域

关注标签

关注数

5

内容数

941

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

阿加犀智能 · 7月16日

高通手机跑AI系列之——姿态识别

(原创作者@CSDN_伊利丹~怒风)环境准备手机测试手机型号：Redmi K60 Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB ，LPDDR5X-8400...

0 阅读 65
AI学习者 · 6月30日

微小目标检测新标杆 | DPNet首创动态神经网络范式，微小目标检测效率跃升35%！

1. 微小目标检测的精度与效率平衡问题：在复杂环境中，精确检测微小物体至关重要，但单纯放大图像会显著增加计算成本和负样本数量，严重...

0 阅读 1.2k
爱笑的小姐姐 · 6月26日

HMPE革新Transformer检测，小目标mAP飙升1.9%，解码器砍掉5层，推理速度翻倍

Query生成不足：现有基于Transformer的检测方法在生成Query时未能充分利用位置、类别和边界框信息，导致在有限数据集上训练时性能欠佳。

0 阅读 1.2k
阿加犀智能 · 6月24日

高通QCS8550部署Yolov8模型

在当今科技飞速发展的时代，边缘计算和人工智能的融合正推动着众多领域的创新变革。而在这一进程中，硬件平台的性能起着至关重要的作用...

0 阅读 282
AI学习者 · 6月23日

小目标检测新标杆，SimAM无参数注意力+NWD指标完胜YOLOv7

红外图像检测中存在复杂背景、低信噪比、小目标尺寸和弱亮度等问题，导致传统方法难以准确检测红外小目标。

1 阅读 1k
爱笑的小姐姐 · 6月5日

Soft 最近邻插值 SNI 对齐特征 +ESD 增强空间保留，效率精度双突破

特征错位问题：传统 FPN 类范式在多尺度检测中通过逐点融合不同层级的特征图，容易导致特征错位问题，从而影响模型性能。

0 阅读 2k
AI学习者 · 5月20日

SAM突破多模态分割 | SAM2+语义记忆模块，实现跨模态语义理解登顶DELIVER

研究主要集中在多模态语义分割（MMSS）领域，其中像素级预测是通过由不同传感器捕获的多个视觉模态得出的。最近，大型视觉模型Segment A...

0 阅读 1k
nihui · 4月23日

【“星睿O6”评测】CPU GPU NPU 摄像头实时 RVM 人像分割和 http 推流

项目开源地址 [链接]cpu/gpu推理：ncnnnpu推理：cix-noe cppusb摄像头、http串流：opencv-mobileusb摄像头型号：m5stack AtomS3R-CAM完...

8 阅读 1k
mlbo · 4月23日

【“星睿O6”AI PC】Ultra Fast Lane Detection V2 NPU部署

文章原名【“星睿O6”AI PC开发套件评测】Ultra Fast Lane Detection V2 NPU部署

2 阅读 791
nihui · 4月15日

【“星睿O6”评测】RVM人像分割torch➡️ncnn-CPU/GPU和o6-NPU部署全过程

标题精简了，原标题是【“星睿O6”AI PC开发套件评测】RVM人像分割torch➡️pnnx➡️cix量化➡️o6-NPU和ncnn-CPU/GPU部署全过程

20 阅读 958
蓝松抠图SDK · 4月15日

OBS直播，怎么在画面中添加时钟

在OBS（Open Broadcaster Software）直播中，添加时钟到直播画面是一个非常实用的功能，特别是对于需要展示实时时间信息的教学、会议、...

0 阅读 711
蓝松抠图SDK · 4月11日

OBS绿幕直播时，绿色物体被抠透明了怎么办

在OBS绿幕直播中，遇到绿色物体被抠透明的问题，无疑是许多主播和直播运营者常常面临的困扰。这一问题不仅影响了直播的专业性，还可能让...

0 阅读 720
超神经HyperAI · 4月10日

上海AI Lab等提出首个全模态医疗图像重识别框架，在11个数据集上的评测达SOTA

在 AI 驱动的医疗影像管理领域，医疗图像重识别 (MedReID) 作为一项关键技术，旨在自动关联来自不同模态、不同时间的患者影像数据，进而...

0 阅读 834
爱笑的小姐姐 · 4月9日

视觉反馈驱动+动态规则细化，7B模型性能跃升50%，碾压10倍大模型

大型视觉-语言模型（LVLMs）通常遵循两阶段训练范式——预训练和监督微调。最近，从语言领域衍生出的偏好优化已成为一种有效的后训练强化...

1 阅读 907
Happy · 4月8日

Adobe 提出 TurboFill！快速图像修复新方法！4 步即可修复高清图像！

论文名：TurboFill: Adapting Few-step Text-to-image Model for Fast Image Inpainting论文链接：[链接]开源代码：[链接]

0 阅读 1k
nihui · 4月4日

【“星睿O6”评测】三套OpenCV，OpenCL/KleidiCV/JPG硬件编码加速测试

【“星睿O6”AI PC开发套件评测】三套OpenCV性能测试，OpenCL加速测试，KleidiCV加速测试，JPG硬件编码加速测试

7 阅读 2.1k
爱笑的小姐姐 · 3月28日

32B 本地部署！阿里开源最新多模态模型：主打视觉语言，数学推理也很强

就在 DeepSeek-V3 更新的同一夜，阿里通义千问 Qwen 又双叒叕一次梦幻联动了——发布Qwen2.5-VL-32B-Instruct。此前开源家族视觉语言模型 ...

1 阅读 915
Happy · 3月26日

ContinuousSR：从离散低分图像中重建连续高分辨高质量信号

中国科学技术大学、华为诺亚实验室、港科大、清华大学等单位联合提出了一种超快速的任意尺度超分方法，ContinuousSR。

0 阅读 1.1k
Happy · 3月21日

CVPR`25 | 让暗光照片秒变电影大片！全球首个可训练的HVI色彩空间，突破低光增强瓶颈！

亮点直击为 LLIE 任务引入了一种新的全球首个可训练的颜色空间，该空间由极化的 HS 和可训练的强度唯一定义。这提供了一个有效工具，消...

9 阅读 1.7k
Happy · 3月13日

面向真实场景图像复原，字节跳动提出扩散复原适配器，表现卓越！

扩散模型在生成高度复杂图像分布方面表现出强大的图像生成能力，可作为图像恢复的有力先验。现有方法常利用 ControNet 等技术，以低质量...

1 阅读 943

上一页
1
2
3
4
5
…
下一页

本月贡献榜

AI学习者

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息