计算机视觉下最新的文章 - 极术社区 - 连接开发者与智能计算生态

计算机视觉

人工智能细分领域

关注标签

关注数

5

内容数

942

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

ronghuaiyang · 2022年03月08日

M-CenterNet：多中心点的CenterNet

本文针对小目标检测，在CenterNet上进行了改进，将CenterNet上的一个中心点改成了4个中心点，取得了不错的效果，改动很小，但很有效。

2 阅读 3.1k
深圳湾 · 2022年03月04日

戴上 AR 眼镜，漫步莫奈花园、对话梵高和达·芬奇，与 366 幅真迹零距离

存放在意大利米兰圣玛丽亚修道院的达·芬奇《最后的晚餐》，在 1517 年就开始出现皲裂，颜料也开始变质，脱落掉色严重，即使有幸亲临现场...

2 阅读 1.2k
July · 2022年03月04日

恒源云(Gpushare)_UNIRE：一种可以共享标签空间的方法

文章来源 | 恒源云社区原文地址 | UNIRE：一种用于实体关系抽取的统一标签空间原文作者 | Mathor参考链接Abstract(Zhong and Chen,ACL20...

1 阅读 1.2k
ronghuaiyang · 2022年03月04日

TTFNet：改进CenterNet，使得训练时间缩短7倍

本文是对CenterNet的一种改进，主要是增加了训练时参与回归的样本，提升了收敛速度，加快了训练时间，同时使用了椭圆高斯核来代替Center...

0 阅读 2.2k
爱笑的小姐姐 · 2022年03月03日

基于OpenCV的行人目标检测

目标检测支持许多视觉任务，如实例分割、姿态估计、跟踪和动作识别，这些计算机视觉任务在监控、自动驾驶和视觉答疑等领域有着广泛的应...

2 阅读 2.5k
深圳湾 · 2022年03月02日

讯飞翻译笔漫威礼盒版体验：娃的伴学利器，夯实听说读记四项基本功

愉快的寒假结束了，正当家长们满怀期待的准备将娃娃们投递到学校的时候，因为疫情蔓延，一些地区投递出的「包裹」又被学校退了回来。

1 阅读 1.6k
ronghuaiyang · 2022年02月28日

论文解读，物体检测中的解耦检测头

这篇文章提供了一种使用不同proposal来分别做检测和分类的二阶段物体检测方法，相比之前的方法有稳定的performance的提升。

3 阅读 3.7k
阿里云CloudImagine · 2022年02月25日

解码北京冬奥沉浸式报道黑科技：阿里云视频云「互动虚拟演播技术」

“虚拟演播厅”在东京奥运会就曾进入奥运村，而在2022冬奥期，其技术方案全面升级，达到广电级导播效果的同时，接入门槛极大降低，大大拓...

12 阅读 1.3k
瑞芯微Rockchip · 2022年02月23日

瑞芯微发布新一代机器视觉方案RV1106及RV1103

瑞芯微电子股份有限公司（以下简称“瑞芯微”）正式发布新一代机器视觉方案RV1106及RV1103，两颗芯片在NPU、ISP、视频编码、音频处理等性...

7 阅读 2.1k
AI学习者 · 2022年02月23日

超越ConvNeXt | 大道至简，VAN用普通卷积，登顶Backbone性能巅峰（附代码解读）

虽然self-attention最初是为自然语言处理(NLP)任务而设计的，但最近却席卷了各种计算机视觉领域。然而，图像的二维性质给在计算机视觉中...

3 阅读 2.1k
阿里云CloudImagine · 2022年02月22日

揭秘2022冬奥黑科技，阿里云视频云「Cloud ME」如何实现全息会面？

2022北京冬奥会本是一届非凡的存在，这是有史以来第一次将奥运会所需的全部核心系统全面上云，以数字化技术创造奥运的新纪元。

18 阅读 1.4k
阿里云CloudImagine · 2022年02月18日

百年奥运的凌空之美，AI 云智剪背后的新算法

奥运赛事每天都在上演冰雪奇迹，而捕捉发生瞬间，凝结最精彩、最动人的体育人文画面，让“冰之舞”、“雪之舞”、“速度之美”、“凌空之美”如...

10 阅读 1.1k
AI学习者 · 2022年02月17日

Detectron2、MMDetection、YOLOv5都通用的小目标检测解决方案

检测小目标和远程目标检测是监控应用中的一个主要挑战。这些物体由图像中少量的像素表示，缺乏足够的细节，使得传统的检测器难以检测。...

3 阅读 2.2k
NVIDIA英伟达嵌入式系统 · 2022年02月15日

NVIDIA Jetson Nano 2GB 系列文章（51）：图像分类法实现找路功能

避撞功能是智能车的最基本保护能力，Jetbot 使用深度学习的图像分类技术来模拟人眼习惯实现这个功能，但这只是智能车所展现的最入门应用...

20 阅读 1.8k
深圳湾 · 2022年02月15日

专利显示，苹果 MR 眼镜将通过光学音频传输技术获得无损音频

据 Patently Apple 报道的一项专利，苹果正在研究一种新的光学音频传输技术，或将应用于传闻中的苹果 MR 眼镜。

6 阅读 1k
AI学习者 · 2022年02月15日

ShiftViT用Swin Transformer的精度跑赢ResNet的速度

注意力机制被广泛认为是Vision Transformer(ViT)成功的关键，因为它提供了一种灵活和强大的方法来建模空间关系。然而，注意力机制真的是...

3 阅读 1.6k
AI学习者 · 2022年02月11日

使用OpenCV对运动员的姿势进行检测

如今，体育运动的热潮日益流行。同样，以不正确的方式进行运动的风险也在增加。有时可能会导致严重的伤害。考虑到这些原因，提出一种以...

1 阅读 1.8k
旷视研究院 · 2022年02月10日

聊聊旷厂黑科技 | 动作识别与检索带你体验视频时代“人工智能”新玩法

北京冬奥会正在展开激烈的赛事角逐，与体育相关的话题持续刷屏，全民健身也蓬勃发展。那么大家是否想象过，当人工智能与体育相遇，会碰...

25 阅读 2.1k
AI学习者 · 2022年02月10日

最轻、最强的Vision Transformer Backbone

Transformers在许多视觉任务中都很成功，因为它们具有捕捉长期依赖性的能力。然而，它们的二次计算复杂度阻碍了将它们应用于需要密集预...

2 阅读 2.8k
ronghuaiyang · 2022年02月09日

对物体检测中分类和定位的重新思考

这篇文章对物体检测器的head进行深入的研究，提出了Double-Head-Ext 的方法，效果对比基线模型有明显的提升。

4 阅读 2k

上一页
1
…
21
22
23
24
25
…
下一页

本月贡献榜

AI学习者

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息