计算机视觉下最新的文章 - 极术社区 - 连接开发者与智能计算生态

计算机视觉

人工智能细分领域

关注标签

关注数

5

内容数

941

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

爱笑的小姐姐 · 2023年08月07日

无惧暗光！| PE-YOLO: 夜视环境物体检测新突破（附源码实现）

TL;DR: 本文核心内容在于解决在暗光照射条件下进行物体检测的问题。作者建立了一个名为PE-YOLO的暗光物体检测框架，它将金字塔增强网络(...

0 阅读 3.6k
汀丶人工智能 · 2023年07月31日

中文多模态医学大模型智能分析X光片，实现影像诊断，完成医生问诊多轮对话

最近，通用领域的大语言模型 (LLM)，例如 ChatGPT，在遵循指令和产生类似人类响应方面取得了显著的成功，这种成功间接促进了多模态大模...

1 阅读 2.2k
爱笑的小姐姐 · 2023年07月31日

大连理工联合阿里达摩院发布HQTrack | 高精度视频多目标跟踪大模型

Title: Tracking Anything in High Quality PDF: [链接]Code: [链接]

1 阅读 2.5k
Happy · 2023年07月26日

ICCV2023 | 将隐式神经表征用于低光增强，北大张健团队提出NeRCo

本文聚焦于解决制约暗光算法应用的三个问题：训练集和现实暗光场景的退化特征的差异，现有的评价指标不能很好地衡量人眼感知质量，以及...

0 阅读 3.6k
超神经HyperAI · 2023年07月13日

爬取 2 万多张 Flickr 图片，莫纳什大学复现 10 年间日本樱花开放的时空特征

内容一览：近年来，全球气候变化形势严峻，由此引发的蝴蝶效应，正深刻地影响着人类和大自然。在这一背景下，收集数百甚至数千公里范围...

24 阅读 1.9k
汀丶人工智能 · 2023年07月12日

深度学习应用篇-计算机视觉-视频分类[8]：TimeSformer无卷积视频分类方法、注意力机制

视频流的爆炸性增长为以高精度和低成本执行视频理解任务带来了挑战。传统的2D CNN计算成本低，但无法捕捉视频特有的时间信息；3D CNN可...

2 阅读 1.5k
深圳湾 · 2023年07月12日

宝马为摩托车配上了 HUD 骑行眼镜，单目 AR 彩色显示

年初 CES 2023 展会上，宝马向我们展示了一台「新世代」车型：数字情感交互概念车 BMW i Dee。在几十分钟的演示中，观众犹如在看一段科...

6 阅读 1.8k
微帧Visionular · 2023年07月11日

Hudl × 微帧，为美国运动分析平台提供极致视频编码服务

不久前，Hudl对外官宣了与微帧科技的合作，正式公布在其平台内融合微帧的WZ264及WZ265智能编码引擎，以提供更清晰的视频效果，帮助教练...

17 阅读 1.4k
汀丶人工智能 · 2023年07月11日

深度学习应用篇-计算机视觉-OCR[7]：OCR综述、常用CRNN识别方法、DBNet检测方法等

OCR(Optical Character Recognition,光学字符识别)是指对图像进行分析识别处理，获取文字和版面信息的过程，是典型的计算机视觉任务，通...

7 阅读 1.6k
脑极体 · 2023年07月10日

数字孪生，建设智慧城市的新型“加速器”

今天，中国的城市，在历经十余年的“智慧城市”建设后已经被赋予了数智融合的全新解读。随着近年来5G、云计算、人工智能爆发式能量增长，...

29 阅读 1.3k
AI学习者 · 2023年07月10日

Backbone创新 | 中科大联合百度提出全新Transformer Backbone

当前，Vision Transformer（ViT）在许多视觉任务中占据主导地位。通过Token稀疏化或降维（在空间或通道上）来解决其Token多Head自注意力...

21 阅读 2.4k
汀丶人工智能 · 2023年07月10日

深度学习应用篇-计算机视觉-语义分割综述[6]：DeepLab系列简介深入解读创新点

作者发现Deep Convolutional Neural Networks (DCNNs) 能够很好的处理的图像级别的分类问题，因为它具有很好的平移不变性（空间细节信息...

18 阅读 1.7k
汀丶人工智能 · 2023年07月09日

深度学习应用篇-计算机视觉-语义分割综述[5]：FCN、SegNet、Deeplab等分割算法

目前，计算机视觉是深度学习领域最热门的研究领域之一。从广义上来说，计算机视觉就是要“赋予机器自然视觉的能力”。实际上，计算机视觉...

13 阅读 1.5k
汀丶人工智能 · 2023年07月08日

深度学习应用篇-计算机视觉-目标检测[4]：综述、边界框、锚框、交并比、非极大值抑制、SoftNMS

对计算机而言，能够“看到”的是图像被编码之后的数字，它很难理解高层语义概念，比如图像或者视频帧中出现的目标是人还是物体，更无法定...

0 阅读 1.4k
汀丶人工智能 · 2023年07月07日

深度学习应用篇-计算机视觉-图像分类[3]：Vision Transformer等模型特点详细介绍

相较于VGG的19层和GoogLeNet的22层，ResNet可以提供18、34、50、101、152甚至更多层的网络，同时获得更好的精度。但是为什么要使用更深...

15 阅读 1.8k
汀丶人工智能 · 2023年07月06日

深度学习应用篇-计算机视觉-图像分类[2]：LeNet、VGG、DarkNet模型特点详细介绍

LeNet是最早的卷积神经网络之一[1]，其被提出用于识别手写数字和机器印刷字符。1998年，Yann LeCun第一次将LeNet卷积神经网络应用到图像...

23 阅读 1.6k
AI学习者 · 2023年07月06日

图视觉模型崛起 | MobileViG同等精度比MobileNetv2快4倍，同等速度精度高4%！

传统上，卷积神经网络（CNN）和Vision Transformer（ViT）主导了计算机视觉。然而，最近提出的Vision Graph神经网络（ViG）为探索提供了...

32 阅读 2.4k
汀丶人工智能 · 2023年06月29日

人工智能领域：面试常见问题超全：深度学习基础、计算机视觉、自然语言处理、推荐系统、强化学习、

人工智能领域：面试常见问题超全（深度学习基础、卷积模型、对抗神经网络、预训练模型、计算机视觉、自然语言处理、推荐系统、模型压缩...

3 阅读 1.8k
汀丶人工智能 · 2023年06月23日

深度学习进阶篇[7]：Transformer模型长输入序列、广义注意力、FAVOR+快速注意力

基于Transformer模型在众多领域已取得卓越成果，包括自然语言、图像甚至是音乐。然而，Transformer架构一直以来为人所诟病的是其注意力...

0 阅读 1.1k
爱笑的小姐姐 · 2023年06月13日

小目标检测那点事

本文首发于 CVHub，白名单账号转载请自觉植入本公众号名片并注明来源，非白名单账号请先申请权限，违者必究。

0 阅读 3.5k

上一页
1
…
6
7
8
9
10
…
下一页

本月贡献榜

AI学习者

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息