计算机视觉下最新的文章 - 极术社区 - 连接开发者与智能计算生态

计算机视觉

人工智能细分领域

关注标签

关注数

5

内容数

941

提问题写文章

标签主页标签问答标签文章

相关标签

标签文章

最新的 · 最热的

AI学习者 · 2023年12月07日

干货 | OpenCV实现边缘模板匹配算法

OpenCV中自带的模板匹配算法，完全是像素基本的模板匹配，特别容易受到光照影响，光照稍微有所不同，该方法就会歇菜了！搞得很多OpenCV...

1 阅读 2.7k
汀丶人工智能 · 2023年12月04日

人工智能的新篇章：深入了解大型语言模型(LLM)的应用与前景

LLM（Large Language Model）技术是一种基于深度学习的自然语言处理技术，旨在训练能够处理和生成自然语言文本的大型模型。

2 阅读 3.1k
AI学习者 · 2023年11月29日

一文综述，未来已来 | 视觉和大语言模型的未来是什么？必然结连理实现多模态大模型

探索多模态语言模型整合了多种数据类型，如图像、文本、语言、音频等异质性。尽管最新的大型语言模型在基于文本的任务上表现出色，但它...

0 阅读 1.9k
汀丶人工智能 · 2023年11月21日

激发创新，助力研究：CogVLM，强大且开源的视觉语言模型亮相

CogVLM 是一个强大的开源视觉语言模型（VLM）。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数。

2 阅读 2.5k
Happy · 2023年11月09日

SBCFormer | 为树莓派而设计，1fps + 80.0%

计算机视觉在不同领域解决已成为解决实际问题的常用方法，如智慧农牧管理。这类场景并不需要每秒处理许多帧，此时树莓派这类单板主机就...

2 阅读 2.5k
阿白_nano · 2023年11月07日

【聆思CSK6 LNN工具体验】自定义数据集的分类模型训练及产品使用踩坑

基于自定义数据集的咖啡豆颜色分类生成和cifar-100一样格式的数据集数据集有4类，分别为Dark,Green,Light,Medium上面这段代码可以生成tr...

0 阅读 1.1k
爱笑的小姐姐 · 2023年11月06日

超越 GLIP! | RegionSpot: 识别一切区域，多模态融合的开放世界物体识别新方法

本文的主题是多模态融合和图文理解，文中提出了一种名为RegionSpot的新颖区域识别架构，旨在解决计算机视觉中的一个关键问题：理解无约...

1 阅读 2.8k
AI学习者 · 2023年11月03日

CodeFormer |方便快捷的人脸修复工具

无意中从一个群里看到的一个截图，说是CodeFormer做的，搜索一下github发现了这个人脸修复的神器，github的地址如下：

2 阅读 2.3k
AI学习者 · 2023年10月30日

助力目标检测涨点 | 可以这样把Vision Transformer知识蒸馏到CNN模型之中

资源受限的感知系统，例如边缘计算和面向机器人视觉，要求视觉模型在计算和内存使用方面既准确又轻量化。虽然知识蒸馏是增强轻量级分类...

1 阅读 2.1k
this512 · 2023年10月30日

搞了个视频翻译和配音工具，使用whisper,edgeTTS

近来得空研究了下视频翻译，即将某种语言的视频处理后，显示另一种语言的字幕并使用该语言进行配音。最终实现了这种效果:

1 阅读 3.3k
脑极体 · 2023年10月24日

我们距离“裸眼3D自由”，还有多远？

后来，我也曾去过很多城市，看过不少策划精良的展览。那场“穿越北宋”的名画之旅，依然是我看过的，最具沉浸感的一场文化类展演，没有之一。

0 阅读 1.5k
爱笑的小姐姐 · 2023年10月23日

Waymo提出全新Fusion方法LEF | 让3D目标检测的难度再次降低！

作者提出了一种用于使用时间LiDAR点云进行3D目标检测的Late-to-Early循环特征融合方案。作者的主要动机是将具有目标感知能力的潜在嵌入...

1 阅读 2.4k
chenxigood · 2023年10月22日

聆思CSK6 LNN工具体验搭建智能机器人

背景收到试用套件有一段时间了，放假回来一直在调试另外一个项目，导致这个事情一直拖到现在还没搞完。在这里初步记录一下目前搞到的阶...

0 阅读 2.1k
AI学习者 · 2023年10月20日

OpenAI图像检测工具曝光，CTO：AI生成的99%都能认出

OpenAI要出手AI图像识别了。最新消息，他们公司正在开发一种检测工具。根据首席技术官Mira Murat透露：该工具精度非常高，正确率可达99%...

4 阅读 2.3k
汀丶人工智能 · 2023年10月12日

数字时代的自我呈现：探索个人形象打造的创新工具——FaceChain深度学习模型工具

FaceChain是一个可以用来打造个人数字形象的深度学习模型工具。用户仅需要提供最低一张照片即可获得独属于自己的个人形象数字替身。Face...

2 阅读 2.7k
胖墩墩 · 2023年10月12日

【聆思CSK6 LNN工具体验】LNN训练体验（下）

在上一篇博文中，我们已经学会了使用工具生成自己需要的模型。接下来我们一起看看如何部署，模型在设备上。

3 阅读 2.2k
超神经HyperAI · 2023年10月12日

有 AI，无障碍，AIoT 设备为视障人群提供便利

据世界卫生组织统计，全球共 22 亿人视力受损，包含 2.85 亿视障人群和 3,900 万全盲人群。而且，这一数字将随老龄化加剧不断增加。虽...

2 阅读 2.1k
AI学习者 · 2023年10月08日

腾讯实验室提出GOLO | 实在优雅！一个简洁的像YOLO的DETR目标检测器来啦！！

自从DETR发布以来，基于 Query 的目标检测器已经取得了显著的进展。然而，大多数现有方法仍然依赖于多阶段的编码器和解码器，或者两者的...

17 阅读 2.5k
爱笑的小姐姐 · 2023年09月25日

DEYOv3来袭 | YOLOv8+DETR造就实时端到端目标检测，无需NMS(主打吸引不开源)

最近，端到端的目标检测器因其出色的性能而受到研究界的广泛关注。然而，DETR通常依赖于在ImageNet上进行Backbone网络的监督预训练，这...

0 阅读 4.5k
爱笑的小姐姐 · 2023年09月21日

中山大学提出MFL-YOLO | 多特征交互损失让YOLOv5再次焕发性能SOTA的光彩！

交通标志是确保交通安全和顺畅通行的重要设施，但由于许多原因可能会受到损坏，这会带来很大的安全隐患。因此，研究一种检测损坏交通标...

16 阅读 3k

上一页
1
…
4
5
6
7
8
…
下一页

本月贡献榜

AI学习者

贡献 5 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息