AI 应用

安谋科技自研产品

SoC 芯片设计

IoT 与嵌入式

教育与职场

合作伙伴

不限文章问答人工智能 AI 芯片自动驾驶计算机视觉语音识别大模型 ...
AI学习者 · 2024年04月19日

图片、视频修复并超分 – Real-ESRGAN项目使用（一） | 机器学习

前段时间一直在弄golang，很少关注一些开源项目。正巧碰到一个，可以将模糊的照片或者视频修复清晰，且可以超分处理的项目。

2 阅读 3.9k
AI学习者 · 2024年04月18日

计算机视觉（ CV）的发展史

计算机视觉是深度学习领域最热门的研究领域之一，目前在各领域应用广泛，而它是如何发展至今，让我们一起回顾一下计算机视觉的发展史。

3 阅读 7.3k
AI学习者 · 2024年04月17日

PSPNet ：语义分割

随着卷积神经网络在目标检测任务上的推进，它也开始被用于更精细的图像处理任务：语义分割和实例分割。目标检测只需要预测图像中每个对...

1 阅读 2.8k
AI学习者 · 2024年04月10日

[小白入门]基于ERFNet车道线检测入门语义分割

AiStudio是一个很好的学习平台，我相信无时无刻都有很多像我一样的小白出于对人工智能的兴趣，而汇聚在这里。这一次，我想做一个入门级...

5 阅读 3.6k
AI学习者 · 2024年04月03日

基于PaddlePaddle复现的PeleeNet

PeleeNet: An efficient DenseNet architecture for mobile devices

8 阅读 3.2k
Happy · 2024年04月01日

CPU推理1ms的SHViT Backbone 来啦

近期，高效的视觉 Transformer 在资源受限的设备上展现出优异的低延迟性能。传统上，它们在宏观层面上采用4×4的块嵌入和4阶段结构，同时...

0 阅读 3.9k
AI学习者 · 2024年03月27日

LSTM模型分析

LSTM是一种RNN模型。RNN和CNN可以是DL的两种重要模型。CNN主要处理空间结构数据，RNN主要处理时间序列数据。但也不是绝对，本文中用作pr...

3 阅读 2.9k
AI学习者 · 2024年03月26日

PointNet系列论文阅读与理解

PointNet是斯坦福大学研究人员提出的一种点云处理网络，其可以直接输入无序点云集合进行处理，而不像基于投影的方法需要先对点云进行预...

1 阅读 3k
AI学习者 · 2024年03月20日

ResNeXt学习

ResNeXt是由何凯明团队在2017年CVPR会议上提出来的新型图像分类网络。ResNeXt是ResNet的升级版，在ResNet的基础上，引入了cardinality的...

11 阅读 1.8k
AI学习者 · 2024年03月15日

PyTorch ResNet实现图像分类(从模型的训练到Android部署)

采用kaggle上的猴子数据集，包含两个文件：训练集和验证集。每个文件夹包含10个标记为n0-n9的猴子。图像尺寸为400x300像素或更大，并且...

0 阅读 2.4k
爱笑的小姐姐 · 2024年03月13日

卷积神经网络学习笔记——DenseNet

这里结合网络的资料和DenseNet论文，捋一遍DenseNet，基本代码和图片都是来自网络，这里表示感谢，参考链接均在后文。

3 阅读 1.9k
爱笑的小姐姐 · 2024年03月08日

阿里提出Mamba in Mamba | 比现有SOTA提速10倍，GPU使用减少73.4%

得益于基础模型的发展，红外小目标检测（ISTD）算法取得了显著进展。特别是，结合卷积网络和 Transformer 结构的模型能够很好地提取局部...

7 阅读 4.6k
AI学习者 · 2024年03月07日

ShuffleNetv2与Transformer结合，重塑YOLOv7成就超轻超快YOLO

随着移动计算技术的迅速发展，在移动设备上部署高效的目标检测算法成为计算机视觉领域的一个关键研究点。本研究聚焦于优化YOLOv7算法，...

2 阅读 3k
Happy · 2024年03月05日

"羊驼"入侵CV，美团&浙大沈春华团队将LLaMA向CV扩展，构建全新基础模型VisionLLaMA

大型语言模型构建在基于Transformer的架构之上来处理文本输入, LLaMA 系列模型在众多开源实现中脱颖而出。类似LLaMa的Transformer可以用...

1 阅读 1.8k
电子烂人 · 2024年03月04日

【聆思CSK6 视觉AI开发套件试用】2.套件Linux开发环境搭建和坐姿示例演示

春节假期耽误了些许时间，原定的项目因为一些原因被暂时搁置了聆思CSK6 语音视觉多功能开发套件主打一个视觉和显示交互，这里决定先试...

0 阅读 1.3k
微帧Visionular · 2024年02月28日

陆海×微帧，在海洋卫星传输环境下的极限视频压缩

助力海洋经济发展，微帧与陆海科技达成合作，在窄带网络环境下对视频进行实时极致编码压缩，提升视频画质，进一步促进航海安全。

3 阅读 1.5k
NVIDIA英伟达嵌入式系统 · 2024年02月28日

在线研讨会 | 使用适用于 NVIDIA Jetson 的微服务加速边缘 AI 开发

研讨会安排主题：使用适用于 NVIDIA Jetson 的微服务加速边缘 AI 开发时间：2024 年 3 月 6 日（周三）凌晨 0:00 - 1:00（北京时间）边...

0 阅读 1.5k
爱笑的小姐姐 · 2024年02月26日

Safety-Adapted Loss | 让行人目标检测器也具有安全意识，行人不被漏检误检

在像自动驾驶（AD）这样的安全关键领域，目标检测器的错误可能会危及行人和其他脆弱的道路使用者（VRU）。由于常见的评估指标不能充分指...

17 阅读 1.2k
微帧Visionular · 2024年02月20日

微帧为央视大年初二《2024春节戏曲晚会》提供AI画质增强服务

玉兔辞旧岁，金龙启新程。甲辰龙年正月初二，以“龙兴九州福聚四海”的主题，打造戏曲表达新样态，传递戏曲文化氛围的《2024年春节戏曲晚...

1 阅读 1.5k
汀丶人工智能 · 2024年02月19日

探索AI视频生成新纪元：文生视频Sora VS RunwayML、Pika—谁将引领未来

由于在AI生成视频的时长上成功突破到一分钟，再加上演示视频的高度逼真和高质量，Sora立刻引起了轰动。在Sora横空出世之前，Runway一直...

0 阅读 1.4k
NVIDIA英伟达嵌入式系统 · 2024年01月30日

利用 NVIDIA Metropolis 微服务和 API 在边缘构建视觉 AI 应用

NVIDIA Metropolis 微服务提供功能强大且可自定义的云原生 API 和微服务，用于开发视觉 AI 应用和解决方案。该框架现在涵盖 NVIDIA Jets...

2 阅读 2.2k
NVIDIA英伟达嵌入式系统 · 2024年01月29日

NVIDIA 发布适用于 Jetson 的 Metropolis 微服务

边缘视觉 AI 应用的开发周期往往漫长且昂贵。同时，快速开发灵活、安全的云原生边缘 AI 应用的重要性也变得前所未有。现在，全新 NVIDIA...

1 阅读 2.2k
Happy · 2024年01月19日

华科王兴刚团队首次将Mamba引入ViT，更高精度、更快速度、更低显存！

在Transformer如日中天时，一个称之为“Mamba”的架构横冲出世，在语言建模上与Transformers不相上下，具有线性复杂度，同时具有5倍的推理...

2 阅读 5k
爱笑的小姐姐 · 2024年01月12日

【YOLOv8新玩法】姿态评估解锁找圆心位置

Hello大家好，今天给大家分享一下如何基于深度学习模型训练实现圆检测与圆心位置预测，主要是通过对YOLOv8姿态评估模型在自定义的数据集...

3 阅读 4k
AI学习者 · 2024年01月08日

Improved TokenPose | 让TokenPose享受稀疏的快，又拥有高精度

近年来，视觉Transformer及其各种形式在人体姿态估计中具有重要意义。通过将图像块视为Token，Transformer可以明智地捕获全局关系，通过...

1 阅读 3.4k
AI学习者 · 2024年01月04日

实战 | YOLOv8实现CBC细胞计数

数据集包含 360 张红血细胞图像及其注释文件，分为训练集与验证集。训练文件夹包含 300 张带有注释的图像。测试和验证文件夹都包含 60 ...

6 阅读 3.7k
深圳湾 · 2023年12月28日

引领空间计算时代，雷鸟自研大模型语音助手 Rayneo AI 发布

12 月 27 日，中国市占第一的消费级 AR 品牌雷鸟创新发布大模型语音助手 Rayneo AI（beta 版），并通过雷鸟 X2 消费级真 AR 眼镜内测上线。

2 阅读 4.6k
Happy · 2023年12月28日

BFRffusion | 面向真实世界的盲人脸复原，中山大学提出全新盲人脸复原基准数据集

人脸盲复原是计算机视觉领域的一个重要课题，由于其广泛的应用而受到人们的广泛关注。在这项工作中，我们深入研究了利用预训练的稳定扩...

1 阅读 5k
AI学习者 · 2023年12月27日

华为诺亚实验室+中科大提出TinySAM | 比SAM小10倍，但是依旧完成了精度的超车！

最近，Segment Anything Model (SAM) 已经展示出了强大的分割能力，在计算机视觉领域引起了广泛关注。基于预训练的 SAM 的大量研究工作...

2 阅读 4k
AI学习者 · 2023年12月25日

2D检测教3D检测做事情，YOLOv7让BEVFusion无痛涨6个点，长尾也解决了

自动驾驶车辆（AVs）必须准确检测来自常见和罕见类别的物体，以确保安全导航，这催生了长尾3D目标检测（LT3D）的问题。当代基于激光雷达...

0 阅读 3.3k

上一页
1
2
3
4
5
…
下一页

频道介绍

聚焦中国智能计算生态，探索智联世界的无限可能。

提问题写文章

推荐专栏

安谋科技

146 篇内容 · 17664 关注

Arm技术博客

1097 篇内容 · 23761 关注

此芯AI PC开发套件瑞莎“星睿O6”

40 篇内容 · 3430 关注

腾讯技术工程

263 篇内容 · 8178 关注

灵动Mini-F5375-OB开发板

32 篇内容 · 1797 关注

推荐用户

极术小姐姐

贡献 64602 声望

baron

贡献 5975 声望

徽州骆驼

贡献 12455 声望

vesperW

贡献 3115 声望

爱笑的小姐姐

贡献 7725 声望

极术微信服务号

关注极术微信号
实时接收点赞提醒和评论通知

安谋科技学堂公众号

关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源

安谋科技招聘公众号

关注安谋科技招聘
实时获取安谋科技中国职位信息