近日,字节跳动正式推出「Coze 扣子」AI Bot 开发平台。任何用户都可以快速、低门槛地搭建自己的 Chatbot,且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道。
苹果的笔记本,现在基本都要替换为自研的 M1 CPU了。据说,M1 跑深度学习也很快,那到底有多快呢。
今天,分享一个新发布的基于 YOLOv5 的开源库,提供了多种 backbone和压缩工具,以及 FastAI 发布的一本电子书。
Location-Sensitive Visual Recognition with Cross-IOU Loss
在轻松掌握 MMDetection 中常用算法(一):RetinaNet 及配置详解一文中,对经典 one-stage 目标检测算法 RetinaNet 以及相关配置参数进行了详细说明,本文解读经典 two-stage 算法 Faster R-CNN 以及改进版 Mask R-CNN。需要特别注意的是:如果涉及到和 RetinaNet 相同的配置,本文不再进一步描述,读者请查看 RetinaNet ...
本系列文章则从框架中已经实现的一些常用算法入手,通过对这些算法进行深度解析,使读者能够对 MMDetection 有进一步深入理解。
TFace是由腾讯优图实验室研发的人脸识别算法研究项目,其中TFace中的T意为“trusty”,表达了团队在可信人脸识别技术方向上的愿景。人脸识别算法是指在检测到人脸并定位面部关键特征点之后,裁剪出主要的人脸区域,并经过预处理后馈入后端的识别算法。因为有着方便友好、易于接受、不易伪造等一系列优点,在过去30多年里,...
图像金字塔:经典的基于简单矩形特征(Haar)+级联Adaboost与Hog特征+SVM的DPM目标识别框架,均使用图像金字塔的方式处理多尺度目标,早期的CNN目标识别框架同样采用该方式,但对图像金字塔中的每一层分别进行CNN提取特征,耗时与内存消耗均无法满足需求。_但该方式毫无疑问仍然是最优的。_值得一提的是,其实目前大多数深...
鱼与熊掌不可兼得,深度学习领域中的几个指标有时也是这样,经常顾此失彼,速度和精度就是最常见的一对需要权衡的指标。那么,我们应该怎么权衡呢?
注意力机制可以说近几年来非常火热,那么,注意力机制的来源和发展现状是什么呢?大家跟随作者好好先生,一起来看看吧。
我是来自山区、朴实、不偷电瓶的AI算法工程师阿chai,给大家分享人工智能、自动驾驶、机器人、3D感知相关的知识
作者:元峰转自:AIZOO 从去年5月开始,我一直对Anchor-free工作保持着一定的关注。本次借组内的paper reading分享的契机,整理了与Anchor free相关的一些工作。一方面是分享近期在目标检测领域中一些工作,另一方面,和大家一起梳理一下去年非常火热的网络模型CenterNet、FCOS,当我们把他们迁移到分割、多目标追踪等其...
作为CV算法工程师,在工作中的应该保持怎么样的心态,关于算法方面应该怎么提高效率。本文为作者在CV岗位上的工作反思,同为打工人的大家可以作为一个经验参考。
AI能力进行服务端部署并不是任何时候都适用,在未来,可能大多数时候都不适用。Gemfield来列举几个场景:
Faster R-CNN 最早在 2015 年的 NIPS 发布。其在发布后经历了几次修改,这在之后博文中会有讨论。Faster-RCNN 是 RCNN 系列论文的第三次迭代,这一系列论文的一作和联合作者是 Ross Girshick。
作者: AIZOO转自:AIZOO本文来自: 商汤学术 已获得授权转载太长不看系列MMOCR 具有以下特点:全流程:支持文字检测、文字识别以及其下游任务,比如关键信息提取等。多模型:我们实现了 10 余种优秀算法。文字检测算法包括单阶段检测算法和双阶段检测算法;文字识别包含规则文字识别和非规则文字识别算法;关键信息提取...
我是来自山区、朴实、不偷电瓶的AI算法工程师阿chai,给大家分享人工智能、自动驾驶、机器人、3D感知相关的知识
目标追踪在工业界是非常实用的,在学术界也是一个热点研究方向,但是一直没有很好的实现多个追踪算法的开源框架。今天,MmLab新增了MMTracking库,可以作为一个很好的baseline。
在训练深度学习模型时,一个非常重要的超参数就是学习率,学习率设置的合理与否,非常影响模型的收敛速度和最终性能。本篇文章为大家总结了科学设置学习率的方法,建议大家阅读收藏~本文来自:[链接] 已获得授权转载 。深度神经网络的参数学习主要是通过梯度下降方法来寻找一组可以最小化结构风险的参数。而学习率在深...
深度学习最火热的方向非计算机视觉莫属,对于计算机视觉方向的工程师,可能大家对我们每天接触的视频流的基本知识了得并不深入,今天,就让我们跟随来自腾讯的小北挖一起,了解一下视频的基础知识。