导读:本期为 AI 简报 20210319 期,将为您带来 9 条相关新闻,明日春分,一侯玄鸟至~关于上一期激光枪项目全网资料仅有篇论文,公众号跳转至原文文章即可获取~
本文一共 3300 字,通篇阅读结束需要 7~11 分钟
1. 自动驾驶的实时车道线检测和智能告警 | AI公园
Github:https://github.com/MaybeShewi...
原文:
自动驾驶将在未来十年给旅行带来革命性的变化。目前,自动驾驶应用正在进行各种应用案例的测试,包括乘用车、机器人出租车、自动商业送货卡车、智能叉车和用于农业的自动拖拉机。
自动驾驶需要一个计算机视觉感知模块来理解和导航环境。感知模块的作用包括:
- 检测车道线
- 检测其他物体:车辆、人、环境中的动物
- 跟踪检测到的对象
- 预测他们可能的运动
一个好的感知系统应该能够在各种驾驶条件下 —— 白天/晚上,夏天/冬天,雨雪等等,实时做到这一点。在这篇博客中,我们着眼于一个实时模型,用于检测车道线、其他车辆等,并生成警报。
在这篇博客中,我们探讨了在自动驾驶中准确和快速检测车道线的问题。然后,我们使用YOLOv5来构建对道路上其他物体的理解。这可以用来生成智能警报。
2. 让猛男害羞的AI特效,女友们纷纷笑成了开水壶;李逵、关羽:这是我??? | 量子位
讲真,估计没有一个猛男,能hold得住这个AI特效。
刮掉一层胡子的关羽,年轻了10岁:
猛男们要想制作这样的“刮胡特效”,需要用到一款名为Snapchat的APP。(国内有一款胡子泡泡 APP)
这是个图片分享APP,开发者来自斯坦福,自带许多有意思的特效,拍完照后还能直接分享给自己的好友列表。
虽然Snapchat并未透露他们这个特效背后所用的具体技术,不过采用Deepfake的话,也是可以实现“刮胡子”的效果。
3. ResNets王者回归!当初输给EfficientNets不是架构问题!爷青回! | AI 科技评论
论文地址:https://arxiv.org/abs/2103.07579
GitHub地址(TensorFlow):
谷歌大脑和UC伯克利近期联合发表了一篇论文,这篇论文对何恺明等人2015年发表的ResNet为骨干的ResNets系列网络做了重新的回顾和研究。
大家都知道ResNet自提出以来便取得了巨大的成功,一时之间很多视觉研究工作都会以此为骨干网络,但是近两年来ResNets这一骨干网络的地位逐渐被EfficientNets取代。
根据Papers with Code上ImageNet图像分类的Top-5准确率排行榜,前五名都是基于EfficientNet架构,第六名才是基于ResNet的BiT-L。
在本篇论文中,研究人员提供了两种新策略:
1、如果可能过拟合,则缩放模型深度;否则,缩放模型宽度;
2、增加图像分辨率的速度比以往的论文中推荐的速度更慢。
基于这些想法,研究人员开发了新的架构ResNet-RS。在GPU上训练的结果比较得出,它比EfficientNets快2.1-3.3倍,同时在ImageNet上达到类似的准确率。
在半监督学习中,ResNet-RS达到了86.2%的ImageNet Top-1准确率,同时比EfficientNet-NoisyStudent快了4.7倍。
4. 最强检测 | YOLO V4?都是弟弟! CenterNet2以56.4mAP超越当前所有检测模型 | AI人工智能初学者
Github:https://github.com/xingyizhou...
Paper:
我们都知道目标检测的目的就是找到图像中的所有目标,并识别它们的位置和属于某一类的概率。One-Stage目标检测在一个框架中共同推断位置和类别的概率。通过训练它们最大限度地提高其框的精度和预测概率的精度,并在最后应用到推理之中。
Two-Stage检测器首先发现潜在目标及其位置,然后(在第2阶段)对这些潜在目标进行分类。第1阶段的目的是最大限度地召回目标,而第2阶段是最大限度地在第1阶段过滤的目标。
而本文通过优化Two-Stage的联合概率目标的下界,提出了一个简单的改进标准Two-Stage检测器训练方法。概率处理建议对Two-Stage架构进行更改。具体来说,第1阶段需要推断一个校准目标的似然性,然后应该告知检测器的总体得分。标准区域构建网络(RPN)不能很好地推断出这种可能性,但是许多一级检测器可以。我们展示了如何从任何最新的一级检测器中构建一个概率两级检测器。
实验表明,CenterNet2检测器通过单尺度测试在COCO测试开发上达到了56.4mAP,优于所有已发布的结果。CenterNet2检测器使用轻量级Backbone,在Titan Xp上以33fps的速度在COCO上实现了49.2mAP的性能,优于Scaled YOLOv4。
5. 全球最大的公开人脸数据集 | 清华大学&芯翌科技联合发布 | 量子位
论文地址:https://arxiv.org/abs/2103.04098
官网:
全球最大规模人脸数据集发布。首次包含数百万ID和数亿图片。
这是由芯翌科技与清华大学自动化系智能视觉实验室合作,所推出的 WebFace 260M,相关研究已被CVPR 2021接收。
并且,基于其所清洗的数据集 WebFace42M,在最具挑战IJBC测试集上,也已经达到了SOTA水平。
而它所带来的“全球之最”还不止于此。
以这项数据集为基础,芯翌科技在最新一期的NIST-FRVT榜单上,戴口罩人脸识别评测中斩获世界第一。
6. NLP领域的首次Hard Label黑盒攻击! | 夕小瑶的卖萌屋
Github:
前段时间已经和大家分享了两篇关于NLP Privacy的文章。今天,我们又来给大家推送优质论文了(公众号学习法)。其实,NLP与其他方向的跨界结合这段时间层出不穷,且都发表到了非常好的顶会上。目前有越来越多的 NLP 研究者开始探索文本对抗攻击这一方向,以 2020 年 ACL 为例,粗略统计有超过 10 篇相关论文。NLP Privacy可谓是NLP研究的下一个风口。
本次给大家介绍一篇文本对抗攻击和NLP结合的文章,目前该文章被_AAAI’21_接收,且代码已经开源(非常良心[19])!
首先,按照惯例,一句话总结论文:_本文在NLP领域中的Hard Label黑盒环境下提出了一种使用遗传算法优化的基于决策的攻击策略_。具体来说,该策略可以针对文本分类和包含任务生成高质量的对抗样本。本文提出的攻击策略利用基于种群的优化算法,仅通过观察目标模型预测的top标签来设计合理且语义相似的对抗样本。
此外,在每次算法优化迭代中都允许进行单词替换,从而最大限度地提高原始文本和对抗文本之间的整体语义相似度。相比其他的攻击策略,本文的方法不依赖使用替代模型或任何种类的训练数据。
7. 纯PyTorch语音工具包SpeechBrain开源,Kaldi:我压力有点大 | 机器学习
项目地址:https://github.com/speechbrai...
语音处理技术的进步,是人工智能改变大众的生活的重要一环。
此前,开发者常用的语音工具有 Kaldi、ESPNet、CMU Sphinx、HTK 等,它们各有各的不足之处。
在一年多前, Mirco Ravanelli 宣布要打造一款新的一体化语音工具包 SpeechBrain。该项目于近日正式开源,鉴于上述背景,SpeechBrain 诞生的主要宗旨是:够简单、够灵活、对用户友好。
SpeechBrain 有以下几大亮点:
- 开发团队与 HuggingFace 集成一些预训练模型,这些模型具备可运行推理的接口。如果 HuggingFace 模型不可用,团队会提供一个 Google Drive 文件夹,包含所有对应的实验结果;
- 使用 PyTorch 数据并行或分布式数据并行来进行多 GPU 训练和推理;
- 混合精度,加快训练速度;
- 透明且完全可自定义的数据输入和输出 pipeline。SpeechBrain 遵循 PyTorch 数据加载器和数据集样式,使用户能够自定义 I / O pipeline。
8. 废旧笔记本屏幕不要扔,不到200元就能DIY成便携显示器 | 量子位
如果你有一台主板坏掉、屏幕完好的笔记本,去回收往往只能换回几十块钱。
有没有想过把屏幕拆下来,改造成一台便携显示器呢?
最低只要不到200元,就能拥有一个副屏,提高工作效率。
全套配件只需百元。
- 螺丝刀一套
- 显示器驱动板一块
- 高压板一块
- 按键板一块
- 连接线若干
- 遥控器
- DIY 外壳
9. Yes!AMD发布7nm服务器芯片「米兰」:Zen 3架构,IPC提升19%,最高64核 | 机器学习
当地时间周一,AMD 发布了全新的 Epyc(霄龙)7003 系列处理器,代号「米兰」(Milan),搭载了去年 10 月发布的全新 Zen 3 架构。Epyc「米兰」服务器芯片的规格与 Ryzen 5000 系列 CPU 大致相同:多核心、高加速时钟频率、19% 的单核性能提升,以及相较竞争对手英特尔表现出的巨大优势。
据 AMD 官网数据显示,EPYC 7003 系列处理器基于 Zen 3 内核和 AMD Infinity 架构打造,具有整套功能和特性:先进的 I/O、7nm x86 CPU 工艺技术以及片上集成安全处理器。
EPYC 7003 处理器具有每核心最多可达 32 MB 的 L3 缓存,支持 4-6-8 内存通道交织从而让多 DIMM 配置具有更好的性价比,并且其互联电路和内存之间时钟同步,所有这些特性都将促进更好、更快地得到结果。
推荐阅读
【RT-Thread作品秀】基于ART-PI的数字图像处理与识别
【20210312期AI简报】用树莓派DIY激光枪、30天吃掉那只 TensorFlow2.0
RT-Thread针对不同架构芯片移植的方法
原文链接:RTThread物联网操作系统
作者: lebhoryi