世界大会上百度大脑6.0的发布,持续引领 AI 技术高速发展。七八月50余项能力的开源开放及升级,是夏日火热的积淀,希望可以帮助您更高效实现产业智能化应用落地,快来一同阅读您最关心的内容吧。
重点概览:
乘风平台发布,提供端到端一站式人脸通行考勤解决方案,满足企业智能管理需求;
智能招聘3大爆款功能(简历解析、人岗匹配、简历画像)邀测进行中;
医疗票据 OCR 方案,智能结构化方案全新上线;
智能庭审辅助解决方案开放邀测;
视频分析边缘计算盒 EM-BOX 上新5项技能,分析功能更丰富;
百度飞桨推出工业级目标检测模型 PP-YOLO,精度45.9%,推理速度72.9 FPS。
一. 企业服务领域方案
乘风平台(人脸通行考勤平台)正式上线依托百度大脑人脸识别能力,提供端到端的一站式通行考勤的解决方案,可以满足企业对智慧通行、无感考勤等场景的管理需求,实现跨地域、跨环境的人脸设备在线管理,适配多模态设备接入,实现端云数据同步。
查看详情
https://ai.baidu.com/tech/fac...
智能招聘方案新增简历画像功能,开放邀测
依托百度 TIC 团队在招聘方向的深耕,同时结合百度自然语言处理、百度文字识别的 AI 能力,提供多项招聘功能。往期已开放简历解析、人岗匹配邀测功能,本期简历画像功能开放邀测,可基于简历输出人才评分、简历分类、多维度标签(简历标签、项目经历标签、工作经历标签、技能标签字段)。
查看详情
https://ai.baidu.com/solution...
二. 医疗票据 OCR 方案
医疗发票识别开放邀测
针对全国各地的门诊/住院发票,识别业务流水号、发票号、住院号、病例号、姓名、性别、社保卡号、金额大/小写等16个关键字段
了解更多
https://ai.baidu.com/tech/ocr...
病案首页识别开放邀测
针对全国各地病案首页,识别病案号、姓名、性别、出生日期、身份证号、出/入院科别、住院次数、药物过敏情况等15个关键字段
了解更多
https://ai.baidu.com/tech/ocr...
医疗费用结算单识别开放邀测
识别全国范围医疗费用清单的6个关键字段,包括姓名、出/入院时间、发票总金额、自费金额、医保支付金额;北京地区效果最佳
了解更多
https://ai.baidu.com/tech/ocr...
三. 医美视觉方案
黑眼圈/眼袋检测能力开放邀测
提供精准的黑眼圈/眼袋检测能力,毫秒级识别响应,并分类别返回对应位置信息,实现黑眼圈/眼袋的像素级语义分割,对医美、互动娱乐及美颜等场景有较高的应用价值。
查看详情
https://ai.baidu.com/tech/fac...
人脸 3D 虚拟形象生成能力开放邀测
根据用户上传的自拍图,生成脸型、五官分布相似的人脸模型基底 fbx 文件,配合自定义设计模板,以实现拟人、卡通、动漫等多样的风格建模效果,解决批量个性化建模问题。
查看详情
https://ai.baidu.com/tech/ar/...
实时美发染色 SDK 产品开放邀测
基于高精度头发分割技术,打造实时染发效果,支持单色、渐变、动态等多种染发模式,效果细腻逼真自然,适用于染发试色、互动娱乐场景。
查看详情
https://ai.baidu.com/tech/ar/...
四. 法律政务领域方案
智能庭审辅助解决方案开放邀测
基于自然语言处理、知识图谱等技术解析处理行业文书,实现庭审要素的自动识别、归纳与推荐,提供案由要素提取、案件相关联推荐、案件智能检索功能,与法律行业深度结合。
查看详情
https://ai.baidu.com/solution...
五. 安全生产监控方案
视频分析边缘计算盒 EM-BOX 全新升级,上新5项分析功能
除安全帽佩戴合规检测、烟火检测、电子围栏外,支持技能增加:陌生人检测、攀高检测、睡岗检测、离岗检测、人流过密预警。充分利旧现有摄像头,即插即用,提供可视化管理平台,支持二次开发。
立即购买
https://aim.baidu.com/product...
- OCR
智能结构化识别开放邀测
结构化识别各类卡证、票据,无需配置结构化对应关系、无需提取关键词、无需定制开发,直接上传图片即可获得结构化识别信息;适用于政务审批、证件信息录入、境外证件读取等场景
申请试用
https://ai.baidu.com/tech/ocr...
文档版面分析与识别全面公测
对文档版面进行自动分析,检测图、表、标题、文本的位置,输出分版块内容的文字识别结果;支持中/英两种语言、手写/印刷体混排多种场景 。
此次接口公测上线,同步优化模型效果,教育场景下的识别准召率提升至85%+,可用于智能阅卷、拍照搜题等场景
立即试用
https://ai.baidu.com/tech/ocr...
仪器仪表盘读数识别全面公测
识别不同品牌/型号的仪器仪表盘读数,可识别表盘上的数字、英文、符号,支持液晶屏、字轮表等表型;适用于各类血糖仪、血压仪、燃气表、电表
立即试用
https://ai.baidu.com/tech/ocr...
2.人脸识别
身份证与名字比对【二要素】API 上线特惠次数包
身份证与名字对比 API 推出多档预付费次数包,优惠价低至0.18元/次;按调用量后付费价格由0.6元/次调整为0.3元/次,广泛应用于游戏、运营商、购票、电商等业务用户实名制登记环节,欢迎选购!
立即购买
https://console.bce.baidu.com...
- 图像技术
图像修复正式商用,接口调用低至0.025元/次
对图片进行智能修复,去除图片中不需要的物体,并用背景内容填充;可用于图像美化、破损照片修复。
多种规格次数包火热开售,接口调用低至0.025元/次;支持按量后付费,随开随停,灵活方便。
立即试用
https://ai.baidu.com/tech/ima...
- 人脸与人体识别
H5 端人脸实名认证解决方案升级
新增身份证风控能力,鉴别用户上传的身份证照片是否为翻拍、PS 伪造所得;新增人脸合成图鉴别能力,鉴别用户上传的人脸照片是否为 PS、人脸融合图片,业务安全等级更进一步。
立即体验
http://brain.baidu.com/face/p...
- OCR 9项能力全面升级
• 通用文字识别(标准含位置版)模型升级
优化模型,识别精度进一步提升,字错误率下降7%。
• 身份证识别模型升级
优化模型,持续提升识别效果,其中『住址』、『签发机关』准确率进一步提升。
• 银行卡识别模型升级
优化模型,识别效果进一步提升。
• 营业执照识别模型升级
优化模型,提升关键字段识别准确率,『地址』、『社会信用代码』、『公司类型』字段准确率提升至95%以上。
• 车牌识别能力升级
1)优化模型,在线服务整体准确率提升,其中绿牌召回率显著提升。
2)离线 SDK 焕新升级:
功能更全面:支持全种类车牌,包括常见的蓝牌、绿牌、黄牌,以及大型新能源、领使馆车牌、警牌、军牌、港澳牌、民航车牌等特殊车牌。
性能更强劲:单张图片的处理速度可达 100ms 内,例:骁龙821上仅 90ms。
性价比更高:支持按设备授权,可部署在摄像头、执法记录仪等设备上,按需购买、集成。
• 增值税发票识别能力升级
卷票识别新增支持『收款人』字段,识别字段数扩充至19个;同时优化模型效果,关键字段识别准确率进一步提升。
• 通用机打发票识别能力升级
新增13个识别字段,包括『机打代码、机打号码、校验码、购买方名称、商品单位、单价、数量、金额』等,识别字段数扩充至19个(同增值税卷票)。
优化模型效果,关键字段识别准确率提升至98%+,其中『发票代码、校验码』的准确率高达99.9%以上。
• 出租车票识别模型升级
优化模型效果,『乘车日期、上下车时间、总金额、发票代码』等关键字段的准确率提升至95%+,整图识别准确率提升至90%。
• 行程单识别模型升级
优化模型效果,提升关键字段识别准确率,其中『姓名』、『航班号』、『身份证号』识别率大幅度提升。
百度 OCR 50余项服务,了解更多:
- 内容审核平台:不断优化文本、图像审核能力,持续丰富审核维度、提升识别精度
• 文本审核:模型全面升级,准确率+10%
对涉黄、涉政、暴恐、辱骂、广告、灌水6个维度的模型进行阈值调优和效果优化,提升模型在社交、资讯、游戏、电商等典型场景下的识别精度,例如:广告模型的召回率提升至97%以上。
• 图像审核:4项能力升级
1)不良场景识别公测上线:检测图像/视频中是否有涉毒、涉赌、吸烟、酗酒等行为,并针对卡通场景专项优化,满足更多通用场景及直播场景的审核需求。
2)地图识别模型升级:优化模型,进一步提升中国地图及类似图形的识别准确率,减少误召回 case。
3)旗帜标识识别模型升级:新增多个敏感台标的识别,覆盖更多的敏感旗帜、标志,持续提升审核全面性
4)广告检测模型升级:优化模型,显著减少视频字幕类误召回 case;新增支持微信小程序码检测,并优化条形码的识别效果。
了解更多
https://ai.baidu.com/solution...
- 语言与知识
• 地址识别能力升级
精准提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息,大幅提升企业效率。本次升级增加了 confidence 参数,并优化了业务逻辑架构,同时升级准确率更高的地图接口,效果更优!
查看详情
https://ai.baidu.com/tech/nlp...
飞桨 PaddlePaddle 开源深度学习平台、零门槛AI 开发平台 EasyDL、AI 学习与实训社区 AI Studio 发布多项升级。
- 飞桨 PaddlePaddle 开源深度学习平台
• GitHubTrending 第一之后,PaddleOCR 再发大招:百度自研顶会 SOTA 算法正式开源!
面向自然场景任意形状文字检测问题,开源 ACM Multimedia 2019上发表的 SAST(A Single-Shot Arbitrarily-Shaped TextDetector based on,Context Attended Multi-Task Learning)算法,在多个公开数据集(包括SCUT-CTW1500,Total-Text,ICDAR15 和 MLT),准确度取得了 SOTA 或可比的结果,速度上位列领先行列。
查看详情
https://mp.weixin.qq.com/s/H_...
8.6M 超轻量中英文 OCR 模型开源,训练部署一条龙
作为一名开发者,各种 OCR 相关的需求自然也少不了:卡证识别、票据识别、汽车场景、教育场景文字识别……那么,这个模型大小仅 8.6M,没有 GPU 也能跑得动,还提供自定义训练到多硬件部署的全套开发套件的开源通用 OCR 项目,了解一下?
查看详情
https://mp.weixin.qq.com/s/6Z...
精度45.9%,推理速度 72.9FPS,百度飞桨推出工业级目标检测模型 PP-YOLO
飞桨目标检测套件 PaddleDetection 的研发团队为了让 YOLOv3 模型在工业实际应用场景拥有更优异的精度与推理速度,以尽量不增加模型计算量和推理开销为前提,探索出了一整套更深度的算法优化秘籍,将原先 YOLOv3 模型的精度(在 COCO test-dev2017 数据集)从33.0%提升了12.9个绝对百分点,达到45.9%,处于业界领先行列!而在该精度下,其推理速度在 V100 上达到了 72.9FPS。
查看详情
https://mp.weixin.qq.com/s/qt...
飞桨 PaddleSeg 新升级!带来 187K 超轻量级人像分割模型,视频级光流后处理方案
最新发布 HumanSeglite 模型超轻量级人像分割模型,可支持移动端场景的实时分割,最小只有187K。
查看详情
https://mp.weixin.qq.com/s/nb...
对话智能新高度:百度发布超大规模开放域对话生成网络 PLATO-2
参数规模上升至6亿,效果超过 Google 和 Facebook 同类模型。
查看详情
https://mp.weixin.qq.com/s/Tf...
百度飞桨与统信操作系统 UOS 完成互认证,共同探索 AI 领域
近日,百度飞桨(PaddlePaddle)深度学习平台与统信服务器操作系统 V20 完成产品兼容性互认证。测试结果显示,百度飞桨在统信服务器操作系统 V20 顺利安装,运行稳定,成为与统信操作系统 UOS 完成互认证的首个 AI 深度学习平台,这标志着中国首个开源深度学习平台和国内自研操作系统在人工智能和深度学习等领域携手共同探索,为广大深度学习开发者提供更多国产化选择。
查看详情
https://mp.weixin.qq.com/s/GF...
- 飞桨企业版-零门槛 AI 开发平台 EasyDL
• EasyDL 经典版4项能力上新及优化
物体检测、图像分割数据标注支持全屏,提供更佳的标注体验。
最新上线定制文本情感倾向分析模型和定制文本分类-多标签模型,覆盖更多用户应用场景。
EdgeBoard(VMX)软硬一体方案支持 Linux ARM 硬件加速。
新增 SDK 集成快速开始文档,方便开发者快速集成使用,包括 Windows x86 加速版、Linux x86 GPU 加速版、Linux ARM、Android ARM、EdgeBoard(FZ)、Jetson 系列。
EasyDL 经典版,立即体验
https://ai.baidu.com/easydl/lite
EasyDL 零售版1项能力升级
在线标注工具升级,支持全屏标注,且辅助标注功能更新,可支持选择已训练好的模型为图片进行预标注,降低标注工作成本。
EasyDL 零售版,立即体验
https://ai.baidu.com/easydl/r...
EasyDL 专业版5项能力上新及优化
EasyDL 专业版 CV 方向脚本调参上线自动超参搜索,支持模型参数自动调优和超参搜索结果复用。
EasyDL 专业版 NLP 方向上线文本分类-多标签任务,支持对一个文本标记多个标签,覆盖更多应用场景。
Notebook 启动速度优化:启动速度从 160s 优化到10秒内。
上线预训练网络与部署方式的适配性查询页面。5. 新增支持模型部署至华为达芬奇 NPU。
EasyDL 专业版,立即体验
https://ai.baidu.com/easydl/pro
- AI 学习与实训社区 AI Studio
• 荣誉体系上线
AI Studio 荣誉体系全新上线,对项目、数据集、比赛、课程等行为设定成长值奖励,成长值对应等级,可彰显能力与身份,并享有众多权益。
• Notebook 全新升级支持 Notebook 目录和多文件预览. 这样无需 fork 并进入项目, 即可获知该项目的主要内容. 同时该模块支持折叠, 并不会影响传统阅读体验。
• 数据集空间优化对于已公开项目的数据集不占用个人数据集最多50个的限制,同时对数据集大小和单个文件大小限制做调整,更贴合使用需求。
• 脚本任务支持多卡训练
脚本任务可以支持多卡训练,最多可使用 V100 八卡并行训练,提高训练效率。
• 课程作业功能升级
教师端-评阅管理-添加搜索功能, 方便教师快速查找学生的作业。
在课程中,,学生可以自主下载提交过的作业,方便学生确认留底。
课程目录功能上线,支持在课节及视频/文档/项目内容间切换,提升学习体验
课程支持分享:可将喜爱的课程分享给同学或友人, 共同进步。支持扫码移动端分享和复制链接 PC 端分享, 还会有不定时的奖励活动。
• 分享赢算力功能上线
点击首页分享链接,每拉一个新用户助力可获得10小时免费算力奖励,同时注册的新用户可获得100小时免费算力。
立即参与
https://aistudio.baidu.com/ai...
• 千言系列比赛上线
千言系列比赛针对每个自然语言处理问题,均收集和整理多个开源数据集,进行统一的处理并提供统一的测评方式,旨在共同推动中文信息处理技术的进步,建设世界范围的中文信息处理影响力。
立即报名
https://aistudio.baidu.com/ai...
• EasyDL X 乌镇 产业智能创新大赛上线
本次比赛为 EasyDL 联合乌镇镇政府、桐乡市经济和信息化局、桐乡市工业互联网联合会共同举办,总奖池高达16万。
查看详情
https://aistudio.baidu.com/ai...
丰富的 AI 上下游产品聚集地,无缝对接买卖双方,撮合交流,快速应用。
• AI 市场支持服务商自主订阅商机
服务商可在 AI 市场的需求广场中主动订阅商机,平台将符合要求的商机定期推送至服务商后台,并以邮件或短信方式提醒。
商机订阅除可圈定地区、商品类型等基本推荐条件外,还支持智能化商机推荐,即通过商机与服务商所发商品的匹配度为服务商推荐更为适合的商机,极大提高服务商获得高质商机的效率。
• AI 市场优化商机流转机制
AI 市场非定向商机(客户无目标服务商)将自动发布至需求广场公开招商,定向商机(客户有目标服务商)也会在48小时未对接的情况下有机会发布至需求广场。
在保障客户快速获得服务商响应的同时,也丰富了需求广场的商机,让响应快服务好的服务商更高效地获得客户与订单!
• 优质服务商及商品持续入驻
杭州远传新业、深圳华视视觉、苏州声通、深圳瑞识、青岛大道至简等多家优质服务商于 AI 市场上线并售卖人体测温设备、抓拍机、人脸识别门禁、镜头模组、智能机器人等硬件产品,以及智能访客系统、智能质检分析、智能政务、智能垃圾分类投放检测系统、人工智能科学实验室等解决方案 ,性价比高,品质有保障。
查看详情
部分新品展示
目前,百度大脑 AI 开放平台面向广泛的企业和开发者共开放了273项技术能力,超过230万开发者使用,已成为业内开放能力最全面和领先、服务规模最大、开发者首选的 AI 平台。
同时百度大脑核心技术引擎,作为百度智能云的底座,也将持续通过智能云为行业客户提供优质的平台方案和智能化解决方案。
点击链接,了解更多百度大脑能力。