查看原文
其他

24种新AI能力,20个好案例,百度大脑开放日划了这些重点

百度AI 2021-09-10


人工智能连续3年进入政府报告,“智能+”成为时代新命题,这些信息都显示2019年会是 AI 产业全面加速落地的一年。AI 行业的发展,离不开千万开发者的助力。


3月20日,首场百度大脑开放日全新登场,介绍了全新开放的24种全新 AI 能力,AI 赋能市政、物流、教育等行业的20个案例,也向开发者、行业人士展现了如何搭上 AI 开放生态的高速列车。


 百度大脑开放日来袭 


作为百度在人工智能领域多年研究成果的集大成者,百度大脑正在飞速进步着。自2016年启动开放以来,百度大脑目前已经是服务规模最大的 AI 开放平台,开放了158项 AI 能力,24小时快速集成,开发者数量超过100万,面向广泛的企业和开发者提供最先进、最全面的 AI 能力,不断降低 AI 应用落地的门槛。


百度 AI 技术生态部总经理喻友平谈到,“在百度大脑的开放生态中,开发者一直是最为重要的一环。百度大脑开放能力不断加速,有很多有价值的技术难以被开发者了解。2019年百度大脑开放日全新登场,希望为 AI 开发者提供及时、全面、近距离地了解百度大脑最新 AI 产品和案例,且能深度、持续交流的平台。”


百度 AI 技术生态部总经理喻友平


首期开放日,喻友平介绍了百度大脑开源深度学习平台 PaddlePaddle 以及通用 AI 能力两方面的技术和产品更新,以及百度大脑在市政、物流、教育等行业的落地案例,与开发者们进行深度交流。



 更广、更快、更精的 AI 技术 


深度学习是 AI 发展的燃料。百度在深度学习领域深耕已久,2016年,百度开源了深度学习框架 PaddlePaddle。此次,PaddlePaddle 迎来两方面重大更新,核心框架 Paddle Fluid v1.3 新增发布业界首个视频分类模型库,新增支持 NLP 语义表示 BERT 模型,分布式训练性能大幅提升,大规模稀疏参数服务器 Benchmark 发布;同时,基于 PaddlePaddle 的深度强化学习框架 PARL,夺冠 NeurIPS 2018。具有高灵活性和可扩展性,支持可定制的并行扩展,覆盖 DQN、DDPG、PPO、A3C 等主流强化学习算法。


目前,百度 PaddlePaddle 已对外开放超过50种经过工业场景验证的官方模型。例如,领邦利用 PaddlePaddle,通过 ICNet 语义分割模型识别精密零件瑕疵,实现零件自动分拣。


在深度学习基础之上,百度大脑通用 AI 能力开放涵盖语音、视觉、自然语言处理、知识图谱等全面 AI 技术。


语音方面推出了语音识别极速版,首次对外开放搭载国际领先的注意力(attention)模型的语音能力拥有更快的响应速度,相对识别准确度提升15%,为开发者带来更极致的识别体验。


此外,语音识别预置语义解析全新升级,预置场景由35个升级为51个,从影视娱乐到外卖打车,语义解析效果全面提升。另外,还预告了即将推出的几款新产品,包括语音识别自训练平台、远场语音开发套件和语音离线合成等产品。


视觉方向上,OCR、车辆分析、人脸人体、图像识别都有重磅升级。


比如卡证 OCR 新增了户口本、出生医学证明、港澳通行证和台湾通行证四类新能力,可识别卡证总数达到9种。只需对着你的户口本拍一张照片,系统就能对字段进行结构化识别,然后反馈出信息页的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码。而票据 OCR 和汽车场景 OCR 也分别新增了行程单、保单、通用机打发票、定额发票、车辆 VIN 码、机动车销售发票、车辆合格证等识别能力。


目前,百度大脑 OCR 产品全系列可以识别类型多达34款,实现卡证、票据、文档、汽车全场景覆盖。


人脸人体识别方向,百度大脑此次发布了新能力——人脸情绪识别,同时升级了人脸关键点检测和手势识别,人脸检测关键点由72个增至150个,常见手势能识别种数也达到了24种。



图像识别方向,百度大脑更新了红酒和地标识别两个新能力。无论是卢浮宫还是82年的拉菲,只要上传1张照片,就能获得文字解析。车辆分析方面则上线了车辆检测和车流统计。


喻友平透露,不久后,百度大脑还会陆续上线车辆属性识别、车辆外观损伤识别、人脸融合、手部关键点识别、更高精度的人像分割以及钱币识别等有趣有用的应用场景。


 

同时,百度大脑语言及知识技术也进一步开放。在语言处理应用技术方面,百度大脑新增文本纠错、新闻摘要、智能写诗、智能春联和对话情绪识别等能力,在知识理解方面,百度大脑推出了作文检索和知识问答两个新能力,让学习和娱乐两不误,分分钟化身“十万个都知道”。同时,智能写作平台将在4月全面上线,从素材上为创作者提供工具、帮助找到灵感,提升创作者的写作效率和产出质量,降低写作成本。


在强劲的 AI 技术支持下,百度大脑也在重点发力智能硬件和设备。1月16日,百度大脑在深圳召开“在端上思考”百度大脑 AI 硬件平台及产品发布会,发布13项端侧新品,备受行业关注。在现场,喻友平介绍到,目前已有4款新品正式上架 AI 市场。


 

在 AI 能力广度、速度、精度不断提升的基础下,百度大脑充分利用自己在 AI 领域内的成功经验不断雕琢着自身的核心技术,开始在产业界呈现“乘法效应”展现出产业智能化“头雁”的速度。


 AI 落地的乘法效应 


AI 技术的发展,最终还是要落实到我们的生活中。在我们触手可及的各个角落中都有百度大脑加持的智能产品。首期开放日着重介绍了近期开发者询问较多的市政、物流、教育三个领域的落地案例。


 

比如百度 EasyDL 与分形科技打造的智能垃圾桶已成功地落地海淀公园,可以对7种常见垃圾自动分类,后期还可以通过增加训练数据识别更多种类;


在和德邦物流的合作中,为用户免去了自行填写信息的麻烦,使用定制词法分析快递申请,一秒拆分姓名、电话、住址等信息;


更具科研意义的还有百度 EasyDL 与中科院在珍稀鸟类识别项目上展开的合作,在传统分类学日渐没落的今天,百度 EasyDL 可以利用强大的图像识别技术协助专家们对动植物标本、照片进行快速鉴定,目前中科院使用 EasyDL 训练对超过12万幅图片进行分析,目前在700多种鸟类模 top 5上的识别准确率达到93.89%,非雀形目鸟类模型 top 5准确率达到95.79%,满足上线服务要求。


与卓繁信息的合作,百度大脑还打造了“AI 便民”的新型无人值守受理站。通过 UNIT、OCR、人脸识别等 AI 技术,“无人值守”的政务服务新模式为社会公众提供全年无休的24小时自助办事服务,提升了政府为民服务的能力。


开放日当天,网红智能猫窝的设计者百度大脑工程师晚兮也在现场为大家讲述了智能猫窝设计者们的初心。为了让流浪喵过上幸福的生活,程序员出身的他用百度大脑动物识别技术和百度 EasyDL 打造出 “猫脸门禁”、“病猫识别”、“绝育识别”三大智能功能,给流浪猫一个温暖的住所的同时帮助救助志愿者发现生病和未绝育的流浪猫。晚兮提到,凭借百度大脑的开放技术,他只用半天就设计出了智能猫窝的三项主要 AI 功能,看似高冷的 AI 技术最终化为猫咪们的守护神,让现场的小伙伴们感到暖心又感动。


 

2018年百度大脑走进6大城市举办7场行业创新论坛,发布了企业服务、信息服务、地产物业、智能零售、智能工厂、智能校园、智能政务7大行业解决方案,推动 AI 与不同行业、具体场景相结合,AI 技术渗透到产业的毛细血管。百度大脑目前已经落地20+行业,生态赋能已成燎原之势。


 百度大脑新品体验师计划 


如果只是技术“阅兵”会让你觉得意犹未尽,为了进一步激励开发者学习应用百度大脑开源能力,百度大脑提出了“百度大脑新品体验师计划”,希望与开发者一起推动百度大脑进化,帮助他人一起成长,探索 AI 前沿应用。针对开放日介绍过的任意一款产品,开发者提出改进建议、使用技巧/攻略或者有价值有意思的案例并发表在 AI 社区,将会获得社区积分、百度大脑定制礼品、现金礼品卡等多重奖励。


技术更新、新品上线、开发者现身说法、行业案例详细解读、交流互动社区、培养激励措施......首期百度大脑开放日可谓干货满满。


“人工智能应用的领域可以说无处不在,只要企业、开发者、合作伙伴们能有发现问题的眼睛,就有创新创业的机会。百度大脑把平台和 AI 能力开放出来,希望帮助大家快速地实现各自领域的业务解决方案,创造全新商业模式,带来更多机遇。”喻友平在现场如是说。



: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存