查看原文
其他

百度大脑1月产品上新&技术升级:车辆分析、智能写作、人脸考勤方案发布……

百度AI 2020-09-15


叮!百度大脑一月一次的最新技术&产品盘点来了。在这里,与百度大脑一起成长,见证 AI 的力量。您可以从 PC 端访问百度 AI 开放平台(ai.baidu.com)申请邀测,或使用最新产品。


 

 2019年1月 

 新开放 AI 技术能力 


1. 图像识别


  • 车辆分析

    准确识别图像中的车辆相关信息,提供车型识别、车辆检测、车流统计、车辆外观损伤识别等能力。


  • 红酒识别

    红酒识别邀测上线。输入一张红酒图片(酒标清晰可见),返回图片中的红酒名称。


2. 人体分析


人流量统计(动态版)公测上线,面向门店、通道等出入口场景,以头肩为识别目标,进行人体检测和追踪,根据目标轨迹判断进出方向,实现动态人流量统计。您可以从 PC 端进入 AI 产品控制台开始使用。


3. OCR 


3个 OCR 新接口邀测上线:保单识别、税务局通用机打发票识别、行程单识别。


4. 自然语言处理-智能写作邀测上线


包括智能春联、智能写诗、结构化数据写作、热点事件脉络、人物图谱功能接口,满足各类智能写作业务需求。



 AI 技术模型优化 

 易用性提升 


1. 图像识别-通用物体和场景识别高级版开放购买


即除平台提供的500次/天免费调用量外,还可以开通付费购买更多调用量,后付费阶梯计价(2-3元/千张),并享受10 QPS 的稳定并发能力。您可以从 PC 端进入 AI 产品控制台开通付费使用。


2. 图像搜索图库管理后台易用性升级


支持在线测试检索效果,相同图搜索、相似图搜索、商品图搜索同步升级,不用调接口就能测试体验以图搜图的真实效果。


3. 人脸识别


  • 人脸离线识别 SDK 2.0
    人脸离线识别 SDK 全面升级:

    1)人脸检测/活体检测/特征抽取速度提升150%;

    2)全新生活照及证件照模型,精度同比1.0系列提高近1.5%;

    3)重写20余个底层 API,可降低30%开发量;

    4)新增人脸通行、人证比对场景化示例工程,增加10余个场景化配置能力,1分钟跑通全流程业务逻辑,应对各类场景细节需求的二次开发。


  • 人脸检测
    快速检测人脸并返回人脸框位置、定位五官与轮廓关键点数量,从72个增加至150个,可更好地支持人脸特效场景。

  • 人脸搜索
    1:N 识别接口 max_user_num 参数上限从20增加到50,支持最多返回50个相似人脸。用于人脸检索操作的非精准匹配场景,提升场景适配性。


4. 人体分析


  • 手势识别手势识别模型升级

    增加“竖中指”手势(累计已支持24种手势),可用于审核场景,同时全面优化远景拍摄场景(1~3m距离)的识别效果。

  • 人体检测与属性识别
    人体检测与属性识别模型升级:

    1)优化模型算法,显著提升人体检测和属性分类的准确率;

    2)增加“是否是正常人体”属性,方便过滤严重遮挡、大面积被截断的“无效人体”;

    3)所有属性增加“不确定”输出项取值,区分不确定的识别结果,例如吸烟属性,以前输出项为“未吸烟、吸烟”,现在则为“未吸烟、吸烟、不确定”。


5. 自然语言处理-评论观点抽取(定制版)优化


输出标签不再局限于现有“名词+形容词”的形式,解决原名词+动词(如:包裹破损)提取不出来的问题。

 

 定制化平台与工具 


1. EasyDL 定制化训练及服务平台


  • 物体检测模型训练效率提升

    物体检测中“高精度标准算法”分布式训练后端优化,可将训练模型所用时间缩短至原先的1/2-1/3时间,大大提升模型训练效率。您可以从 PC 端访问 ai.baidu.com/easydl/ 直接使用。

  • 新增功能:可实时查看模型训练进度

    现只需将鼠标移到模型训练状态为“训练中”旁边的叹号,即可查看模型训练进度条。此外,还可以添加短信提醒,训练完成时就会收到提醒信息,再也不用担心不知何时才能将模型训练完成了!

  • 新增功能:云服务调用数据
    在训练操作页面左侧增加“接口数据管理”功能(支持图像分类和物体检测)。可用于管理调用接口时上传的数据。使用该功能,可以提高模型的迭代效率,实现训练数据的持续丰富和模型效果的持续优化。


2. 理解与交互技术 UNIT


  • 新增6个预置技能

    1)电视剧:可用于电视剧查找的场景,支持精确搜索与模糊匹配;
    2)机器人控制:解析用户与智能机器人的互动指令,提供做表情、拍照、举手等指令;
    3)提醒:提供日程管理的功能,包括设置、查询及删除提醒;
    4)发微信:识别用户对微信的操作指令,支持打开和关闭微信应用、收发微信等功能;
    5)发短信:识别用户对短信的操作指令,支持打开和关闭短信应用、收发短信等功能;
    6)屏幕控制:解析控制智能设备屏幕的指令,提供屏幕划动、列表的排序和选择、翻页等控制指令。


    现 UNIT 已累计提供23个预置技能,开发者只需点点鼠标即可轻松获取对应场景的智能对话能力!您可以从PC端访问 ai.baidu.com/tech/unit 立即使用。


  • 正式推出“技能复制”功能
    开发者可通过该功能,将技能复制至任意账号中。基于此功能,开发者可以快速实现技能的备份、将账号内技能迁移至新账号、以及复制多个技能进行二次开发用于相似业务。大幅度提升工作效率,降低数据复制成本。


  • 【UNIT 对话测试助手】小程序,新增机器人和预置技能体验功能
    【UNIT 对话测试助手】是一款测试开发者在百度 UNIT 平台训练出的对话模型效果的微信小程序。本次 UNIT 对话测试助手小程序强势升级,在原有支持自定义技能的基础上,增加机器人、预置技能的对话效果体验功能,还可以通过分享小程序来向其他开发者展示。体验对话效果从此更加轻松便捷。

 

 AI 硬件产品与服务 


1. 远场语音开发套件


重磅发布软硬一体的远场语音开发套件,包含麦克风阵列和开发板,支持声源定位、噪声消除等信号处理算法,5米内完美拾音,支持远场唤醒、远场识别、语音合成能力,使语音开发评估更简便、高效。您可以从 PC 端访问 http://ai.baidu.com/tech/hardware/speechkit 了解更多详情。



2. EdgeBoard 终端计算加速方案 重磅发布


深度学习软硬一体化加速方案,具备模型剪枝&量化加速工具,可将原始模型性能提升4倍以上。高性能的加速引擎提供2.4 Tops 的强大 AI 算力,完整的嵌入式参考设计,便于硬件产品的结构设计及二次开发。AI 硬件产品通过集成 EdgeBoard,可大大提升终端设备 AI 推理能力。您可以从 PC 端访问 http://ai.baidu.com/tech/hardware/deepkit 了解更多详情。


 

 百度大脑解决方案 


人脸考勤解决方案发布


将考勤功能集成到手机、摄像头等设备中,以较低成本实现刷脸考勤,随时随地打卡。活体检测功能有效抵御照片、视频等作弊手段。提升考勤效率,提高防作弊能力。您可以从 PC 端访问http://ai.baidu.com/solution/faceattendance 了解更多详情。


 

 百度 AI 市场 


1. 数家优质服务商入驻 AI 市场


深圳视派尔、北京蚂蚁玖玖、北京文安智能、唐山莱锐思等多家优质服务商入驻 AI 市场,火热售卖镜头模组、人脸抓拍机、人脸门禁闸机、机器人视觉定位系统等 AI 相关产品,性价比高,品质有保障。您可以从 PC 端访问百度 AI 市场(aim.baidu.com)进行选购。



2. 功能升级


  • 未发货自动提醒功能上线

    针对24小时未发货的服务商,系统将通过邮件与短信提醒,避免长时间未发货,影响交易。

  • 服务商入驻流程优化

    服务商入驻、开店、发布商品可完成内容后,一次性提交审核,缩短审核流程;在做服务商信息、店铺信息更新时不影响前端正常展现。

  • 交付信息可修改

    针对服务商更换快递公司,补发货物等场景,增加交付信息可修改功能,方便对业务需求的灵活调整。

  • 商品价格升级

    商品价格明确含税、运费说明,并补充增加阶梯价与起售数量,满足 AI 市场中各类产品定价需求。

3. 百度 AI 市场域名更改为 aim.baidu.com 


AI 市场域名已正式更改为 aim.baidu.com,欢迎您从 PC 端访问并选购所需的 AI 配套产品。

 

 百度 AI 体验中心微信小程序 


1. 优化语音识别能力


语音识别服务优化,时延更低。并在小程序中增加了识别、合成用时信息。


2. 新上线3项能力


新上线人像分割、情绪识别、智能春联3项能力。目前“百度 AI 体验中心”共提供34项 AI 能力可体验。听说体验过的小伙伴们都忍不住分享到朋友圈!微信扫一扫立即体验↓


更多关于百度大脑的最新技术和产品信息,欢迎点击“阅读原文”进入百度 AI 开放平台查看!如需使用,可从 PC 端访问百度 AI 开放平台(ai.baidu.com)申请邀测,或直接使用最新产品。




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存