2019年6月百度大脑产品上新&技术升级盘点内容
一年一度的百度 AI 开发者大会刚刚在北京落下帷幕,百度大脑发布了5.0,并宣布进入人工智能大生产时代。
而一系列黑科技的部分之外,百度 AI 开放平台本月还有一系列为开发者贴身打造的新产品和细致的服务升级,包括开放能力、开放平台、部署集成方案等,希望这些升级能帮到您更快在业务中应用 AI 技术。
AI 开放能力
全面开放、服务升级、商用保障,多种形式支持您的产品服务,加速创新、稳定可靠。
1.语音识别:极速版接口升级
在以往 pcm 、 wav 、 amr 等语音格式基础上,增加 m4a 格式支持。小程序也可实现直接调用,减少音频格式转换所需的资源和时间,大幅提升接入效率,语音识别准确率同步提高。
2. 文字识别 OCR :2项能力正式商用
火车票识别模型支持对红蓝火车票的8个关键字段,包括车票号码、始发站、目的站、车次、日期、票价、席别、姓名信息进行结构化识别,识别准确率超过95%;
出租车票识别模型支持对全国各大城市出租车票的6个关键字段,包括发票号码、代码、车号、日期、时间、金额信息进行结构化识别,关键字段识别准确率超过95%;
3. 人体分析:1项能力升级、2项新能力全面开放
人流量统计优化模型算法,服务升级,提升人数统计的准确率:50人以上的图片,人数统计的平均准确率高达98%以上;10~50人的图片,平均准确率可达90%+;10人以下的图片,平均准确率85%。支持框选多个不规则区域统计局部人数:方便统计观察图片中多个重点区域的人群热度,最多可一次性指定10个区域。
手部关键点识别全面开放检测图片中的手部并返回手部矩形框位置,定位手部的21个主要骨节点,可用于自定义手势检测、AR 特效、人机交互等场景。
危险行为识别全面开放针对5s内的监控视频片段,识别行为类别,目前支持7类行为:单人-情绪性指人、单人-摔倒、单人-激烈抱怨、单人-砸东西、单人-正常、双人-危险(包含出拳/拉扯/推搡/激烈搂抱/砸按/踢踹等)、双人-正常。
4. 图像识别:3项新能力全面开放
红酒识别技术识别图像中的红酒标签,返回红酒名称、国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等信息,可识别数十万中外红酒。
货币识别技术识别图像中的货币类型,返回货币名称、代码、面值、年份信息,可识别百余种国内外常见货币。
黑白图像上色技术智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活。可接入主题活动小程序或网页等。
5. 车辆分析:1项新能力全面开放
车辆分割检测图像中的车辆,以小汽车为主,识别车辆的轮廓范围,与背景进行分离,返回分割后的二值图、灰度图、前景抠图,适应多个车辆、车门开启、各种角度。
AI 开发平台
零代码基础、零开发成本,也能轻松使用 AI 开发平台,操作简单,功能强大
1. 智能创作平台全新升级至2.0
基于百度深耕多年的自然语言处理技术( NLP )、知识图谱技术( KG )、大数据技术打造的平台,提供自动创作、辅助创作、多模态创作技术,内置丰富的数据和素材,配置简单、生成快速,零代码基础也可以轻松使用。此次升级新增自动摘要、热点发现(行业、地域)、事件脉络、标题生成、多模态创作、用词润色6大领先技术能力,以及增加多种自然语言基础能力,更有丰富的数据素材支持,对创作者进行全流程贴心地辅助创作服务,成为更懂你的智能创作助手。
2. EasyDL 新发布智能标注功能
百度大脑 EasyDL 训练和服务平台—物体检测模型重磅推出智能标注功能,面对数目庞大的训练数据集,开发者们只需优先标注数据集自动筛选出的约30%的关键图片, EasyDL 即可一键标注剩余的图片,轻松获得效果优质的物体检测模型。
3. EasyDL 新发布定制视频分类
智能识别视频主体,根据主体动态变化分类。面向视频分析场景,通过标注每类50个、10s 以内的视频片段进行训练,从而实现 “需要连续图片帧组合判断”的视频内容分析,可用于工人操作行为规范识别、环境变化监控等场景中。
4. 零开发搭建视频智能监控系统正式发布
依托百度大脑的人脸、人体、图像识别等计算机视觉能力,针对视频监控场景,提供丰富的预置 AI 技能,通过简单的应用配置,零开发门槛快速搭建一套多路视频智能监控系统, 解决了以往集成商落地成本高、周期长等问题。
5.语音自训练平台支持呼叫中心模型正式发布
零代码自助训练语音识别语言模型,上传业务场景文本语料即可训练生成专属模型,有效提升业务用语识别准确率。平台内置呼叫中心模型可训练后进行上线使用,支持呼叫中心实时语音识别、录音文件转写等产品上使用。
集成与部署
多端软硬件集成与部署、多款适配主流模型的产品,配套硬核,实力强劲。
1. EdgeBox 边缘计算盒
基于 EdgeBoard 计算卡打造的通用 AI 边缘计算盒 EdgeBox ,可直接应用于 AI 项目研发与部署,具有高性能、易携带、通用性强、开发简单等四大优点。
2. X-Target 全目标抓拍机
基于 EdgeBoard 计算卡打造的全目标抓拍机 X-Target ,可适配所有主流神经网络结构视觉模型,通用于所有图像识别场景,如工业质检、安防监控、农作物生长监控等,具备强大的视频分析能力。
场景方案
跨行业场景应用,聚焦产业智能化落地,完整方案,共享成果。
1.工业智能质检
使用 AI 视觉技术手段对工业产品的外观瑕疵进行自动化识别,提供软硬一体的解决方案。
运用人工智能深度学习核心技术手段,结合 2D/3D 工业相机、自动化工装、机械臂等硬件设备,提供全套的工业产品外观瑕疵检测解决方案
可以与企业现有产线集成,实现对最终产成品、中间过程产品、原材料等环节的质量自动检测,取代现有人工质检操作,打通全产线自动化流程,提升质检和生产效率
对比于传统 AOI 机器视觉自动检测技术,人工智能深度学习技术可以检测更多的瑕疵类型,拥有更高的准确率、鲁棒性和泛化能力,在产线中发现新的瑕疵类型时,可以更加快速、低成本的实现模型更新
2.线下门店陈列洞察
基于百度 EasyDL 商品检测专业版、文字识别、人脸识别等技术,打造商业服务生态,助力线下门店陈列的数字化和智能化的升级。
实现对快消品牌商、经销商在线下零售门店的货架、货柜及地堆等场景的陈列洞察。
在推动渠道管理数字化的同时,提升线下店面管理与执行的效率和效果。
百度 AI 市场
丰富的 AI 上下游产品聚集地,无缝对接买卖双方,撮合交流,快速应用。
1.推广商品下架提示服务
为保证服务商商品在推广中的稳定性,所有在站内资源位、跨平台推广时,商品池会进行下架监控。当服务商希望下架时,会同时提示平台运营人员进行及时发现和沟通,以保证服务商推广效果稳定。
2.优质服务商及商品持续入驻
深圳华途数字、青岛小鸟看看、厦门能见易判、深圳极视角、邯郸市金世达等多家优质服务商于 AI 市场上线并售卖抓拍机、人脸识别门禁、镜头模组、智能机器人等硬件产品,以及中立评估系统、安全帽检测、违禁品识别等解决方案,性价比高,品质有保障。
1)寻相 VX-HT01 人脸抓拍机
结合百度嵌入式作业调度系统,实现端上人脸检测跟踪计算,是一款高计算能力、低功耗、低成本的人脸抓拍机。
2)PicoZenseTOF 深度摄像头 DCAM710
一款基于 TOF (光飞行时间技术)的 RGBD 高性能摄像头模组,可广泛应用于人脸识别,肢体识别,机器人,物流等行业。
3.限时优惠活动
7家服务商发送3000元优惠券
赛蓝、慧谷航天、睿识、贝塔、视派尔、奥比中光、麦哲7家热销服务商各发送价值3000元满减优惠券,有效期至2019年12月31日。
可于7家服务商的移动端店铺中领取优惠券,并在 AI 市场购买相应商品、填写优惠码即可享受丰厚优惠。
查看更多详情请点击“阅读原文”。