查看原文
其他

百度云时序数据库又双叒叕更新啦,这些新功能帮你更好玩转IoT

在万物互联网的时代,世界上的每一个物体每时每刻都在产生着数据,如个人的健康数据、工业设备的状态数据、车联网的实时数据等等。

在物联网蓬勃发展之际,描述物体在时间坐标中的状态信息的时序数据开始变得越来越重要,成为大数据分析、机器学习的重要原料。

因此,存放时序数据的时序数据库,拥有突出的写入性能以及针对时序数据存储和查询的优化,能够解决大部分传感器数据的高并发、高频率的写入存储需求,可谓是天然为物联网而生。



2016年,百度云在天工平台上正式发布了国内首个云端时序数据库产品TSDB,成为百度云全力布局物联网领域的标志性产品。经过两年多时间的发展,百度云时序数据库TSDB已经广泛应用在工业互联网、车联网、智能制造、电气监测、互联网运维监控等领域,并且产品功能和应用场景持续更新。


近日,百度云时序数据库TSDB再次推出一系列新功能,涵盖到私有化环境部署、日历对齐、报表统计等方面,进一步丰富了TSDB的适应环境。下文将逐个介绍TSDB本次推出的新功能,并提供试用地址。


新功能一:私有化部署


近年来,随着物联网应用的兴起,靠近物或数据源头的一侧的边缘计算也开始成为热点。边缘计算通过本地设备实现计算处理、AI推断,大幅提升处理效率,为用户提供更快业务响应。对于行业中一些对实时性、智能性、安全与隐私性比较强的业务,边缘计算可谓是再适合不过了。

为此,低延迟、本地环境部署的场景下成为物联网应用的一种趋势。百度云天工的智能边缘+TSDB-Edge版可以完美契合这种场景的物联网数据存储、端上AI模型执行的需求,并可为用户提供完整的端+云解决方案。




通过百度云天工智能边缘+TSDB-Edge版的解决方案,用户可以轻松实现私有环境的时序数据收发,以及与云端配置的同步。主要能力如下


  • 本地收发+存储:智能边缘完成私有环境下的消息收发,并将接收到的数据转发到TSDB-Edge版。


  • 云端配置:智能边缘的转发规则可以由云端配置完成。


  • 端云同步:TSDB-Edge版中的数据可以配置与云端同步。


随着百度云时序数据库TSDB私有化环境部署功能的上线,用户们可以在自身本地环境中更加灵活的进行数据存储和分析,大幅提升业务的响应能力。


百度云时序数据库TSDB-Edge版已经开放试用,感兴趣的的小伙伴可以看这里!

(https://cloud.baidu.com/survey/TSDBEdgeApply.html)


新功能二:日历对齐


本次百度云时序数据库TSDB还推出了日历对齐功能。TSDB经过在不同行业用户两年多的使用,百度云也发现了一些有意思的现象。比如,在一些电力领域,通常要以日、月、年为单位计算用电量,而参与计算的开始时间和结束时间不一定是整日、整月或整年。


  • 比如,现在是10月26日9:00,查询最近两天的用电量:


  • 那么,昨天的用电量是10月25日00:00-10月26日00:00的和值,今天的用电量则是10月26日00:00-10月26日09:00的和值。


基于这种情况,TSDB提供了聚合函数可以按照自然年、月、日、时、分、秒聚合的方法。


在百度云时序数据库TSDB的查询语句中,Aggregator对象中的sampling参数,增加字符‘c’即可。例如,增加“1 dc ”,则计算结果可以按照自然日对齐;增加如“1 yc ”,则计算结果可以按照自然年对齐。具体操作请参考相关页面。

(https://cloud.baidu.com/doc/TSDB/API.html#.E6.9F.A5.E8.AF.A2data.20point)


日历对齐功能的推出,解决了特殊领域的问题,进一步完善了百度云时序数据库产品的功能适用性。


新功能三:报表统计


时序数据库可以很好地存储各种时序数据,不过数据通常需要进行分析和应用才能具有价值。这时,时序数据库与其他技术结合就能够发挥巨大作用。


例如,在物联网很多场景下,无论是环境保护的监控数据,还是各类工业生产设备的监控数据,TSDB都能够实时进行存储。但是通常在环保领域或者工业领域,都是需要及时了解环境状态或者工业设备工作状态的,甚至还需要了解以日、月、年为单位的运行状态。这就需要从时序数据库中的数据进行统计,并能进行日报、月报,甚至是实时统计。


举一个真实的案例:


  • 在某个环境焚烧厂中,每分钟会上传该时段SO2的排放量,工作人员需要知晓每个小时SO2的排放总量,根据排放总量来灵活安排生产任务,并希望通过这些数据来做数据分析工作。


针对这种典型的应用场景,百度云采用时序数据库TSDB+流式计算的方式来满足业务需求。比如:

 

焚烧厂上传的SO2排放量数据,写入到TSDB中以如下形式存储原始数据:


metric:sensorType

timestamp

field:SO2

field:CO2

tag: factoryID

2017-12-12 10:00:00

46

78

001

2017-12-12 10:31:00

48

75

001

2017-12-12 11:12:00

89

69

001

2017-12-12 11:43:00

79

67

001

2017-12-12 12:04:00

56

90

001


如果我们想实时计算每小时的排放和值,并且进行实时的存储,比如期望结果如下:

 

metric:sensorTypeSum


timestamp

field:sum_SO2

field:sum_CO2

tag: factoryID

2017-12-12

10:00:00

94

153

001

2017-12-12

11:00:00

168

136

001

2017-12-12

12:00:00

56

90

001


那么,我们需要在流式计算中进行简单配置,流式计算会将TSDB中上传的原始数据实时的计算成期望的聚合值,具体配置如下:


1. 首先,配置TSDB的实例为流式计算数据源,系统会自动探测metric下所有的域和tag,并且自动生成各个字段。



2. 第二步,需要配置TSDB实例为流式计算的数据目的地。


3. 第三步,创建任务。根据上述需求,SQL任务可以这样创建:



以上都配置完成后,流式计算就会实时将写入TSDB中的数据计算好,并且以多域的方式写回到TSDB中名为sensorTypeSum的度量中去,两个域分别为sum_SO2和sum_CO2,直接查询这个度量,就能得到聚合后的统计值了。


至此,通过简单的配置,用户就可以实现对焚烧厂上传的SO2排放量数据进行实时统计,并可以轻松形成各种报表。


提醒各位开发者:目前,百度云流式计算目前还是公测期,想使用的小伙伴请在这里申请!

(https://cloud.baidu.com/survey/streamingApply.html)


福利时间


两年多以来,TSDB的功能不断完善和强大,离不开广大开发者的使用反馈。


为了答谢使用TSDB广大小伙伴们的厚爱,小编特意申请五张50元TSDB代金券(在百度云官网实名注册即可使用)。各位小伙伴们,只需在文末留言发表对TSDB功能使用感受,小编将选出点赞数目最多的5个留言,并送出奖品。


百度云TECH DAY活动来深圳了

这一次主题是“万物互联时代,如何玩转设备数据”

百度云数位产品经理和客户的技术大咖

将在现场做分享和交流

一年一度,不容错过哦


时间:2018年11月03日

地点:深圳·伞友咖啡

(深圳市南山区高新区南区粤兴三道

虚拟大学园院校产业化大厦一楼)



会议更多详细信息

可点击“阅读原文”获取



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存