查看原文
其他

讨论:数据应用的价值,是数据驱动?还是需求驱动?

讨论比结论更重要,有很多事儿,似乎永远只有讨论而很难有结论,因为大家的社会属性不同、目标不同、看问题的角度不同,例如抗疫问题上美国人对川普和盖茨的撕裂态度一样。

昨晚在图数据库行动的群里,大家伙开始了数据应用价值的讨论,起因貌似某单位开始考虑实施数据资产化的运动。今早群主田老师做了一个引领性的概括,大意是:信息技术领域是需要统一语境。前天到某电网公司拜访,领导们都对信息技术领域近年来的概念满天飞,中层疲于应付被折腾,基层干活不知所措表示疑虑和困惑。昨天去某发电厂启动标准化建设咨询项目,这里的厂长到是很有定力,不管那一套,先梳理清楚业务,整理精简制度标准流程,再形成标准化体系。改口头禅“以前是怎么怎么做的”为“标准规定是怎么怎么做的”。

(网络借图,感谢制作者)

最近,看到网络上有几篇文章谈数字化转型时,在津津乐道的宣传数据驱动,最近数据又被提到高数据资产生产要素的高度。经过好几天的理解和学习,俺觉得生产要素这个提法是对的,数据就像农民兄弟手中的锄头一样,用好了可以发挥价值,用不好也可能锛了自己的脚趾头。


一、我所经历和我所知道的,都是需求驱动了数据应用


数据本就在那,只有分析了才叫信息,信息被利用了才有价值


正好前几天写了这篇文章,从我们过去比较熟悉的低频电磁波勘探到电网设备的运行,粗浅的讨论了数据、数据分析、数据利用之间的价值传递过程,其实,我的意思很简单、貌似也有点极端:数据本身并无价值,只有分析了并被利用、并且用好了、有了效益才具有价值,就像太阳辐射所形成的电磁波,40多亿年以来,它们就一直存在着,它原本是一个自然的物理现象,没有数据不数据这一说,有了无线电通讯之后,它们被认为是一种电磁波干扰,但是随着研究的不断深入,终于有这么一天,物理学家和地球物理勘探学家们发现,其中的低频电磁波部分还可以用来寻找和发现矿产资源,这个典型的案例向我们表明,是需求驱动了研究,是研究开发了应用,从自然存在的物理现象中提取出有用的数据,通过工程应用验证了这些数据的价值。

竺可桢(1890年-1974年),字藕舫,浙江省绍兴人。中国科学院院士,中共党员,著名的气象学家、地理学家、教育家。中国近代地理学和气象学的奠基者。


如果大家对太阳辐射低频电磁波勘探的例子,还觉得不够解恨的话,我再举一个更加令人醍醐灌顶的案例,中国近代有一位伟大的气象学家叫竺可桢,老先生在民国的时候就做出了令我们后人都匪夷所思的巨大贡献,更多的故事可以在百度搜索我于2017年写的文章《竺可桢:文理兼修的气象学家,大数据的鼻祖》。


有院子的人都会经常用扫把打扫院子,估计没有人会想到打扫院子,这里面有什么大学问?会得到什么数据?能做什么研究?会发现什么问题?但人家竺可桢老先生却不这么认为,晚年不得志的时候,老人家也没有中断对气象的研究,他每天认真的打扫院子,利用打扫出来的尘土,继续研究大气降尘量与气候的关系。


请收起我们一看到大数据就激动不已、漂浮在表面的亢奋情绪,彻底的静下心来,深入琢磨一下、认真的思考一下,仔细的品味一下,低频电磁波勘探和竺可桢老先生别具洞天的研究,给我们带来了什么样的心灵启智和思想震撼。


二、电网安全运行和可靠性将进一步激发数据的深层次应用

就像这两个案例中所表达的,其实,在获取数据之前,是还不称之为数据的一系列物理现象。电网运行中就存在各种情况和物理现象(例如,电流流过设备或者负载会产生温度、温度高了会导致负载中的元器件、连接件损坏甚至着火,酿成电网事故...),出于电网安全和可靠性管理的需求,人们认识到这些物理现象有用了,于是乎,才会想办法从这些物理现象提取数据(例如电压、电流、温度、无功、谐波系数等),并对数据进行分析,进一步指导电网设备的运维工作。这些事儿,自从有了电网,就一直没有停止过;只是不同的时代、不同的需求、所用的方法和制度有所不同、数据被利用的深度和广度有所区别罢了。

现在电网安全性要求进一步提到了,就需要挖掘和研究更深层次的物理现象、利用采集到的数据监测这些物理现象的变化,进行更加深入的分析,例如局放问题,局放往往伴随着瞬间的温度、声音、震动、闪光以及电磁辐射,可能还有我们未知的其他物理和化学的现象,单一物理现象的监测与分析可能不足以研究全部的问题,所以,基于多参量的监测以及在更大电网区域、更多设备、更多电压等级、基于AI的全域分析和的挖掘,就成为电力物联网的热门课题了。


三、有没有数据不产生价值的情况呢?

有,太多了。

例如1:Google从前搞的那个互联网大数据项目“Flu Trends”,就失败了,辛辛苦苦弄来的数据、包括投入巨大所开发的应用都打了水漂,估计都付之东流了。

例如2:上世纪80年代末期我利用高斯赛德尔迭代,尝试一种自己设计出来的、新的噪声剔除方案,试图解一个地震数据超级庞大的向量稀疏矩阵,结果失败了,很惨。

假设3:前面提到的低频电磁波勘探,理论研究是可行的,但如果存在下面任何一种情况,都意味着项目难以成功,一是理论与客观实际差别较大,数理模型有缺陷,又不能找到修正的方法;二是测量仪器无法准确的采集低频电磁波数据或者无法从收集到的数据中有效的剔除干扰;三是勘探和后期解释的方法不合理、不科学、没有足够的经验等。


四、正确树立数据应用的价值观

我们回过头来再看这篇文章的题目,我们深刻的理解一下:关于数据应用的价值,是数据驱动呢?还是人的需求在驱动?

人类生存与发展的需求是社会发展的动力源泉,就像我六年来刻苦学习新石器时代考古所总结出来的一些东西一样,电网公司的安全性要求不断提高,也将促使人们用更多的新技术来解决已经遇到和将要遇到的各种问题,例如:设备故障树的研究,我们可以粗浅的理解:故障模型是指单一故障发生的规律,而故障树是指多个故障之间相互作用和影响的关系,就像高血压会引发中风、中风又会引发瘫痪、植物人甚至死亡一样,设备的很多故障之间也是相互影响、相互转换、相互作用的,我们期待基于知识图谱技术的图数据库能在这方面发挥进一步的引领作用。


五、正确评估数据应用的价值链

研究数据价值、数据应用、数据资产、以及以数据为核心的生产要素,是一件好事儿,但是,建议不要趋于表象、浮于表面,要深刻研究从需求、到数据、再到数据分析和数据应用、直到数据应用成果的整个价值链分析,客观的评估人、数据、系统、组织制度与业务流程等各方面在数据应用价值链上的贡献和作用。从数据全寿命维度构建一个数据价值链模型。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存