查看原文
其他

用旧思维搞新东西,行不通

镇长本人 大树乡谈 2024-04-24
数据火了,去年以最顶级的形式印发了俗称为“数据二十条”的《关于构建数据基础制度更好发挥数据要素作用的意见》,今年两会前还是以最顶级形式印发《数字中国建设整体布局规划》,机构改革中更是专门成立了“国家数据局”,主管数据这个最新生产要素的基础制度建设和开发利用。

再往前,数据资产交易早就在全国各地试点,出现了一批数据交易所,但小镇可以把话放在这,这些交易所如果还是沿用过去的思维和模式,不可能成功。

什么叫旧思维呢?
就是还想着搞一个集中的交易所,类似于商品交易所或者股票交易所那样,拿到数据就想直接交易,还要玩出点花活,如果数据这么容易就能交易,国家又何必费这么大功夫要建立全新的体系。

先说最基本的,法律对隐私的保护。目前数据领域有三部重要法律法规:《数据安全法》《个人信息保护法》《征信业务管理办法》,对数据的采集、应用等进行了详细规定,明确要求采取“匿名化”的隐私处理要求。
注意,这是数据应用一个非常关键的点,想要理解并应用数据资源,一定要搞明白。

所谓“匿名化”,就是要求个人信息要经过处理后无法识别特定自然人,并且不能复原,换言之,要求个人的数据要在处理后完全不能关联到个体才行,这基本是不可能实现的理想状态。目前欧盟、中国都是采取这种要求。

美国要激进得多,采取了更鼓励数据流通的路线,美国相关法律规定个人数据只要去掉特定标识,就不再认为是个人信息,就可以直接拿来用,比如美国加州的消费者隐私法案、联邦层面的健康医疗安全法案等等。

通常的做法是,把个人信息与特定人有关的内容,比如姓名、证件号等,用一个ID号代表,这个ID号可以是通用的,相关数据无论到任何场景下,都能够还原,就可以用来研究不同个体的数据特征,从而加以应用。以美国健康医疗安全法案为例,采用两种方法完成去标识,一种是直接删去18种个人识别符,比如姓名、州以下的地址信息、电话、车牌号、邮箱地址、身份证号、人脸照片、银行账号、社保卡号、指纹声纹等,第二种就是由专家评审确认,但并没有明确到底什么样的专家有资格。

如此宽松的隐私保护要求,客观上确实让美国在数据利用上跑得很快,但风险也要大得多,具体利弊得失,就不进行比较了,大家可以自行思考。

回到国内,法律的规定是一条底线,现在对个人隐私保护极高,数据利用的整体上更倾向于谨慎,比如2021年出台的《互联网平台分类分级指南(征求意见稿)》、《互联网平台落实主体责任指南(征求意见稿)》,就按照用户数对平台进行了分级,而同年发布的《网络安全审查办法(修订草案征求意见稿)》,将数据监管的目标定在了“100万用户个人信息”这个标准。

以中国庞大的互联网产业而言,随便一个APP,100万用户、1000万用户都很稀松平常,别说2023年了,早在2020年1月,排第100名的手机APP月活用户数就超过3000万,注意是月活用户,注册用户数必然远大于月活用户。

就拿小蓝车“哈啰”为例,去年3季度宣布季均日活用户超过1000万,首次超越滴滴位列出行类第一,但哈啰的注册用户数早就超过了5亿人。

这就出现了复杂的数据安全监管和保护问题,还涉及到极为敏感的数据跨境流动问题,别觉得数据存在国内好像就符合规定了,实际上这么多合作伙伴,就算都在国内,但如果同外企进行数据流通,那也视同为数据跨境流动。

所以,想要直接交易数据,必然面临重重风险,被处罚、APP下架、关停整改等等,都是很现实的风险。

现在的数据交易所,想着直接卖数据,显然解决不了数据去敏的难题,其中的风险可想而知。

除了法律风险,数据与其他生产要素也有很大不同,那就是不经过处理的数据毫无价值

怎么理解呢?

这里要介绍一个“DIKW体系”,最早是由哈兰·克利夫兰在1982年提出的,将资讯划分为四层,由低到高分别是:

D:Date,数据

I:Information,信息

K:Knowledge,知识

W:Wisdom,智慧

就拿一个APP来说,用户活动获得的数据仅仅是原始素材,想要发挥数据的价值,就必须经过加工处理,比如数据的清洗,去掉异常、无价值的数据,还要对数据打标签,也就是前些年新出现的工种“打标员”,现在特别盛行的AI模型,训练的数据也必须经过数据清洗、打标签后才能使用。

不过这些年,最低端的打标员开始被替代了,行业从人工打标,已经进化到了机器打标、大模型打标,不得不说数字领域的进化速度实在太快,几个月就相当于传统行业的几年甚至十几年。

人工处理之后就获得了信息,也就是有实际意义、有逻辑的数据,在信息的基础上提炼不同信息之间的内在联系,并通过行动去验证,就是知识。

而在知识之上,以全局视角去贯通、思考,并能够预测未来,解决过去没有经历过的事情,就是智慧。

这个过程很不容易,别看很多大公司说的天花乱坠,实际数据质量惨不忍睹,光从数据到信息这一步,就走的很勉强。

为了方便理解“DIKW体系”,还是得举个例子。

2021年奥运会结束后,小镇以奥运改革为例谈改革,谈苟仲文破旧立新,核心有二:科学和体能,在科学这个点,小镇谈到中国跳水队的“3D+AI” 跳水训练系统,为每一名运动员建立了专门档案,记录运动员的每一跳,与历史最好一跳做对比,逐帧往前分析为什么会不如最好一跳。

整个分析过程在几秒钟内就完成了,还不等运动员上岸,分析结果就出来了:这一跳水花大了,是因为手接触水面时角度差了几度,一路往前推,最终结果是运动员起跳力度不够,而力度不够原因是登台的时候脚麻了。

还有个例子,苏炳添在东京奥运会上打破了黄种人的最高纪录,成为人类历史上第12个跑进9秒83的人,数字化的分析模型发挥了不可替代的作用。围绕苏炳添建立了一套完整的模型,具体到起跑后第一步的步长、第二步的步长、前7步的累计步长乃至预备的时候前后腿膝关节角度等等。

这些都是最基础、最原始的素材,也就是D“数据”,获得这些数据后,综合历史所有训练数据,分析得到各种结论性的I“信息”,比如这一次起跑姿势不合理,与最佳角度差了多少,导致前7步累计步长偏小等等。

而从这些结论性的信息再向上,就要总结如何改进,比如是优化技术细节还是加强体能训练,尤其是要结合苏炳添本人的特点,甚至还可以细化到结合准备比赛当地的气候条件,进行针对性调整,这就是K“知识”

再进一步,以苏炳添的历史数据、总结为标准,再结合更多运动员的情况,形成一个能够适用于所有运动员,具有普遍性的标准体系和强化训练的一般策略,就能够把个例变成普遍,从而整体提升中国运动竞技的水平,而这一套体系当然也能够适用于全民健身,为普通人健身提供更科学的指导,就是最终极的W“智慧”

这就是数据的价值。

相信有朋友已经看出来了,数据不是搜集到了就有价值,关键要真正用起来,要跟具体的场景、具体的需求相结合,各种数据交易所显然没有这个能力。

比如上面举例的运动员,无论多么优秀的运动员,一天总训练时长和训练量是有限的,如果充分挖掘数据,甚至能够具体到根据运动员当天的身体情况,制定最科学的训练计划,必然能够让运动员在最短时间内得到最好的训练,还能避免受伤的风险,而超量、过度训练本就是运动员生涯的大挑战。

这套逻辑,也适用于个人,哪怕我们不可能像国家运动员那样得到如此全方位的针对性训练,但哪怕仅仅掌握“DIKW体系”的原理,自我搜集数据、提炼信息,并整理为知识和智慧去引导自我成长,也必然能够提高我们进步的效率。

比如小镇之前分享的健身,就特别建议大家注意数据的采集和应用。

回到今天的正题,既然说数据交易所这种按照传统思维,直接把数据视同为商品、股票的交易方式不可行,那又该如何发挥数据的价值呢?

一定要建立新的思维,用数据联通更多的场景、需求,继资金流、能量流、商品流之后,将信息流升级为数据流,对一个组织内部和跨组织的大系统进行流程再造。

一个特别重要的途径就是用数据链接需求和供给,通过对数据的应用发掘潜在的需求,并调动生产制造、物流仓储等全系统的调整。

2020年中央经济工作会议首次提出“需求侧管理”,后来要求把需求侧管理与供给侧结构性改革结合起来,有很多解读,数据的重要性尚未得到足够关注,建议一定要把数据这个要素考虑在内,纳入数据的维度思考如何实现“需求侧管理和供给侧结构性改革有机结合”。

在这个领域,中国大有可为,具有全球无可比拟的优势,当然也会给企业和个人带来新的机遇。


其他文章推荐
■  掌控自我、赢得未来的方法论
■  透过机构改革,把握未来的发展方向
■  百万亿市值的庞然大物,究竟在哪呢?
 48小时未发文,点击这里  ■

如果喜欢,还请点赞、“在看”和关注吧
欢迎分享,让更多人发现“大树乡谈”
防失联,请关注“大树乡谈2022、2023”
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存