查看原文
其他

互联网50年演进:从Web1.0到Web5.0

紫东君 人民中科 2024-01-09

#Web3.0#相关阅读


互联网的发展,是伴随着我们的需求和使用而不断前进的。作为新生事物,元宇宙里有很多时髦的专业术语,web3.0算是其中一个。本文梳理了从Web1.0到Web3.0的互联网演变阶段,并推演了或将来临的Web4.0和Web5.0。



从Web1.0到Web5.0

关键时刻的预测




01.Web1.0
1993~2004年,信息的共享和交互
标志性启动事件:Mosaic浏览器的出现,是点燃因特网浪潮的火种之一。
变革原因和对Web2.0的影响:互联网产生了大量的数据,但是因为技术瓶颈无法盈利。

02.Web2.0
2004年起,数据价值深度挖掘,产生互联网巨头
标志性启动事件:谷歌在2003年后陆续发表关于GFS、MapReduce 和 BigTable的论文。
变革原因和对Web3.0的影响:智能数据的价值深度挖掘,互联网巨头开始盈利,并形成垄断,在智能手机带来APP数据隔阂,用户需要更开放和公平的互联网。互联网平台已经深度数字化,孵化了各种大数据和云计算的技术底座。

03.Web3.0
2018年起,数字化的普及和对等价值交换
标志性启动事件:《通用数据保护条例》(GDPR)的发布。
变革原因和对Web4.0的影响:数据平权和对等价值交换,打破APP的隔阂和互联网平台的垄断,个人和组织的深度数字化,积累可以孵化AI的完备数据画像,量变引起质变。

04.Web4.0
预计从2030年起,意识的交互
标志性启动事件:面向个人的完备AI助理,通过熟人的“图灵测试”。
变革原因和对Web5.0的影响:对人类大脑和行为的深度模拟,完成Web5.0需要的智能基础,人机融合可以进一步解放生产力。

05.Web5.0
预计从2045年起,意识的互联,人机融合
预测标志性启动事件:人机融合的图灵测试。
Web 1.0

信息共享的时代



在Web1.0时代,诞生了门户网站、聊天软件、BBS、电商购物网站等互联网应用。这个时代最大的特点是联网在线,任何线下的场景搬到线上就可以获得火热的关注。Web1.0的兴起很重要的两个原因是个人计算机的普及和因特网的大众化。


在Web1.0里,大多数互联网应用只能做到信息的发布、共享和交互,很少能做到更深层的价值挖掘。第一代互联网在盈利模式上始终是个难题,这个问题导致了第一次互联网泡沫的破裂。1994~2004年,是第一个互联网浪潮兴起、泡沫和衰退的完整周期。


在Web1.0时代,虽然互联网企业的名气比较响亮,但是在市值和盈利能力上还是那些企业信息化的IT巨头们更胜一筹,例如微软、思科、英特尔、IBM等。


互联网给数据技术带来的最大挑战就是数据量极大,但是单位数据的价值不高。企业的应用和业务流程数据往往是抽象和精炼的数据,如果把那些IT巨头面向的企业级信息化的数据和系统比作工厂在矿山里炼金,那么互联网的数据处理就像是在河里淘金,这两个场景需要的技术体系完全不同。互联网企业需要以极低的成本来收集、存储和处理数据,然后通过精准的广告体系来变现。 延伸思考

Web1.0时代,你每天花多少时间上网和线上社交? 

Web 2.0数据的大浪淘沙时代诞生互联网巨头

Web2.0诞生的标志性事件应该就是谷歌在2003年后陆续发表了关于GFS、MapReduce和BigTable的论文,解决了数据存储、计算和处理的成本问题。谷歌通过内部自研,攻克了互联网领域的这三座大山,通过大数据的成本优势,很早就实现了盈利,并于2004年公开上市。


各互联网公司通过开源和合作的方式逐渐把谷歌的理论工程化,形成了后来的大数据技术和生态体系,成为互联网业务的基石。
Web2.0时代是数据、计算和产品的工业化时代,互联网平台处理数据的成本越低、效率越高,其垄断地位就会逐渐形成。过去十几年里,在搜索、社交、地理服务和信息发布等各个领域,出现了各种各样的互联网平台,这些巨头利用自身在数据上的技术和规模优势,不仅仅通过精准广告实现了数据的价值,也通过数据、流量和场景的结合对传统行业造成了巨大的挑战。

有了精准的数据,就可以形成巨大的流量;有了流量,就等于把控了线上的营销渠道。通过大数据和千人千面的精准建模,互联网巨头也开始渗透金融领域,通过金融的杠杆不断放大业务规模。
海量的个人隐私数据让一些互联网平台得以引导用户购买特定产品,使得用户对投放的内容和产品上瘾。它们利用大数据杀熟,同样的商品和服务,多次查看价格会出现变化,老客户的价格比新客户更高。它们只推荐能带来潜在商业利益的产品甚至假冒伪劣产品,而不是对用户最适合、最恰当的商品。


在数据安全上,在“不登录不让使用”“不同意收集数据不让使用”等条款下,个人数据被过度采集。互联网平台在管理用户数据的时候,其管理政策和技术过程的披露不够公开透明,也发生过对内监管不严数据被过度使用、对外数据泄露的安全事故。
延伸思考

在Web2.0时代,你清楚自己的数据被怎样使用么? 

Web 3.0

数字化的普及和对等价值交换


为了规范管理互联网平台的扩张和对数据的使用,欧洲颁布了《通用数据保护条例》(GDPR),中国也制定了数据安全法。GDPR规定数据主体享有的七项数据权利分别是:访问权、更正权、删除权(“被遗忘权”)、限制处理权、可携带权、反对权,以及不受制于自动化决策的权利。



与此同时,在区块链的分布式和去中心化的哲学思潮的影响下,科技圈也希望用更透明、更公平、更开放、更去中心化和价值连接的方式实现一个全新的互联网。个体用户不仅仅在乎数据的权力,也在乎怎样在新的互联网架构体系下分享到价值,这就是Web3.0概念的产生。
如果说,Web2.0给用户带来的困扰是垄断、算法不透明和数据滥用,那么Web3.0就需要在分布式、隐私、开源、信任和连接上做到更好,让互联网用户能够真正分享到Web3.0的好处。
在Web2.0时代,即使作品版权归用户,但由于流量完全控制在互联网平台,用户很难将自己的作品或者数据变现。所以对Web3.0的定义,信息对等的价值交换取代了“Own”的概念,如果资源不能带来预期的收益,用户的所有权无法体现价值。

Web 3.0的典型应用(来源:101blockchains)


如果说Web3.0的核心是数据平等和对等价值交换,数据平等是为了更好的和规模化的对等价值交换,那么可以围绕以下内容来展开各种探索。


个人数据管家


假设网络的速度足够快、延时足够低,也许云手机的生态可以加速个人数据管家的诞生。
现在的互联网架构中,有大量应用要用手机号码注册,而手机号码又直接对应个人最隐私的数据——身份证号码,一旦暴露,将给个人带来极大影响。而通过云手机里个人数字管家生成的虚拟身份与各种APP对接,可以在真实身份上加一层防护,实现数据更高级别的安全防护,避免隐私的泄露。


Web3.0的网络链接价值


对Web3.0来讲,参与其中的个体和企业是对等的关系,在价值交换时需要经过复杂的网络链接,而不仅仅是通过单一的互联网平台。
例如,一个企业在做招聘的时候,可以通过带明确激励条件的小程序做传播,每个点击、传播和报名的用户都会通过信息加密记录下来。经过多次链路传播后,企业可以核对最终录取者的信息,并把激励发放给链路中间所有的贡献者。如果企业能够长期保持其在激励上的信用,应该是可以替代传统的网站招聘方式,毕竟企业招聘和帮朋友介绍机会是个双赢的事情。这样的方式可以做到精准的信息匹配,在一定程度上也能很好地保护链路上用户的隐私。


Web3.0时代,并不是要倒退到互联网的前夜,做事都得靠关系,靠线下的走动;而是要让这种线下的信息和价值,实现数字化、网络化并且可传递。深网信息挖掘的技术变得更重要,可能强化版的图数据库会成为时代的主宰,各种中小型信息数据站点又能够繁荣发展。


Web3.0会是一个技术上的倒退么?


类似GDPR的法规,必然会对互联网平台在技术架构体系上产生各种约束,数据的收集、处理、应用和归档难度也大幅增加。Web3.0需要的分布式体系,在起步阶段的效率,可能不如集中式的Web2.0互联网平台。并且Web3.0时代需要的分布式体系,不仅仅是个分布式计算体系,不仅仅是上万个计算节点组成的云,不仅仅是一个大的分布式数据库,而是一个由很多个体和组织联合起来的,分布式、隐私、开源、信任和价值连接的复杂体系。

也许在一段时间内,Web3.0体现出的技术水平没法超越Web2.0时代。不过通过Web3.0的建设,个体得以深度数字化,为Web4.0的到来提供了全面的数据基础。如果没有数据平等和对等价值交换的基础,到了Web4.0和Web5.0时代,还是互联网平台垄断一切,其副作用将不可想象。
延伸思考在Web3.0时代,怎样不被各种概念忽悠? 


Web 4.0

AI+脑机接口 意识的交互





AI的发展从量变到质变


计算机科学和密码学的先驱阿兰·麦席森·图灵于1950年写了一篇论文《计算机器与智能》,文中预言了创造出具有智能的机器的可能性,提出了著名的图灵测试:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能。图灵测试是人工智能哲学方面第一个严肃的讨论。
在2006年之前学习AI的人可能会感受到,无论用什么算法都很难满足通用场景。哪怕是现在看起来挺简单的车牌识别和人脸识别,当时都靠算法工程师调参的手艺,可能在一个特定的场景下可以工作,但是切换到另一个相似的场景就不能满足要求了。


随着互联网的发展提供了丰富的大数据资源以及GPU的硬件性能提升,AI的发展终于在2016年迎来了质变。2016年3月,Google旗下的AlphaGo在韩国首尔以总比分4比1的成绩战胜了围棋世界冠军、职业九段选手李世石。2017年5月,进化后的AlphaGo在“人机大战2.0”中,以3:0战胜世界排名第一的中国选手柯洁。
今天,大家可能觉得AI还是无法真正的读懂自己,特别是一些个性化问题。这背后的深层原因是现在的大数据积累都是从互联网平台视角出发的,而不是从个人用户视角出发的。
即使互联网平台拥有大量的数据,但其在个人的维度上是碎片化和不完整的。由于数据隐私问题,个人也不可能把自己的完整数据交给互联网平台。但是可以想象一下,如果个人的数字管家,拥有一个人一生的数字化的记录,比如收集记录一个人一生的视频,每个刺激、反馈和动作,每个阅读的内容和笔记,每一段对话和思考,那这样的数据足以训练AI读懂一个人。
如果Web3.0真的可以实现,可以想象,个人数字化水平会有飞跃的发展。随着技术的发展和进步,“个人数字化”的门槛会大幅降低,越来越多的个人数字画像会被完整记录,虚拟数字人也会越来越懂个人的需求。


AI通过脑机接口读取人类意识


科学家和工程师提升计算机的AI水平时,另外一条研究路线也取得了巨大进步,那就是对大脑运作机理的研究。对大脑的研究除了通过输入和反馈,也需要对大脑的实体进行深度研究。其中脑机接口就是一项非常实用的技术。目前,大部分的脑机接口就只是对大脑进行读取信息的操作。


观看视频了解脑机接口
2021年5月,斯坦福大学、霍华德・休斯医学研究所(HHMI)和布朗大学等团队用脑机接口技术实现了瘫痪患者将脑中的“笔迹”转化成屏幕字句,并在Nature杂志发表论文《High-performance brain-to-text communication via handwriting》。
他们将AI软件与脑机接口设备结合,利用大脑运动皮层的神经活动解码“手写”笔迹,并使用循环神经网络(RNN)解码方法,将笔迹实时翻译成文本,快速将患者对手写的想法转换为电脑屏幕上的文本。实验人员每分钟可以输入90个字符,接近正常人在智能手机上的打字速度,这个性能已经非常接近实用场景了,实现了AI读懂人类大脑中的表达。

大脑中不断闪现想法,不一定每个想法都有语言的表达和身体的动作反馈。人的一生做不了太多次重大决策。如果只是把最终表达出的语言和实际落地的行动作为AI训练的来源,样本量就会过少,就会遗漏掉那些人性最重要的部分,使得AI无法模拟人类在关键时刻的决策。


AI实现对大脑的模拟的3个方向
1、AI对抽象但是简单的概念进行识别,例如对图像、声音等的识别来模拟大脑的功能;2、通过预测—反馈的不断测试和复杂的博弈场景,利用全面的个人数据,用AI来拟合人类对各种输入的反馈;3、通过对脑机接口的研究,一方面深度挖掘大脑隐藏的工作机制和那些没能表达出来的想法,塑造更完整的AI;另一方面提供一个很好的人机交互方式,人类可以通过简单的方式表达自己的意识。




未来,也许人们会随身戴上便携式的脑电设备,用以训练属于自己的AI助理。无论是游戏还是汽车驾驶,都是非常适合迭代优化个人AI助理的场景。当AI助理足够了解你的时候,人们就可以复制多份AI助理,用来处理不同的工作,大家就应该可以把更多的时间放在家庭和休闲上了,这时候的AI助理应该称得上合格吧。在Web4.0时代,可以实现意识的复制,意识在虚拟空间的交互,还有计算机对大脑意识的读取。
延伸思考

在Web4.0时代,怎样保护自己的意识被合法使用? 

Web 5.0

人机融合的时代



也许大家觉得Web5.0的提法有些过于超前,不过很多Web5.0时代的技术,现在都已经在萌芽了。人机融合的定义,借用图灵测试的标准,就是无论是在网络的交流中,还是实际的交往中,已经分辨不出是机器还是人了。


首先,我们从仿人机器人开始说起。在人形机器人领域受关注度最高的玩家要属波士顿动力公司。
2009年,波士顿动力的双足机器人Petman原型机亮相,此时它需要拖着电缆在履带上晃晃悠悠地行走。
2013年,初具人类外形的Atlas原型机亮相,这时的Atlas已经能够在碎石堆上行走,还会“金鸡独立”,以及承受大摆球的撞击。
2017年,波士顿动力被日本软银集团收入囊中。易主并未影响到Atlas的快速成长,它的动作更加流畅,并且能够上台阶、后空翻等。随后几年里,Atlas学会了跑步、体操、翻滚、倒立、跳舞等技能。
2022年8月11日晚间,小米的秋季新品发布会推出了小米首款全尺寸人形仿生机器人——“CyberOne”。

图源:小米官网 
据特斯拉官方宣布,特斯拉2022 AI 日将于10月1日(北美时间2022年9月30日)在加州帕罗奥图举行。届时,机器人Tesla Bot预计首次亮相。

图源:特斯拉官网


根据特斯拉的计划,Optimus最早将于2023年开始生产。从传感器和执行器的角度来看,制造一个人形机器人是有可能的,目前所缺少的要素有两点——足够的智能和扩大的生产规模。Web4.0的发展和积累刚好可以给机器人带来足够的智慧。
如果AI机器人对外界的每一个刺激都能做出跟人类一样的动作和反应,那么在模拟人的方面就算是成功的。但是机器人的结构与人类肯定会有天壤之别,以机械或者其他材料打造的机器人是无法模拟人类的血肉之躯的,也无法提供人类交流时需要获得的真实感受。也许听觉是第一个被AI机器人模拟成功的,然后视觉可以模拟一部分,但是像触觉、嗅觉、味觉等就很难模拟。

Web4.0阶段的脑机接口只是实现从大脑读取意识,但是在Web5.0阶段,脑机接口还需要实现给大脑写意识的功能,这样才能真正实现意识的互联互通
延伸思考

人类在Web5.0时代,能与机器共存么?技术进步得越来越快,人类的意识真的可以互联互通吗?


责编:岳青植
监制:李红梅


文章来源:互联网上下50年,万字长文推演Web1.0到Web5.0》信息与数字化,内容有删减



往期回顾

9.27 人工智能通用化 | 多模态认知计算让AI走向“多专多能”

9.26科技前瞻 | 改变未来世界的20项重大科技趋势

 

 

9.19破除人工智能技术滥用,AI赋能个人信息安全智慧治理


关于人民中科人民中科智能技术有限公司,是人民网与中科院自动化所共同发起设立的“人工智能技术引擎”和科技成果转化平台,拥有世界领先的内容理解技术,核心产品是跨模态智能内容搜索引擎“白泽”,初始应用场景是数字世界的安全,目标是成为全球内容科技领导企业。


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存