查看原文
其他

5G:所有细节都是挑战,要更关注愿景和宏观形势

赞赏小侠 笔记侠 2019-10-15

点击笔记侠关注△ 回复“1”领取今日日签和福利大礼包



内容来源:2019年7月25日,在GWC长城会主办、笔记侠联合主办的GMIC 2019产业智能升级大会上,5G极化码之父阿里坎教授进行了以“5G与极化码”为主题的精彩分享。笔记侠作为合作方,未经主办方和讲者审核。


讲者简介:埃尔达尔·阿里坎,2008年提出“极化码”理论,极化码被认为是第一种可以被理论证明的逼近香农“信道容量极限”的编码方案,阿里坎于2018年6月获得信息理论领域的最高荣誉“香农奖”。


讲者 | 阿里坎

封面设计 责编 | 马畅

第  3964  篇深度好文:6047 字 | 12 分钟阅读

完整笔记·人工智能


本文优质度:★★    口感:薯格


笔记君邀您阅读前,先思考:


  • 什么才是真正的5G?

  • 我们如何迎接5G方面的挑战?


一、大数据的时代特点


大家好。非常高兴能来到这里,今天我想跟大家分享一下5G和极化码。


现在人工智能对科学发展起着推波助澜的作用,如虎添翼,希望这个课题能给大家带来帮助。


1.我们生活在数据的时代

 
当下,我们生活在数据的时代,数据的发展趋势呈指数级增长。在社会当中,在机器上的设备当中,以及在传感器当中,每天产生的数据都是指数级增长的。
 
它的增速非常快,使得收集、存储和处理这些数据,全都成了问题。

为了应对海量数据所带来的问题,我们研发出了一系列的方法:
 
比如用大数据的挖掘、大数据的存储,来使数据——基于拥有更强算力的数据分析、数据处理以及计算技术之上——以更好的方式存储。
 
对于未来而言,我们的社会一定会继续生成越来越多的数据,大家对数据相关的技术,包括数据传输、数据存储、数据分析等一系列的技术的需求,只会日益增长。
 

▲ 长按图片,分享给需要的人

面对这么宝贵的数据资产,我们要怎么做呢?

数据会生成、收集、存储,还要找到渠道对数据进行访问;由于数据是海量的,所以我们一开始就还要对数据压缩。

 

这时候要看一下这个过程中涉及的通讯流程,它跟通讯理论有关,通讯理论里面有一些内容关注数据的处理。

 

另外,我们要想办法保护我们的数据,防止噪音、防止数据的损失;我们也要想办法实现数据的通信,将数据从一点传输到另一点;当然也希望进一步加密数据,保护数据安全性。

 

我们也要对数据进行加工,比如说去识别一些特定的模式,如果有必要的话,会生成警报。

 

这些跟通讯和5G的关系不是太大,但也是我们跟数据打交道时经常会用到的几种方式,这些方式更接近操作层面,跟5G的技术和人工智能更加相关。



我们来进一步了解数据是什么,在了解的基础上,希望我们能就数据来采取行动。
 
我们希望传输一个信号给到一个控制系统,根据这个控制系统,由它们做出一些变化,由它们采取一些行动,对这个世界进行改变。
 
因此,这会是一个非常复杂的控制系统,这个系统里有很多的构成部分,整个操作也非常复杂。
 
我从《IDC数据时代2025年报告》里面借用了这样一些数据:
 
2025年的数据社会,将会以三层级的结构加以组合,核心是储存大量数据的地方,储存在服务器上,包括云、互联网,都是整个网络的核心部分。
 
实际上我们没有办法触及那一部分,我们作为使用者,传感器都处在外围,我们处在端点,处在周边边缘的位置。
 
我们身边也环绕着其他数据的使用者,核心和端点之间有边缘,就可以实现使用互联网的功能。
 

比如手机,它是互联网和用户之间的接口,我们的手机就是一个边缘,数据本身在不断增加。但是数据本身的增长也会有瓶颈,可以用于边缘的带宽,它本身是有瓶颈的。


现在的通讯领域,边缘本身已经面临了这样一个带宽的最高界限,这是我们现在所面对的现实,这就是我们为什么要开发5G技术的原因。
 
基本上,我们每隔十年就会看到数据海量增长,对带宽的需求也会相应增长。我们能做什么呢?
 

▲ 长按图片,分享给需要的人

数据的生成,集中在核心的位置。如果要获取这样一些数据,实现会比较久,成本也比较高。因此,这就是我们对于未来设想的一个基本前提。
 
数据的消费者有哪些?社会上的各行各业都在生成数据、使用数据,那我们前进的方向是什么?
 
我们要意识到每天都在生成大量的数据,它停留在数据空间的核心部分,数据交换的方式和交换的数量也在呈现海量地增长。
 
不仅仅是人类,更多的设备、更多的机器都将会处于互联互通的状态,很多数据将以自动的形式生成,包括AR、VR、自动驾驶,数据来自医疗、财务等领域。
 
所以我们将会进入到一个海量数据的时代,它以海量连接、海量智能为特征。
 
在这之前有一个非常重要的前提,我们必须要有能力去处理、加工这么多数据,还要为这么多的数据找到所有存储空间。
 
我们这里讲的数据,大部分指实时生成的数据。我们面临的挑战有哪些?
 

首先,是带宽的挑战。这个主要是网络及工程师们要解决的问题;延时和可靠性的问题,也是通信领域工程师们要解决的挑战。


其次,是数据处理的挑战。怎样解释数据,从数据中提取知识,从数据中学习技术?这些不是工程师要解决的,但我觉得这些问题更为重要,对我们挑战更大。

▲ 长按图片,分享给需要的人

现在,在信息领域和物理空间领域,人们不断在讲“赛博物理空间”,或者叫做虚拟现实空间。
 
在信息领域加工数据,在物理空间领域,比如说在工厂里面生产汽车,生产汽车的流程就可以帮助我们进行数据的生成。
 
这是一个流程,是一个完整的环路,人置身于这样的环路之中,人也有可能完全处于这样的环路之外。这样的环路完全由机器控制。
 
在这种情况之下,环路操控的可靠性会提升,安全性也会增加,且不会出现任何误差。
 
否则它的可靠性会降低,我们也没办法相信这些机器,没办法相信它们所做出的决策。
 

二、从数据的层面解读5G


5G是什么?我们有很多视角去看5G,大家也有不同的答案。

 

从数据的角度来看,更容易帮我们理解5G的概念,它主要从3个方面给我们提供更好的服务:

 

1.增强带宽,增强我们通过4G已经实现的部分功能;


2.为我们提供大规模的机器式通信,和超可靠的低延时通信,这两者都着眼于数据、机器的应用;


3.就是我讲的机器对于数据的加工应用。

 

5G是连接性的、连通的基础设施,如果没有5G,我们不可能出现万物智能的场景。

 

▲ 长按图片,分享给需要的人


我认为,5G的技术能够帮助我们实现智能化的目标。

 

当然它现在还不是很完备,还没有办法完全满足连通性方面的要求,但是它已经能够满足部分要求,实现终极的连通目标要花上几十年来实现。

 

我们可以畅想一下未来,至少现在推出的5G是第一版,它不是完美的。我相信推出5G的政府、国家,它们有自己的5G发展目标。

 

从第一版推出开始,意味着它们要进一步加强对5G行业的发展。

 

5G的相关服务,我们最好从应用的角度来看。所有的细节都是通信领域工程师们要关注并加以解决的挑战,大家要关注的是愿景,是今后发展的宏观情况。

 

5G推出以后,各国也有了自己的计划,2014、2015年已有国家部署了。5G的推广确实需要很多时间准备,数据空间要真正融入赛博物理空间,也需要一些时间。

 

5G不是在4G基础之上的量级跃进,它是基于服务的变化,基于跟我们以前看到的完全不一样的服务。


▲ 长按图片,分享给需要的人


4G和5G之间的区别,不仅仅是量上的区别,更多的是量变到质变的区别。

 

当我们在3G到4G的演进中时,从数据到移动数据,5G时代更多是数据的处理:如何在一个万物互联的时代,进行海量数据的处理和计算。

 

现在有大量的算法,很多工程师研发多种算法增强数据的分析和处理能力。正因为5G的这些特点,我们认为它的发展需要各国政府的积极参与和倡导。

 

三、极化码解决了什么样的问题?


克劳德·香农,他是“信息理论”的创始人。他在其论文当中首次提出信息理论及其发展的路线图。


他当年的科研论文奠定了当下信息社会最初的理论根基,按照香农的理论,通讯,或者说信息的通讯,可以归纳为以下这样的流程:

 

首先,信息的来源,他提出信息理论的时候,信息的来源主要是人,不会像现在物联网的时代,信息的来源还有机器。

 

中间有信息的传输,一个信息的传输器,把这个信息从含有内容的信息变成含有内容的信号,在信息传输的过程当中,下面的框代表着干扰,也就是噪音,会有一些噪音的干扰。

 

之后会有接收信号,接收信号端会传到接收器,把它生成为具有内容的信息传送到目的地。

 

由于有噪音的干扰,这个过程会出现错误,并不是信号从发出端到接收端没有错误。

 

按照香农理论,通信的根本问题,他认为可以在一点,或者近似于完全的信息在一个点进行在线。他提出信道容量和信息传输的本质分析。



香农最大的贡献是鉴定了信息的度量,他找到了一个方法,让我们对传输的信息和数据进行科学的度量。

 

在科学的发展中,任何一个概念如果没有一个客观的标准对它进行度量,从工程的角度、信息理论的角度,就没有办法对它进行很好地研究和理解。

 

▲ 长按图片,分享给需要的人


所以香农最大的贡献之一,是他定义了一个度量,有效的量化传输的信息,这个度量就是信道容量。

 

当我们有了度量以后,基于这个度量去看,就知道该以什么样的速度稳定地传输数据。这是一个传输速率。

 

按照香农的理论,只有传输速率小于信道容量,通信的信道编码,才有可能实现可靠的数据传输。

 

在二进制的编码当中,信息的传输器生成了编码,但当信号传输到接收端,接收端把它解码后生成二进制的新编码,就出现了差异。

 

这就是所谓的错误,也就是信号从输出端到接收端,并不能保证100%无错误地传输。

 

我们是否有可能找到错误的来源,并且进行纠错呢?这恐怕是接下来科学家会问的问题。


重复编码的意思是,我不是发一个信息,比如说0100,我对它进行加码,进行加码以后生成的0001、1000,我把0重复了3次,把1也重复了3次。


在信道的输出当中,它可能生成的是000、101、001、011,我在对它进行基于编码算法的解码之后,解码之后的信息是010。


因此这是一个非常简单的重复,把0变成3个0、1变成3个1。重复编码的方式,能找到错误出现在哪里。


当然它有代价,代价是传输的速率下降了33%,信号的传输速率受到了影响。


还有其他纠错的方法,比如说Turbo码、LDPC码。LDPC码是低密度奇偶检查码的方法,也是为了更好地纠错。


按照香农理论,如果我们希望信号有效可靠地进行传输,那么传输的速率必须小于所计算出来的信道容量。


有一个量度能够去评量信道容量,传输速率不能大于信道容量,因此你会看到这些为了能够提高传输数据的稳定性、可靠率。


现在要接近于香农信到容量极限的方法有三个,Turbo码、LDPC码、极化码,这三种码被事实证明接近于香农信道容量的编码。



什么是极化码?极化码是一种新的信道编码,是首次被证明接近于香农信道容量的编码方法。

 

刚才我们提到了Turbo码、LDPC码也接近,但是这两种码还没有在真正意义上被证明接近于香农的信道容量极限。

 

我也非常感谢社会各界,以及中国对于极化码的认可,现在华为就是用的极化码在做5G。

 

它可以保护数据信道传输的稳定性,我们看到数据的传输有两个信道:一个是信息传输正常的信道,另一个是控制的这些数据。


可能会告诉彼此以什么样的方式进行信号的传输,在什么时候、什么地点以什么速率进行传输。

 

而极化码控制的是控制数据,用来控制信号传输的速率、参数的数据。数据控制得好了,真正传输的数据才能实现高正确率和稳定性。

 

在整个数据的传输当中,控制数据率并不大,极化码找到了一个正确的、恰当的方法,在5G的标准下更好地确保控制数据的稳定性和正确率。

 

四、尾声


我的演讲接近尾声,最后抛砖引玉地提一个研究问题:

 

我们今天讲到了大数据,讲到了香农编码,也讲到了极化码,如何能够通过极化码的编码方式解决信息通讯传输中的问题?

 

信息传输的问题是什么?信号从一个点到另外一个点,以高正确率、高稳定性进行传输,这是在信息传输中的一大挑战。

 

▲ 长按图片,分享给需要的人


我会从信息源选一些信息的信号。假设我发了一个字节,它就是一个字节,这个单字节的信息需要从发出端传出到接受端,并且我们希望不要出错。

 
不管码长是多少,信息是多长,是二进制下0、1的序列,在传输过程中尽可能确保稳定性和正确率。

 

香农对于信息传输所提出的革命,他认为信息是有意义的,在很多情况下,这些信息承载了一定的意义。

 

我们要在系统当中建立相应的关联,让这种关联不会被打破。


假设现在这个会场房间对温度进行测量,把测出来的结果发给另外一个接收端,你就会看到这个信息一定跟这里的相关要素发生了关联:
 我的温度之所以是这样,可能跟空气有关系。 这些都是带有羽翼的信息,这些羽翼信号要传输到另一端,本身信息的内容和意义,从信息工程学的角度来讲,跟信号没有直接的相关性。 在二进制下,它可能是0、1之间的序列,所以它跟信息工程本身没有相关性。 因此,信息通讯的传输,在设计上就要能让两个意义跟二进制下面序列意义不相关的事情,能够不因为信息工程的传输而导致意义本身出错。


这是香农所做出的重大贡献,因为本身这个信号与意义之间可能并没有关联性,我们需要在信息的传输当中,不打破信息本身的内容。

 

从信息的传输角度来讲,让信息从一点到另一点,在高度近似的情况下,把这些含有意义的信号进行传输,是信息通讯传输领域遇到的最大问题。

 

我如何把带有意义的信息变成高度正确和可靠的传输信号?这是要从信息工程学的角度解决的问题。

 

这也许是简单的二位数,在整个环境下的多个参数,比如说湿度、温度,如何把信息和信号的传导介质之间去隔离开来,让这个传导介质不要去影响信息的内容?这是香农认为最重要的一点。

 

把信息和信息载体分开,这个做法才可以实现。通过这个实现的方式,进行比较好的建模来建立系统。

 

经过几十年的发展,我们的系统已经可以无限地逼近香农极限,已经可以实现这样的目标了。我们已经步入了大数据的时代。

我们看一下香农提出的通信体系,甲必须对乙进行交流,这是双方进行两点之间的沟通。

 

有人会对于收集信息和加工信息感兴趣,信息收集了以后,尤其是在不同的地方收集的信息出现之后,它们会进入网络,这些信息彼此高度相关。

 

5G能够提供香农泛式的解决方案,就是刚才提到的5G能实现的三种特征:大规模的机器式通信、高可靠、低延时通信。

 

不管是物联网还是传感器,香农的泛式,我们可以把意义和信息传输的问题分开。这种点对点的信息系统是非常好的做法。

 

这样做,所收集的数据量很大。处理初步数据、原材料数据很重要,传输只是数据处理的一个步骤或环节。

 

数据加工可以让我们有所收获,在发送数据之前先进行加工,会给我们带来收益,但整个过程比较复杂。

 

▲ 长按图片,分享给需要的人


因此我们要考虑两件事情:一,所收集数据的本身;二,网络容量的限制。这两者非常关键。

 

我们要发送一些样本数据,可是发送的频率如何呢?这些问题都要考虑。

 

我觉得今后我们要面临的挑战还很多,数据加工,从数据中找到知识,这是我们在边缘所面临的问题,围绕着数据的操作相关。


以上是我今天的发言,谢谢!


*文章为作者独立观点,不代表笔记侠立场。


主办方简介——


全球移动互联网大会(简称GMIC)从2009年首届举办至今,已成功举办十届,覆盖全球三大洲九个国家和地区,吸引来自世界70多个国家的创新者,累计百万人次参与,成为具有全球影响力的科技创新盛会,被誉为科技创新领域的风向标。


2019年,GMIC移师广州,创新性打造科学、科技、科幻、科创、科考五大板块,实现五星连“珠”、五子登“科”,让科学家与来自科技、电影、音乐、时尚潮流等不同领域的企业家、艺术家等进行跨界交流。期间大会将实现全城联动,科学闪耀羊城,让科学成为一种生活方式。


笔记侠好文推荐:


吴声:你的内心一定有某种火焰,将你和其他人区别

刘润对谈吴军:给腾讯和所有上进企业的4点建议

周其仁:怎样看未来,乐观还是悲观?

我们到底在赚谁的钱?



嘿,你在看吗?

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存