5G:所有细节都是挑战,要更关注愿景和宏观形势
点击笔记侠关注△ 回复“1”领取今日日签和福利大礼包
内容来源:2019年7月25日,在GWC长城会主办、笔记侠联合主办的GMIC 2019产业智能升级大会上,5G极化码之父阿里坎教授进行了以“5G与极化码”为主题的精彩分享。笔记侠作为合作方,未经主办方和讲者审核。
讲者简介:埃尔达尔·阿里坎,2008年提出“极化码”理论,极化码被认为是第一种可以被理论证明的逼近香农“信道容量极限”的编码方案,阿里坎于2018年6月获得信息理论领域的最高荣誉“香农奖”。
讲者 | 阿里坎
封面设计 & 责编 | 马畅
第 3964 篇深度好文:6047 字 | 12 分钟阅读
完整笔记·人工智能
本文优质度:★★★★★ 口感:薯格
笔记君邀您阅读前,先思考:
什么才是真正的5G?
我们如何迎接5G方面的挑战?
一、大数据的时代特点
大家好。非常高兴能来到这里,今天我想跟大家分享一下5G和极化码。
现在人工智能对科学发展起着推波助澜的作用,如虎添翼,希望这个课题能给大家带来帮助。
1.我们生活在数据的时代
数据会生成、收集、存储,还要找到渠道对数据进行访问;由于数据是海量的,所以我们一开始就还要对数据压缩。
这时候要看一下这个过程中涉及的通讯流程,它跟通讯理论有关,通讯理论里面有一些内容关注数据的处理。
另外,我们要想办法保护我们的数据,防止噪音、防止数据的损失;我们也要想办法实现数据的通信,将数据从一点传输到另一点;当然也希望进一步加密数据,保护数据安全性。
我们也要对数据进行加工,比如说去识别一些特定的模式,如果有必要的话,会生成警报。
这些跟通讯和5G的关系不是太大,但也是我们跟数据打交道时经常会用到的几种方式,这些方式更接近操作层面,跟5G的技术和人工智能更加相关。
比如手机,它是互联网和用户之间的接口,我们的手机就是一个边缘,数据本身在不断增加。但是数据本身的增长也会有瓶颈,可以用于边缘的带宽,它本身是有瓶颈的。
首先,是带宽的挑战。这个主要是网络及工程师们要解决的问题;延时和可靠性的问题,也是通信领域工程师们要解决的挑战。
其次,是数据处理的挑战。怎样解释数据,从数据中提取知识,从数据中学习技术?这些不是工程师要解决的,但我觉得这些问题更为重要,对我们挑战更大。
二、从数据的层面解读5G
5G是什么?我们有很多视角去看5G,大家也有不同的答案。
从数据的角度来看,更容易帮我们理解5G的概念,它主要从3个方面给我们提供更好的服务:
1.增强带宽,增强我们通过4G已经实现的部分功能;
2.为我们提供大规模的机器式通信,和超可靠的低延时通信,这两者都着眼于数据、机器的应用;
3.就是我讲的机器对于数据的加工应用。
5G是连接性的、连通的基础设施,如果没有5G,我们不可能出现万物智能的场景。
我认为,5G的技术能够帮助我们实现智能化的目标。
当然它现在还不是很完备,还没有办法完全满足连通性方面的要求,但是它已经能够满足部分要求,实现终极的连通目标要花上几十年来实现。
我们可以畅想一下未来,至少现在推出的5G是第一版,它不是完美的。我相信推出5G的政府、国家,它们有自己的5G发展目标。
从第一版推出开始,意味着它们要进一步加强对5G行业的发展。
5G的相关服务,我们最好从应用的角度来看。所有的细节都是通信领域工程师们要关注并加以解决的挑战,大家要关注的是愿景,是今后发展的宏观情况。
5G推出以后,各国也有了自己的计划,2014、2015年已有国家部署了。5G的推广确实需要很多时间准备,数据空间要真正融入赛博物理空间,也需要一些时间。
5G不是在4G基础之上的量级跃进,它是基于服务的变化,基于跟我们以前看到的完全不一样的服务。
4G和5G之间的区别,不仅仅是量上的区别,更多的是量变到质变的区别。
当我们在3G到4G的演进中时,从数据到移动数据,5G时代更多是数据的处理:如何在一个万物互联的时代,进行海量数据的处理和计算。
现在有大量的算法,很多工程师研发多种算法增强数据的分析和处理能力。正因为5G的这些特点,我们认为它的发展需要各国政府的积极参与和倡导。
三、极化码解决了什么样的问题?
克劳德·香农,他是“信息理论”的创始人。他在其论文当中首次提出信息理论及其发展的路线图。
他当年的科研论文奠定了当下信息社会最初的理论根基,按照香农的理论,通讯,或者说信息的通讯,可以归纳为以下这样的流程:
首先,信息的来源,他提出信息理论的时候,信息的来源主要是人,不会像现在物联网的时代,信息的来源还有机器。
中间有信息的传输,一个信息的传输器,把这个信息从含有内容的信息变成含有内容的信号,在信息传输的过程当中,下面的框代表着干扰,也就是噪音,会有一些噪音的干扰。
之后会有接收信号,接收信号端会传到接收器,把它生成为具有内容的信息传送到目的地。
由于有噪音的干扰,这个过程会出现错误,并不是信号从发出端到接收端没有错误。
按照香农理论,通信的根本问题,他认为可以在一点,或者近似于完全的信息在一个点进行在线。他提出信道容量和信息传输的本质分析。
香农最大的贡献是鉴定了信息的度量,他找到了一个方法,让我们对传输的信息和数据进行科学的度量。
在科学的发展中,任何一个概念如果没有一个客观的标准对它进行度量,从工程的角度、信息理论的角度,就没有办法对它进行很好地研究和理解。
▲ 长按图片,分享给需要的人
所以香农最大的贡献之一,是他定义了一个度量,有效的量化传输的信息,这个度量就是信道容量。
当我们有了度量以后,基于这个度量去看,就知道该以什么样的速度稳定地传输数据。这是一个传输速率。
按照香农的理论,只有传输速率小于信道容量,通信的信道编码,才有可能实现可靠的数据传输。
在二进制的编码当中,信息的传输器生成了编码,但当信号传输到接收端,接收端把它解码后生成二进制的新编码,就出现了差异。
这就是所谓的错误,也就是信号从输出端到接收端,并不能保证100%无错误地传输。
我们是否有可能找到错误的来源,并且进行纠错呢?这恐怕是接下来科学家会问的问题。
重复编码的意思是,我不是发一个信息,比如说0100,我对它进行加码,进行加码以后生成的0001、1000,我把0重复了3次,把1也重复了3次。
在信道的输出当中,它可能生成的是000、101、001、011,我在对它进行基于编码算法的解码之后,解码之后的信息是010。
因此这是一个非常简单的重复,把0变成3个0、1变成3个1。重复编码的方式,能找到错误出现在哪里。
当然它有代价,代价是传输的速率下降了33%,信号的传输速率受到了影响。
还有其他纠错的方法,比如说Turbo码、LDPC码。LDPC码是低密度奇偶检查码的方法,也是为了更好地纠错。
按照香农理论,如果我们希望信号有效可靠地进行传输,那么传输的速率必须小于所计算出来的信道容量。
有一个量度能够去评量信道容量,传输速率不能大于信道容量,因此你会看到这些为了能够提高传输数据的稳定性、可靠率。
现在要接近于香农信到容量极限的方法有三个,Turbo码、LDPC码、极化码,这三种码被事实证明接近于香农信道容量的编码。
什么是极化码?极化码是一种新的信道编码,是首次被证明接近于香农信道容量的编码方法。
刚才我们提到了Turbo码、LDPC码也接近,但是这两种码还没有在真正意义上被证明接近于香农的信道容量极限。
我也非常感谢社会各界,以及中国对于极化码的认可,现在华为就是用的极化码在做5G。
它可以保护数据信道传输的稳定性,我们看到数据的传输有两个信道:一个是信息传输正常的信道,另一个是控制的这些数据。
可能会告诉彼此以什么样的方式进行信号的传输,在什么时候、什么地点以什么速率进行传输。
而极化码控制的是控制数据,用来控制信号传输的速率、参数的数据。数据控制得好了,真正传输的数据才能实现高正确率和稳定性。
在整个数据的传输当中,控制数据率并不大,极化码找到了一个正确的、恰当的方法,在5G的标准下更好地确保控制数据的稳定性和正确率。
四、尾声
我的演讲接近尾声,最后抛砖引玉地提一个研究问题:
我们今天讲到了大数据,讲到了香农编码,也讲到了极化码,如何能够通过极化码的编码方式解决信息通讯传输中的问题?
信息传输的问题是什么?信号从一个点到另外一个点,以高正确率、高稳定性进行传输,这是在信息传输中的一大挑战。
▲ 长按图片,分享给需要的人
我会从信息源选一些信息的信号。假设我发了一个字节,它就是一个字节,这个单字节的信息需要从发出端传出到接受端,并且我们希望不要出错。
香农对于信息传输所提出的革命,他认为信息是有意义的,在很多情况下,这些信息承载了一定的意义。
我们要在系统当中建立相应的关联,让这种关联不会被打破。
我的温度之所以是这样,可能跟空气有关系。 这些都是带有羽翼的信息,这些羽翼信号要传输到另一端,本身信息的内容和意义,从信息工程学的角度来讲,跟信号没有直接的相关性。 在二进制下,它可能是0、1之间的序列,所以它跟信息工程本身没有相关性。 因此,信息通讯的传输,在设计上就要能让两个意义跟二进制下面序列意义不相关的事情,能够不因为信息工程的传输而导致意义本身出错。
这是香农所做出的重大贡献,因为本身这个信号与意义之间可能并没有关联性,我们需要在信息的传输当中,不打破信息本身的内容。
从信息的传输角度来讲,让信息从一点到另一点,在高度近似的情况下,把这些含有意义的信号进行传输,是信息通讯传输领域遇到的最大问题。
我如何把带有意义的信息变成高度正确和可靠的传输信号?这是要从信息工程学的角度解决的问题。
这也许是简单的二位数,在整个环境下的多个参数,比如说湿度、温度,如何把信息和信号的传导介质之间去隔离开来,让这个传导介质不要去影响信息的内容?这是香农认为最重要的一点。
把信息和信息载体分开,这个做法才可以实现。通过这个实现的方式,进行比较好的建模来建立系统。
经过几十年的发展,我们的系统已经可以无限地逼近香农极限,已经可以实现这样的目标了。我们已经步入了大数据的时代。
我们看一下香农提出的通信体系,甲必须对乙进行交流,这是双方进行两点之间的沟通。
有人会对于收集信息和加工信息感兴趣,信息收集了以后,尤其是在不同的地方收集的信息出现之后,它们会进入网络,这些信息彼此高度相关。
5G能够提供香农泛式的解决方案,就是刚才提到的5G能实现的三种特征:大规模的机器式通信、高可靠、低延时通信。
不管是物联网还是传感器,香农的泛式,我们可以把意义和信息传输的问题分开。这种点对点的信息系统是非常好的做法。
这样做,所收集的数据量很大。处理初步数据、原材料数据很重要,传输只是数据处理的一个步骤或环节。
数据加工可以让我们有所收获,在发送数据之前先进行加工,会给我们带来收益,但整个过程比较复杂。
▲ 长按图片,分享给需要的人
因此我们要考虑两件事情:一,所收集数据的本身;二,网络容量的限制。这两者非常关键。
我们要发送一些样本数据,可是发送的频率如何呢?这些问题都要考虑。
我觉得今后我们要面临的挑战还很多,数据加工,从数据中找到知识,这是我们在边缘所面临的问题,围绕着数据的操作相关。
以上是我今天的发言,谢谢!
*文章为作者独立观点,不代表笔记侠立场。
主办方简介——
全球移动互联网大会(简称GMIC)从2009年首届举办至今,已成功举办十届,覆盖全球三大洲九个国家和地区,吸引来自世界70多个国家的创新者,累计百万人次参与,成为具有全球影响力的科技创新盛会,被誉为科技创新领域的风向标。
2019年,GMIC移师广州,创新性打造科学、科技、科幻、科创、科考五大板块,实现五星连“珠”、五子登“科”,让科学家与来自科技、电影、音乐、时尚潮流等不同领域的企业家、艺术家等进行跨界交流。期间大会将实现全城联动,科学闪耀羊城,让科学成为一种生活方式。
笔记侠好文推荐:
嘿,你在看吗?