查看原文
其他

ChatGPT背后的核心技术报告(附下载)

硅谷智库 2023-11-06


▲点击图片查看元宇宙报告

公众号后台回复:“宇宙”,获取元宇宙报告

公众号后台回复:“社群”,进入知识分享社群

热文推荐:

ChatGPT报告:开启AI新纪元(附下载)

ChatGPT报告:从ChatGPT到生成式AI(附下载)

输入几个简单的关键词,AI能帮你生成一篇短篇小说甚至是专业论文。最近大火的ChatGPT在邮件撰写、文本翻译、代码编写等任务上强大表现,让埃隆·马斯克都声称感受到了AI的“危险”。ChatGPT的计算逻辑来自于一个名为transformer的算法,它来源于2017年的一篇科研论文《Attention is all your need》。原本这篇论文是聚焦在自然语言处理领域,但由于其出色的解释性和计算性能开始广泛地使用在AI各个领域,成为最近几年最流行的AI算法模型,无论是这篇论文还是transformer模型,都是当今AI科技发展的一个缩影。以此为前提,本文分析了这篇论文的核心要点和主要创新初衷。

报告获取方式

长按下方二维码

回复: GPT 



01 缘起


       

从Transformer提出到“大规模与训练模型” GPT(Generative Pre-Training)的诞生,再到GPT2的迭代标志Open AI成为营利性公司,以及GPT3和ChatGPT的“出圈”;再看产业界,多个重要领域比如生物医疗,智能制造纷纷有以transformer落地的技术产生。在这个浪潮下,我的思考是:

一是,未来很长一段时间在智能化领域,我们都将经历“科研、算力、基础架构、工程、数据、解决方案”这个循环的快速迭代;流动性、创新性短期不会稳定下来,而是会越来越强。我们很难等到科技封装好,把这些知识全部屏蔽掉,再去打磨产品。未来在竞争中获胜的,将是很好地“解决了产品化和科研及工程创新之间平衡”的团队。我们一般理解的研发实际上是工程,但AI的实践科学属性需要团队更好的接纳这种“流动性”。因此对所有从业者或者感兴趣智能化的小伙伴了解全栈知识成了一个刚需。

二是,通过对这篇论文的探讨,可以更直观地理解:在科研端发生了什么,以什么样的速度和节奏发生;哪些是里程碑?是科学界的梅西横空出世,带我们发现真理;哪些是微创新?可能方向明确了,但还有很多空间可以拓展;哪些更像炼金术?仍然在摸索,尚需要很长一段时间,或者一直会保持这个状态。

三是,在AI领域,由于技术原因,更多的论文是开源代码的,一方面,促进了更多人参与进来改进迭代;另一方面,科研跟工程实现无缝连接,一篇论文可以拉动从核心代码到平台,到具体应用很大范围的价值扩散。一篇论文很可能就是一个领域,一条赛道,甚至直接驱动业务价值和客户价值的大幅提升。

四是, AI技术发展有很多领域(感知,认知,感知又分图像、语音、文字等,认知也可以分出很多层次)之前这些领域的算法逻辑存在很大差别,transformer的出现有一定程度上推动各个领域汇聚的迹象,介绍清楚这篇论文,对把握整体可能有些作用。另外ChatGPT属于现象级应用,大家更有直观感受,未来这类应用的体验提升和更新速度只会更快,理解了其背后的逻辑,更有助于我们把握这个趋势。


02 论文介绍


       

下面步入正题,开始介绍这篇论文,会涉及一些技术细节及公式,可能还需要仔细看一下(先收藏,留出15-20分钟比较好),相信一旦看进去,你会对AI的理解加深很多。

总体把握

这篇论文的结构非常精炼,提出问题,分析问题,解决问题,给出测试数据。顶刊文章讲究言简意赅,有描述,有代码,有结果;其中最核心的是以下这张图,作者团队提出transformer的核心算法结构:

整篇文章就是围绕这张图来进行解释的,由于篇幅所限,我们聚焦在一条主线上:1.文章想解决主要问题是什么 2.如何解决的 3.从文章提出的解决方案作为一个案例来引发整体思考,因此我们将内容简化,主要关注核心部分。

这张图表达的内容如果理解了,那基本上你掌握了这篇论文85%的内容,也是最关键的部分。

《Attention is all your need》在编写时主要是为了考虑NLP任务,是由几个Google的科研人员一起完成的,其中一个背景是Google也在推广自己的并行计算芯片以及AI TensorFlow开发平台。平台主要功能特点是并行计算,这篇文章的算法也是在最大限度的实现并行计算。我们就以一个简单的例子来把这个算法串一遍。

核心内容

需求是我们需要训练一个模型,进行中文到英文翻译。

背景知识:这个需求要把“翻译:我爱你 to I love you”转置成一个y=f(x)问题,x代表中文,y是英文,我们要通过训练得到f(),一旦训练成功f(),就可以实现翻译。大家拼的就是谁的训练方法更准确,更高效,谁的f()更好用。

之前自然语言处理主要的算法叫RNN(循环神经网络),它主要的实现逻辑是每个“字”计算之后将结果继承给第二个字。算法的弊病是需要大量的串行计算,效率低。而且当遇到比较长的句子时,前面信息很有可能会被稀释掉,造成模型不准确,也就是对于长句子效果会衰减。这是这篇文章致力于要解决的问题,也就是说这篇文章有训练处更好的f()的方法。联想一下ChatGPT可以做论文,感受一下。

在Transformer里,作者提出了将每个字与句子中所有单词进行计算,算出这个词与每个单词的相关度,从而确定这个词在这个句子里的更准确意义。

在此处,要开始进入一些技术细节,在开始之前,我们有必要再熟悉一下机器学习领域最核心的一个概念——“向量”。在数字化时代,数学运算最小单位往往是自然数字。但在AI时代,这个最小单元变成了向量。这是数字化时代计算和智能化时代最重要的差别之一。   

举个例子,比如,在银行,判断一个人的信用额度,我们用一个向量来表示

向量是一组数据的集合,也可以想象成在一个超高维度空间里的一个点。一个具体的信用额度向量,就是在8个特征组成的高维空间的一个点。数据在高维空间将展现更多的数学性质比如线性可分,容易让我们抓住更多隐藏的规律。

向量的加减乘除是计算机在进行样本训练是最主要的计算逻辑。

Transformer模型的主要意义就是找到了一个算法,分成三步把一个词逐步定位到了一个高维空间,在这个过程中赋予这个单词比其它算法更优的信息。很多情况下这个高维空间有着不同的意义,一旦这个向量赋予的信息更准确更接近真实情况,后面的机器学习工作就很容易展开。还拿刚才信用额度向量举例子

这两个向量存在于两个不同的向量空间,主要的区别就是前者多了一个向量特征:“年薪”。可以思考一下如果判断一个人的信用额度,“年薪”是不是一个很重要的影响因子?

以上例子还是很简单的,只是增加了一个特征值,在transformer里就复杂很多,它是要把多个向量信息通过矩阵加减乘除综合计算,从而赋予一个向量新的含义。

好,理解了向量的重要性,我们看回transformer的三步走,这三步走分别是:1.编码(Embedding)2. 定位 (Positional encoding)3. 自注意力机制(Self-Attention)。

举个例子,比如,翻译句子Smart John is singing到中文。

首先,要对句子每个词进行向量化。

我们先看“John”这个词,需要先把“John”这个字母排列的表达转换成一个512维度的向量John,这样计算机可以开始认识它。说明John是在这个512维空间的一个点,这是第一步:编码(Embedding)。

再次,第二步: 定位(Positional encoding),利用以下公式(这是这篇论文的创新)

微调一个新的高维空间,生成一个新的向量。

我们不用太担心这个公式,它核心意义是:1.在这个新的向量里面每一位由原来的0和1表示,分别取代成由sin和cos表示,这个目的是可以通过sin和cos的定律,让这个新向量不仅表示John这个单词的意义,还可以表示John在Smart John is singing这个句子的位置信息。如果不理解,可以直接忽略,只要记住第二步是用来在“表达John这个词的向量”中,加入了John在句子中的位置信息。John已经不是一个孤立的词,而是一个具体句子中的一个词,虽然还不知道句子中其他词是什么含义。

如果第一步计算机理解了什么是John,第二步计算机理解了“* John**”。

最后,第三步:自注意力机制(Self-Attention),通过一个Attention(Q,K,V)算法,再次把John放到一个新的空间信息里,我们设为

在这个新向量里,不仅包含了John的含义,John在句子中位置信息,更包含了John和句子中每个单子含义之间的关系和价值信息。我们可以理解,John作为一个词是一个泛指,但Smart John就具体了很多,singing的Smart John就又近了一步。而且Attention (Q,K,V)算法,不是对一个单词周围做计算,是让这个单词跟句子里所有单词做计算。通过计算调整这个单词在空间里的位置。

这种方法,可以在一个超长句子中发挥优势,而且最关键的是一举突破了时序序列的屏障,以前对于图像和NLP算法的划分,很大程度上是由于NLP有很明显的时序特征,即每个单词和下一个以及在下一个有比较明显的时序关系。但Transformer这种算法打破了这种束缚,它更在意一个单词跟句子中每个单词的价值权重。这是Transformer可以用到everywhere的主要原因。

计算过程

具体的计算过程,用翻译句子“我爱你”到“I love you”举例(这句更简单一些)。首先进行向量化并吸收句子位置信息,得到一个句子的初始向量组。

(由于样本每个句子长短不同,所以每个句子都会是一个512*512的矩阵,如果长度不够就用0来代替。这样在训练时,无论多长的句子,都可以用一个同样规模的矩阵来表示。当然512是超参,可以在训练前调整大小。)

接着,用每个字的初始向量分别乘以三个随机初始的矩阵WQ,Wk,Wv分别得到三个量Qx,Kx,Vx。下图以“我”举例。

然后,计算每个单词的attention数值,比如“我”字的attention值就是用“我”字的Q我分别乘以句子中其他单词的K值,两个矩阵相乘的数学含义就是衡量两个矩阵的相似度。然后通过一个SoftMax转换(大家不用担心如何计算),计算出它跟每个单词的权重,这个权重比例所有加在一起要等于1。再用每个权重乘以相对应的V值。所有乘积相加得到这个Attention值。

这个attention数值就是除了“我”字自有信息和位置信息以外,成功的得到了这个句子中每个单词的相关度信息。

大家可以发现,在所有注意力系数的计算逻辑中其实只有每个字的初始矩阵WQ,Wk,Wv是未知数(这三个矩阵是所有文字共享的)。那么我们可以把这个transformer简化成一个关于输入,输出和这个W矩阵的方程:其中X是输入文字信息,Y是翻译信息。

这里有必要再介绍一下机器学习的基础知识:Transformer算法本质上是一个前馈神经网络模型,它的计算基础逻辑,不去管复杂的隐藏层,就是假设Y=f(x)=wx,(目标还是要算出一个f())然后随机设置一个w0,开始计算这个y=w0x的成本函数,然后再把w0变成w1,计算y=w1x的成本函数,以此类推计算出无数w(不是无数,也会收敛),然后比较哪个w的成本函数最小,就是我们训练出来的f()。那么在transformer里,这三个初始矩阵就是那个w0。

再回到transformer,在计算Attention之后,每个单词根据语义关系被打入了新的高维空间这就是Self-attention(自注意力机制)。

但在transformer里,并不是代入了一个空间,而是代入了多个高维空间,叫做多头注意力机制,(文章中没有给出更清晰的理论支持,为什么是多头)。

主要原因是在训练时效果很好。这也是AI科研论文的一个特点,常常凭借非常高的科研素养和敏感性,发现一些方向,并且通过测试确实有效,但不一定可以给出很完美的理论支撑。这往往也给后续研究者一些可以进一步完善的空间。

事实证明,如何提升Attention(Q,K,V)效率是transformer领域迭代最快的部分。之后的Bert算法提出预训练机制成为了主流,后面会做进一步介绍。

当然,事后我们可以理解是把这个句子中的逻辑关系放到不同的高维空间去训练,目的就是希望抓取更多的信息,这一部分可以更加深刻理解科研人员对空间的应用。

除了以上内容,还有一些技术点比如Mask机制、layer norm、神经网络激函数饱和区控制等,由于篇幅关系以及属于技术细节就不一一介绍了。

如果大家理解了多头自注意力机制,基本已经85%掌握了这篇论文的重要内容,也对还在快速扩展影响力的transformer模型有了一个比较直观的认识。


03 启发收获


       

从理论科研进步的角度看

一、Transformer打破了时序计算的逻辑,开始快速出圈,多个AI原本比较独立的领域开始在技术上融合。再往里看,Transformer能打破时序很重要一点是并行计算的算力模式给更复杂的计算带来了性价比上的可能性。算力的进一步提高,必将在AI各细分领域带来融合,更基础设施级别的模型,算法仍将不断推出。AI领域在图像,NLP;感知认知领域的专业分工也会慢慢变模糊。

二、AI科研确实具有一些实验性质。除了核心思想,确实还有很多技术点的解决方向已经明确,但还有很大的提升空间,可以预见围绕transformer周边的微创新会持续加速繁荣。

三、《Attention is all your need》在业内大名鼎鼎,但你要是细看,会发现很多内容也是拿来主义,比如最重要的Attention(Q,K,V)中Query,Key,Value是互联网推荐系统的标配方法论;整个Transformer算法也是一个大的神经网络,算法是在前人基础上一步一步迭代发展,只是这个迭代速度明显在加快。 

从理论、算法、架构、工程的角度看

四、AI算法科研领域正经历算法、开源代码、工程、算力的增长飞轮。

下图是顶级刊物上的学术论文中,开放源代码的论文比例,这个数据在这几年以更快的速度在增长。科研过程与工程过程产生越来越大的交集。开源社区和开源文化本身也在推动算法和工程的快速发展。

更多人参与,更多领域的人参与进来,进入门槛随着算力成本、AI基础架构和代码、知识分享的开源逐渐降低,科研与工程的边界也变得模糊,这个就像足球运动的规律,除了足球人口增多,天才球员梅西出现的概率也会增大。

从数据和后续发展的角度看

五、ChatGPT的成功同大量的数据训练功不可没,但除了简单对话互动或者翻译,大篇幅回答甚至论文级别的答案还是极其缺乏样本数据(算法训练需要的样本数据需要清晰度X和Y)。而且Transformer的算法相比其他算法需要更大的数据量,原因在于它需要起始阶段随机产生三个矩阵,一步一步进行优化。除了Transformer以外,另一个技术Bert也是技术发展非常重要的现象级算法。其核心是一个简化的Transformer,Bert不去做从A翻译到B,它随机遮住X里面的一些单词或句子让算法优化对遮住部分的预测。这种思路使得Bert成为了Transformer预训练最好的搭档。

如果通过Bert进行预训练,相当于给矩阵加入了先验知识(之前训练逻辑没有给机器任何提示,规则后者基础知识),提高了正式训练时初始矩阵的准确度,极大地提升了之后transformer的计算效率和对数据量的要求。在现实中,举例来说,如果我想训练国家图书馆图书,之前需要每本书的信息和对这本书的解释,或者中文书对应的英文书。但现在我们可以大量只是训练内容,不需要打标签,之后只需要通过transformer对样本数据进行微调。这就给ChatGPT很大的进步空间,而且可以预见,更多这类大模型会雨后春笋一般快速出现。

六、由于transformer是更高级的神经网络深度学习算法,对数据量有很高要求,这也催生了从小数据如何快速产生大数据的算法,比如GAN对抗网络等。这是AIGC领域的核心技术。解决数据量不足问题,除了更高效率抽象小数据的信息,也多了把小数据补足成大数据的方法,而且这些方法在快速成熟。

七、我们发现在机器学习算法中有大量的超级参数,比如在transformer里多头机制需要几头N,文字变成向量是512还是更多,学习速率等都需要在训练之前提前设置。由于训练时间长,参数复杂,要想遍历更优秀的计算效果需要非常长的摸索时间。这就催生出AutoML,拿Transformer举例,就要很多个路线进行自动化机器学习;比如贝叶斯计算(找到更优参数配置概率);强化学习思路(贪婪算法在环境不明朗情况下迅速逼近最优);另外还有寻求全新训练网络的方法(transformer,RNN,MLP等联合使用排列组合)等。

科研发展强调参数化,工业发展强调自动化,这两者看似统一,但在现实实操过程中往往是相当痛苦矛盾的。这也是开篇说的产品化和科研流动性相平衡的一个重要领域。







——推荐阅读——


ChatGPT报告:开启AI新纪元(附下载)

ChatGPT报告:从ChatGPT到生成式AI

2023ChatGPT研究框架报告(附下载)

ChatGPT深度报告: 重新定义搜索“入口”

ChatGPT背后的核心技术详解

ChatGPT发展历程、原理、技术架构详解和产业未来

ChatGPT报告获取方式

长按下方二维码

回复: GPT 


进入知识星球——智识梦工厂
  公众号所有内容都会同步更新到这啦  

科技丨互联网丨职场丨商业
优质内容,每日更新
海量知识,一键领取

1000+份大数据热门报告  500+人工智能热门书籍 
500+互联网优质软件+PPT  100+豆瓣高分书籍
2000本kindle高分书籍,45G小程序资料……
300+麦肯锡、高盛、波士顿等机构研究报告
 57套思维导图类PPT模板+ 思维导图自学手册
豆瓣评分Top250高分电影 
100部BBC高清纪录片
为读者找知识,为知识找读者 
一杯奶茶的价格,收获一年的知识








干货▶


思维导图自学手册,让你更聪明地学习!

57套思维导图类PPT模板送给你,思路整理神器!

思维导图软件+教程,提升逻辑思维必备!

思维导图MindMaster,高效工作必备工具!

收藏!300份麦肯锡中国案例分析报告和分析方法

麦肯锡、埃森哲等顶尖咨询公司PPT模板(附PPT)

图解丨麦肯锡式逻辑思考术思维导图

全球顶尖战略咨询公司麦肯锡的工作培训9大手册

280份麦肯锡、BCG、埃森哲等顶尖咨询公司项目案例

战略咨询公司麦肯锡的工作方法、经典报告、项目案例

67页PPT深度解析麦肯锡工具+麦肯锡方法论

40页PPT看懂麦肯锡的思考方式和沟通法则

麦肯锡认知升级三部曲:《麦肯锡方法》《麦肯锡意识》《麦肯锡工具》

查理·芒格的100个思维模型(推荐收藏)

收藏!2000部TED演讲视频合集,20年精华汇总!

500门985大学公开课,拓宽思维增长见识必备!

50大产业链全景图(高清完整版)

重磅!100大产业链全景图发布(附下载)


PPT

57套思维导图类PPT模板送给你,思路整理神器!

最全的PPT可视化模板,数据展示再也不愁了!

麦肯锡、埃森哲等顶尖咨询公司PPT模板(附PPT)

世界500强PPT模板,让你逼格瞬间UP

联合国都在用的演示神器,比PPT酷炫一百倍!

炫酷的地图图表PPT模板,可编辑可动态展示!

238套年终总结汇报PPT模板,让你的PPT逼格满满!

63套科技PPT模板,让你的PPT酷炫如科幻大片!

73套顶级互联网发布会PPT源文件,PPT逼格提升必备!

百度内部培训资料PPT:数据分析的道与术(附源文件)

67页PPT深度解析麦肯锡工具+麦肯锡方法论


影视


2500集BBC高清纪录片,中英文双语字幕!

不得不看的6部BBC纪录片,每一部都是经典神作

豆瓣高分电影TOP50,经典此生必看(完整版)

豆ban评分Top250高分电影,少看一部都是遗憾!

北京电影制片厂194部珍贵绝版大合集,经典收藏!

4大制片厂绝版电影大合集,172部超清经典!

10部世界经典名著电影合集(直接观看)

2021年豆瓣年度电影汇总(高清字幕版)

2022高分电影汇总,经典值得收藏(高清字幕版)

4大制片厂绝版电影大合集,172部超清经典!

98部超级英雄电影——漫威经典电影合集送给你


阅读

知乎高赞:盘点知识最多、含金量最高的42本书

二十世纪最伟大的100部中文小说,少看一本都是遗憾

BBC评出的最伟大的100部小说,知识就是力量(附PDF)

史上最经典的100部长篇小说

【干货】罗辑思维推荐书单全集,给大脑充电!

思维升级必读50本书单,终身学习者赶紧收藏

干货丨巴菲特推荐的十本书,堪称投资圣经(附PDF)

金融圈必读97本书籍,金融大佬强烈推荐(附电子书)

马斯克最爱的十本书,颠覆世界从阅读开始(附PDF)

乔布斯推荐的9本书:活着就是为了改变世界(附PDF)

《毛泽东选集》:此生必读的经典(附下载)

毛泽东最爱的三本书:读了17遍 一生挚爱(附PDF)

王小波全集:有趣的灵魂万里挑一(附下载)

10分钟搞懂《今日简史》《人类简史》《未来简史》

凯文·凯利和他的科技三部曲:预言帝带你看未来

【干货】2000本Kindle电子书免费领取

豆瓣高分图书Top250+60本音频解读,提升能力必备

100本哈佛商学院必读书单(附1067页哈佛商学院经典案例)



职场▶

推荐收藏!字节+腾讯+华为人力资源体系汇总

华为人力资源体系大曝光,看完感叹:太牛了!

阿里巴巴人力资源体系大曝光,马云:HR真惨!

腾讯人力资源体系全曝光,HR朋友圈都在传!

40张PPT完整解析字节跳动人力资源体系(附PPT)

百度内部培训资料PPT:数据分析的道与术(附源文件)

海底捞薪酬体系大曝光,这就是员工不离职的秘密

字节跳动、华为、阿里绩效考核体系(附PPT)

工作计划进度甘特图,高效工作必备神器!

926套高逼格Excel可视化图表模板,办公效率神器

54份竞品分析资料(报告、案例、方法与技巧)

PDF编辑神器丨格式转换、编辑修改一键搞定

华为项目管理法10大模板【Excel和Word版】

《华为基本法》全文,难得一见,值得珍藏!

华为任正非内部文章全集(67篇)、任正非400余篇讲稿


元宇宙▶

清华大学:2021元宇宙发展研究报告(附PDF)

北京大学:2022年元宇宙全球年度报告(附PDF)

复旦大学:2022年元宇宙报告(附下载)

2021元宇宙报告汇总:重启新世界(附下载)

元宇宙深度研究报告合集(20份)

元宇宙六大技术全景图(附图谱)

元宇宙框架梳理(附PDF)

177页元宇宙深度报告,推荐收藏(附PDF)

元宇宙报告:下一个生态级科技主线(附PDF

一文看懂元宇宙的6层框架、4大赛道,元宇宙深度解析报告


互联网

PDF编辑神器丨格式转换、编辑修改一键搞定

73套顶级互联网发布会PPT源文件,PPT逼格提升必备!

54份竞品分析资料(报告、案例、方法),商业分析必备!

工作计划进度甘特图,高效工作必备神器!

Adobe软件即将全网消失!最后一波下载的机会来了!

【干货】45G微信小程序开发合集 


数据▶

最全的PPT可视化模板,数据展示再也不愁了!

10份数字化转型报告汇总(附下载)

926套高逼格Excel可视化图表模板,办公效率神器

百度内部培训资料PPT:数据分析的道与术(附源文件)

《数字化转型工作手册》(附下载)


科技▶

马斯克重大宣布,人类即将被彻底改造!

500位科学家联合声明:进化论误导了全人类

马斯克疯了!美国人要砸掉中国5000万建筑工人的饭碗!

重磅!罗兰贝格中国行业趋势报告:预见2021(附PDF)

数学大师丘成桐:中国的科技至少要倒退20年

63套科技PPT模板,让你的PPT酷炫如科幻大片!

阿里120页PPT诠释国家“智能2.0”战略

惊人的预测——来自麦肯锡报告《中国与世界》完整版

美国公布35页的《2016-2045年新兴科技趋势报告》

理工男图解零维到十维空间,烧脑已过度,受不了啦!

BBC分析了365个职业,最不可能被机器淘汰的居然是……

麦肯锡预测2030年:1亿中国人面临职业转换,全球8亿人被机器人取代


社会

美国纪录片《中国这五年》,全世界都沉默了!

中国当前局势报告(完整版)

权威!2022“中国大学排名”正式发布(附排名)

德国颁发抄袭大奖,中国包揽前10名拿了大满贯!

中国一流大学校长们的“洋相”: 足够出一本笑话集了!

颜宁在美国又获大奖,我们真的失去了一位伟大的科学家

颜宁现象的警钟:中国不是没有人才!但只成就奴才

量子纠缠已被实验证实,颠覆了99%人类认知

清华硕士集体逃离北京!中科院科研人员的自白:我为什么离开北京









扫码进入知识分享社群

分享优质内容,让阅读有价值

  愿行者智,并智者行  

公众号后台回复 “社群”,  加入社群








继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存