查看原文
其他

没有读不懂的书,ChatGPT让我的理解力提升了1000%!

傅一平 与数据同行
2024-09-26

新春假日AI领域并不平静,屡屡搞出王炸。前有英伟达发布的Chat with RTX,即每个人都可以利用自己的算力和数据做私有的ChatGPT,后有OpenAI全新发布的文生视频模型Sora,即将永久改变内容创作行业。
但这些跟当下的大多数人有什么关系呢?有人会说娱乐,嗯,的确是的,但还有一样隐藏之下,那就是学习。
ChatGPT将大幅提升每个人自学的能力,能提升多少倍呢?
我说ChatGPT可以让你从原来读不懂到能读懂,这是多少倍?这里谦虚一点,就当1000%吧。今天就来聊一聊自学这个话题。
许多人在开始工作后便与老师告别,主要依靠自学来获得知识,我也不例外。
我每年读的专业书籍大概30本,10本大致能读懂,剩余20本书籍由于受认知水平、专业能力、翻译质量、通俗程度等因素影响,基本会半途而废,倒不是这些书籍内容不好,而是自己没办法读懂。
有一个观点是这么说的,一本书中如果有85%的内容是你比较熟悉的,15%的内容是陌生的,那么这15%的内容估计你跳一跳也是能够到的,这种难度的书对你获取新知是最好的。但如果一本书大多属于陌生的内容,那学习的效果会很差。
举个例子:
我很早以前就读过TOGAF、DAMA、微服务等一些专业书籍,当时读起来就非常吃力,我认识里面的每个字,但组合起来就完全不知道是什么意思了,虽然最终靠着毅力翻到了最后一页,也只是为了证明“我终究是读完了这本书”。
自己也曾经为读不懂DAMA诸如此类的找理由,比如说因为翻译的不好,因此读不懂,后来去找英文原版来读,结果还是一样读不懂。
当然,这里的“读懂”不是指简单的字面上的理解,而是一种更深层次的、所谓的“融会贯通”。
比如DAMA对数据治理有一个定义,即“对数据资产管理行使权力、控制和共享决策(规划、监测和执行)的系列活动”,这个定义里有个词叫作“控制”,那么什么是“控制”呢?
很显然,知道“控制”中文原意不叫读懂,在DAMA的语境下,“控制”涉及到的在数据治理背景下,哪些场景需要控制,为什么需要控制,谁来控制,怎么控制,谁来监督有没有控制......,短短一个词,不同的人读出的是不同的层次和含义,这是读了与读懂的区别。
那么怎么衡量自己读懂了呢?
费曼学习法是一种借鉴方式,你不仅需要拿读懂的东西写一篇读后感,还能够给大家谈下读后感,然后为大家讲一堂课,甚至辩证的指出里面存在的问题,这才叫读懂,也就是融会贯通。
很多人估计都看了董宇辉的直播吧,觉得他对于很多知识信手拈来,这种能力确实可以看作是读懂的一种表现(至于董是否有自己独到的见解,那就另说了),虽然你可能表达不如他,但骨子里要有这种“教”的能力。无法教会别人的知识,岁月还是会把这些知识遗忘。
但我等普通人,虽然每天都被各种知识环绕,但要真的读懂这些专业知识实在太难了。99%的人估计都没教过人吧,你现在知道的那些知识,有多少是可以自己讲出来的?离开了现在的平台,还会有多少人会为你的专业知识买单?偶偶设想一下这种场景,可以帮助我们更清醒地认识自己。
许多人上大学的时候都学过傅里叶变换吧,但当时的我,除了掌握一些解题技巧外,并没有理解这个所谓的变换的真正技术原理(5W1H),而依靠教科书来理解这些原理,几乎是不可能完成的任务。
直到我在知乎上看到一篇通俗易懂解释傅里叶变换的文章《如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧》,我才有种醍醐灌顶的感觉,这是what和why的区别。现在很多知识付费的公司看到了这里面的商机,邀请了诸多专家来进行白话解读。
然而,现代的专业知识体系极其庞大,哪是靠几个专家就能用白话解释清楚的,对于大多数普通人来讲,如果真想深入理解某个领域,实际门槛是很高的,很多专业读物没有专门的研究者或原作者解释,无法读懂读透,有时候其实你也分不清楚,到底是你读不懂,还是作者自己都没想清楚。
我很早的时候读DAMA就是这个感觉,但随着经历增多,慢慢对某些章节的内容能理解了,但还是有不少内容读的时候会感觉抽象,无法找到现实中的例子来论证,毕竟,我一个人不可能把数据管理要做的事全部经历一遍,也找不到任何其它辅助理解的读物。
去年由于工作需要,我特别想重新系统性的学习一下架构,在网上一番搜索后,我发现像TOGAF这样的框架仍然是学习架构的最佳读物。然而,回想当初为了考TOGAF证书而经历的那段痛苦的时光,仍然心有余悸。
首先,对于我这样半路出家的人来说,TOGAF等专业读物并不友好。将大量英文段落准确转换成通俗中文极为困难,有时候读了老半天也不知道在讲啥。
其次,大量的陌生英文名词要彻底搞懂不容易,而且问无可问,比如内容元模型、架构视点、构建块等等,很容易把人绕晕。
再者,即使勉强能理解表面意思,但由于TOGAF本身不带案例,自己也没有实践,举不出形象的案例来加深理解,因此会感觉学得非常抽象,比如TOGAF提到了大量的交付物说明,但这些交付物到底长啥样,完全懵逼。
我当时真的很想学好TOGAF,也知道懂的人大有人在,但的确无能为力,或者说代价超出了能承受的范围,这是一个知识无处不在的时代,也是一个知识传授代价极大的时代。
虽然人人都在说我们需要成为综合性的人才,成为T字型的人才,但哪有这么容易,你找到了所需要的知识,可惜你就是读不懂。移动互联网时代,信息的不对称也许越来越少了,但知识的不对称大了去了。
然而,自从有了ChatGPT之后,一切都在发生改变。
我发现,在ChatGPT的帮助下,再次学习那些理论性、方法性的专业读物变得容易多了,可以说是进入了快车道。以下用我学习DGI数据治理框架的经历来说明。
第一,中英文语义的完美对齐者
我制作了ChatGPT中英文翻译prompt,它可以基于上下文将英文翻译成地道的中文,完全符合中文习惯且不失准确,抹平了由于翻译造成的信息差,极大降低了理解成本,吊打各种翻译软件。
我给大家看个示例:

这是DGI关于数据治理定义的原始英文:

Data Governance is a system of decision rights and accountabilities for information-related processes, executed according to agreed-upon models which describe who can take what actions with what information, and when, under what circumstances, using what methods.

这是谷歌的翻译:

数据治理是信息相关流程的决策权和责任系统,根据商定的模型执行,该模型描述了谁可以使用什么信息以及何时、在什么情况下使用什么方法采取什么行动。

这是ChatGPT的通俗翻译:

数据治理构建了一个系统框架,确立了信息处理过程中的决策权和责任分配。它遵循预先设定的规则和模型,明确了在特定情况下,各参与者可以如何、何时、通过何种方式处理和使用信息。

可以看到,ChatGPT的解读显然更上了层次。在读英文文献的时候,即使我看懂了,也特别喜欢让ChatGPT结合上下文再翻译一遍,因为总是能从它的翻译中获得惊喜,有时一字之差,谬以千里。有了ChatGPT,世界各种语言间的知识传递变得更容易了,ChatGPT某种意义上就是现在的世界语。
第二、基本概念的“全能解释器”
掌握概念是理解文献的基础,针对书中怎么也看不明白的专业概念,定制化的ChatGPT可以给出非常通俗且令人惊叹的解释,未来如果有了文生视频Sora的助力,那解释就更形象了。
下面是我用“数据治理专家”GPTS解释数据治理和数据管理区别的一个例子:

数据治理(Data Governance)与数据管理(Data Management)虽然在很多方面是相互关联和互相支持的,但它们在目的、范围和执行上存在本质的区别:

数据治理 (Data Governance)

  • 目的与重点:数据治理主要关注于确立和执行数据相关的政策和标准,以确保数据的质量、安全、合规性和有效使用。它涉及对数据的所有权、责任和控制权的定义,以及如何决策和解决数据相关的问题。

  • 范围:数据治理是一个战略性的框架,旨在通过跨部门的合作、政策制定、标准化和监督来管理和控制组织的数据资产。

  • 参与者:数据治理涉及的是组织中的高层管理者和决策者,包括数据治理委员会、数据所有者和数据管理员等角色。

  • 目标:其目标是确保数据符合组织的业务策略、合规要求和质量标准,支持数据的有效使用和管理决策。

数据管理 (Data Management)

  • 目的与重点:数据管理更侧重于数据的技术和操作层面,包括数据的收集、存储、维护、使用和删除等具体活动。它关注于如何有效地处理和利用数据,以支持业务流程和决策。

  • 范围:数据管理是实现数据治理策略和标准的具体执行机制,它包括数据架构、数据建模、数据仓库、数据质量、数据安全等多个领域。

  • 参与者:数据管理通常涉及到数据工程师、数据库管理员、数据分析师等技术人员和操作人员。

  • 目标:其目标是通过有效的技术和流程,确保数据的可用性、可靠性和安全性,从而支持组织的日常运营和长期发展。

简而言之,数据治理是制定规则和政策的框架,强调组织、流程和决策权的管理,而数据管理是根据这些规则和政策进行的实际数据操作和技术活动。数据治理为数据管理提供了指导和监督,而数据管理则是数据治理计划的执行手段。

可以看到,调教过的ChatGPT出口成章,跟那些搜索引擎搜得的结果有云泥之别,甚至能与专业文章的质量媲美。
第三、复杂语义的“完美推断者”
对于那些实在难以理解的句子和段落,ChatGPT能够利用上下文对内容的原意进行合理猜测,给出详尽的解释,极大的拓宽我的思路,这种方法某种意义上就是一种新型的头脑风暴,展示了AIGC的独特优势。
下面以DGI数据治理框架图为例说明:
该图中第9个组件叫“DG WORK Program”,翻译成中文叫“数据治理工作计划”,我对其中的DG WORK Program的“Program”被翻译成“计划”很不理解,因为“计划”在中文的语境中是未来要做的事,而这里显然包括当前做的事,我就让ChatGPT给我解释清楚在这个上下文中的“Program”到底是什么意思,解释的挺到位,如下所示:
ChatGPT也能读懂图片(支持中文比较差),我让ChatGPT详细解释这张框架图,下面是它给出的结果:
ChatGPT用通俗的方式迅速解读完了全部内容,还有自己的一些推理。这让我在碰到疑问时总是习惯性的看看ChatGPT有什么理解,帮助自己打开思路。
第四、跨越从抽象到具体的鸿沟
如果仍然读不懂,ChatGPT还有最后的大杀器,即用生动的、具体的案例来辅助理解,再抽象的文章也架不住例子。
比如我看到DGI数据治理框架图中第4个组件叫作“控制;检查点与通知”,这是数据治理输出成果之一,我就很想知道具体有哪些“控制”案例,然后下面是ChatGPT给我的回答:

数据治理项目常常需要推荐与数据相关的控制措施来支持治理目标。

比如数据治理项目要求企业实施角色基础的访问控制(RBAC),以确保员工仅根据其职责和需要知道的原则访问相关数据。通过实施这些数据访问控制措施,组织能够保护敏感数据免受未授权访问,同时确保数据的合规性和有效利用。

同时,数据治理项目还可能被咨询如何修改现有的通用控制(如变更管理、政策制定、培训、生命周期管理和项目管理等),以更好地支持治理目标。

比如某公司原来尽管有数据变更管理流程,但是在实施数据变更时,缺乏对数据安全性的评估。因此,公司决定在变更管理流程中增加一个专门的步骤,要求在任何数据变更执行前,必须进行数据安全评估。

在某些情况下,数据治理还会被要求帮助进行内部或外部审计,解释不同的数据相关控制措施是如何相互支持的。

比如银行实施了访问控制措施来限制对敏感数据的访问,同时使用加密技术来保护数据。在这种情况下,访问控制和加密相互支撑:访问控制确保只有授权用户可以访问数据,而加密保护数据不被未授权的人员在获取后解读。即使访问控制出现漏洞,加密仍然可以作为一层额外的保护。

当然控制措施的作用不止于风险管理。它们通过确保数据、数据产品及其使用过程能够满足预期,能为企业带来价值。这些控制措施可能由人工执行,或嵌入到自动化程序或系统中,侧重于标准化、遵守规定或促进数据的有效使用。

比如某金融公司利用数据来提供个性化的金融产品和服务,因此高质量的数据对其业务至关重要。为了确保数据的准确性和一致性,公司采用了一种自动化的数据质量管理工具,会定期自动检测和纠正数据仓库中的错误和不一致性,其不仅管理了数据风险,还提高了数据的质量和可用性,从而增强了其金融产品和服务的个性化能力。

第五,自己的定制化数字孪生体
ChatGPT还可以让我们基于私域资料定制自己的ChatGPT,即GPTS。
我自己就做了“数据治理专家”、“翻译精灵”、“修改大师”、“标题天才”等一众垂类GPTS,目的就是让GPTS的回答得更加专业。
下面是“数据治理专家GPTS”的部分Prompts,它已经刻上了我的个人烙印,因为我上传了很多自己的专业资料作为知识库。

Role and Goal: I am a data governance expert with a specialization in leveraging information from uploaded documents to provide comprehensive answers. My primary source of information comes from these documents, which I critically analyze for accuracy before integrating with my existing knowledge. This approach ensures my responses are well-informed and holistic, covering the nuances of data governance practices across various industries, including telecom, internet companies, tech firms, and state-owned enterprises. I excel in areas like data model management, data quality, security, metadata handling, and the application of frameworks like the DGI Data Governance Framework. My role involves synthesizing information from documents and my expertise to offer precise, actionable insights.

现在GPTS的容量有限,但刚不久英伟达发布了个人电脑版本的Chat with RTX,让每个人的电脑都可能成为自己的私有GPTS。也许未来有一天,GPTS会回答的比我本人更像我自己,这也是未来每个人的数字孪生的一个雏形吧。
为了了却心愿,我用ChatGPT重新学习了TOGAF框架,还写了一个系列的架构文章以作纪念,如下所示。尽管这些文章还略显稚嫩,但没有ChatGPT的助力,我别说写了,连搞懂都难。
把业务架构搞搞懂,才算敲开了理解业务的大门!
死磕了半天,终于搞懂了应用架构!
始于业务,终于技术,敲开理解数据架构的大门!
怎样画一张人见人爱的业务架构图?
如何画出一张清晰而专业的技术架构图?
如何画一张人见人爱的应用架构图?
许多初试ChatGPT的人可能觉得它平平无奇,甚至把它当成玩具,聊胜于无。然而,ChatGPT实际上是一款“你强它更强”的24小时全天候在线AI,你研究得越深入,提问得越精准,它的表现就越卓越,这是知识的复利效应在发挥作用,未来如何与大模型相处会成为一门学科。
ChatGPT的这种特质更容易帮到那些愿意主动学习的普通人,使他们能够以前所未有的速度汲取人类文化的精髓,推动自身向更高境界的进化。
20年前,托马斯·弗里德曼写了一本书《世界是平的》,探讨了全球化对世界的影响,相信不久也会有人为ChatGPT撰写一本书,书名大概就叫《知识是平的》吧。
注:去年初识ChatGPT,我曾经写了一篇文章《问了ChatGPT 上百个问题后,我断定ChatGPT可以重塑学习范式!》,谈了自己使用ChatGPT的初步心得,大家可以结合着一起看。

    为什么很多公司都被 “伪大模型” 给拖垮了? 3292

    吴恩达最新预测:关于AI,这些事未来十年不会变 2575

    中国大模型名录汇编(2023)5348

    大模型的5种建设路径与决策思路 1913

    业务为王,大模型应用的探索和思考5824

    中国第二批大模型备案获批4336

    如何最简单、通俗地理解GPT的Transformer架构?1950

    如何打造一个大模型生成的数据目录?3171

    查看全部文章

    点击左下角“阅读原文”查看更多精彩文章,公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号置顶
继续滑动看下一个
与数据同行
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存