查看原文
其他

LLM时代的知识:民主化 vs 精英主义

张海庚 张无常 2023-10-09

看到一段很漂亮的话,无论是内容、还是修辞:


我们正在目睹「有用互联网」的终结。未来互联网上有用的内容,将深锁在付费墙后,在各种不开放的Discord和私人论坛里。而公开访问的互联网,将越来越多地充斥着由LLM生成的碎片,它们看起来很像有用的内容。


寻找无偏见且独立的产品评价,专业的技术支持,以及各种有用的建议的过程,现在将类似于人们现在搜索非法体育直播或盗版期刊文章的方式。


像Reddit这样的地方承载了几十年的真实人类对话,这些将证明是对无意识的机器人和取代它的欺诈营销者的有用训练材料。


——《互联网的最后一页》




免费、共享、有用的原教旨主义互联网将不复存在。


借题发挥,说下感想:


互联网的历史,有一条广为传颂的明线,就是知识民主化持续发展的历史,感谢维基百科们,知识借助互联网免费、自由共享。


当然,互联网历史也有一条暗线,那就是知识精英主义被持续抑制的历史。


一方面,信息差、知识差不再,另一方面,严肃的、理论的、深刻的思考被冷落——他们在声量上从来都是少数,但互联网来了,他们甚至被大众反噬,在道义上变得不重要、甚至被动了


从这个意义上说,互联网的历史,是知识民主化和知识精英主义相互冲突、相互促进的历史。


当然,这也不是互联网的问题,也不是上文提到的LLM的问题,应该就是媒介的问题,可以追溯到印刷术甚至造纸术。


本质上是因为互联网大了,不再只有象牙塔的人了。



把上述感想发给@Corn++,意外收到一长段精彩的回复:



我觉得挺好的。完全的知识垄断是没有生命力的,必须要有一定的民主性,让普罗大众能接收到基础的人文科学素养训练,这样才能撞出新的智慧(我觉得人类社会本质都是在碰运气,必须要足够多的尝试,才能撞出成功可行的路。上到宇宙航行文明跃迁,下到职业规划美食探店都是这样);


然而,知识垄断本身其实古往今来一直都存在。有部分“帝王之术”也是只有皇帝贵族才能接触到,一方面是贵族体现身份的象征,另外一方面这些知识其实对普罗大众的意义也不大,一般人缺少动力去学。所以知识垄断造成的鸿沟一直都有。


回到现在互联网造成的“鸿沟”。其实,与其说互联网带来鸿沟,我倒想说我们都多多少少是互联网时代知识连接的受益者:早些年的MOOC,现在的B站Youtube,优秀的教育资源数不胜数。我们普通人获得了前所未有聆听大师教诲的机会,这个在我看来是非常好的一件事。我觉得他们都是有用的,且目前都是免费的,且未来我认为也不会付费。更多的人学到了关键的基础知识,在互联网上展开了广泛的交流讨论,产生了有益的“知识民主”


再具体到LLM的发展导致的"public-facing web increasingly filled with detritus"问题。确实,这已经是一个我们不得不面对的点。但我觉得其实还好。因为我觉得真正有影响的有价值的讨论大多数都是私人的,小范围的,一直如此。只是在互联网时代,我们有了更多更方便的“房间”而已。而一旦某项发现被证实是重要的、有巨大影响的,那一定会有人将他们公布于互联网上,让大家都能学习了解。



至于其他的“unbiased and independent product reviews, expert tech support and helpful advice”,当然也重要,也确实比之前更难获取了,只是对于比较熟悉互联网技术的一群人来说影响有限。因为这些内容仍然是存在的,但因为信息总量变多,更难以找到和区分


不过,对很多不熟悉互联网的人来说,难度系数应该要翻倍——之前大家依赖搜索引擎,通过召回排序提供相关结果。现在各大搜索引擎试图直接给到结果,这个最终生成的结果的是“民主的”:依赖民主的数据,可能也基于民主的机制产出结果。这确实是一个机会——如何把“真实有用”的结果反馈给用户,现在看来挑战不小。


总的来说,“知识民主化”和“知识精英化”在互联网时代下都得到了新的发展,LLM的到来也确实带来了新的冲击。个人认为,对于最关键的知识,它可能产生于小范围的精英讨论,但是最终也一定会公布于众,而不会锁在屋内。


对于一般的知识、见地或者信息,不熟悉互联网的人确实比之前更容易获得干扰,但这个也同时是机会。知识付费对于一些人来说就已经是可以摸得着的机会,但对于信息服务提供者,应该还有更大的机会。



你实在很难想象,在IM里开启知识民主化、知识精英主义这类话题时,能得到这样的长回复(这本身就很值得玩味),我反复读了很多遍,才决定先只回复一小点:


最终生成的结果的是“民主的”:依赖民主的数据,可能也基于民主的机制产出结果——这其实也决定了LLM的输出很难是有特点的、非共识,所以,保持个人的独特性,仍然有价值,而且更有价值了。



@Corn++回复如下:


的,这种多源融合,无非就是投票或者加权投票。在LLM数据灌入的场景下,至少要先过滤,后面加权投票才有意义。不过过滤不容易。其实LLM出现之前,大家产出的内容也并不是说有多优质——可能还恰恰相反,很多人输出的内容文不达意、漏洞百出。但他们贵在真实,是真实世界的采样。


可LLM出现后,灌入大量难以分辨的内容,我们对真实世界的采样便变得更加困难了。采样都不准,基于采样的共识又怎么去保证质量呢。


LLM对“民主”的基础发出了挑战——到底哪些是真正的民(意)?


感叹一句精彩,实在是值得单独写作、面谈的话题,但没时间了(我们总是没时间)——今天就先开个头,作为「知识民主化和知识精英主义相互冲突、相互促进」的一个注脚。



参考链接:The Last Page Of The Internet

https://defector.com/the-last-page-of-the-internet



相关阅读:



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存