紧随百度、阿里,知乎的大语言模型也来赶趟了!
知乎与面壁智能合作发布“知海图AI”中文大模型,首个大模型功能“热榜摘要”上线并开启内测。
“2023知乎发现大会”上,知乎创始人、董事长兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎与面壁智能在AI大模型上的最新合作与应用,正式发布“知海图AI”中文大模型。
知乎创始人、董事长兼CEO周源
据了解,知乎通过联合研发与战略投资的方式与国内顶尖大模型团队面壁智能达成深合作,共同开发中文大模型产品并推进应用落地。
目前,知乎和面壁智能合作自研的“知海图AI”中文大模型,已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测,利用语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
据了解,面壁智能在2020年年底发布了首个中文大语言模型 CPM-1,之后又陆续发布了CPM-2、CPM-3和CPM-Ant等模型。其创始团队成员全部来自清华大学计算机自然语言处理与社会人文计算实验室(清华大学NLP实验室)。
值得一提的是,面壁智能与知乎有很深的渊源,面壁智能CTO曾国洋是知乎机器学习领域的优秀答主,与知乎在2018年就有过学术上的合作。
李大海在大会上介绍, “知乎与面壁智能在交流中发现彼此的产品观和价值观都很匹配,我们对面壁进行了投资,并且展开了深入的模型共建过程。”
“经过测试,在知乎热榜的应用场景下,知乎与面壁合作自研的大模型与GPT-4相比达到了持平的效果。” 曾国洋在演讲中指出。
对此, 李大海在会后的采访中解释称,该评测是在热榜问题下,把所有知友的回答观点抽取聚合,抽取了40个提问。
“在知乎这个场景里面,答主的回答千奇百怪、非常开放,甚至会出现观点跟提问没有关系的情况。这对整个大模型很有挑战。我们做了很多的工作,在这个场景下抽了40个提问去做评测。评测以后,发现跟GPT-4在这方面基本持平,我们稍微差一些,但还是蛮不错的。”
谈及ChatGPT这类大模型技术和应用,对整个内容行业的影响时,周源认为,首先是生产力和效率的提升,其次是场景的赋能和优化,第三是工具的升级。“像搜索和推荐这样的偏工具化的场景里面,可以做很多的升级工作。我们大概也会围绕这样的推进顺序,在社区里面去做更多实践。”
在AI大模型的竞逐中,算力是关键因素。李大海表示,这方面也与国内厂商洽谈合作。
“我们发现其实有一些场景,很多国产厂商表现非常好,会跟他们合作。另外,英伟达H800、A800这些在国内都可以用了,我们也在跟厂商进行深入地沟通,所以并没有大家想象这么大的问题。”
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林表示了对知乎大模型的期待。
“因为知乎的运营模式决定了其积累了大量高质量的内容,在当前国内互联网高质量内容匮乏的情况下,知乎的优势得天独厚,的确具备构建一个大模型的数据量。知乎也将因此受益。”
盘和林认为,尤其是变现方面,知乎很可能通过AI大模型获得一个强力的变现应用端口。“当然,比较遗憾的是最近几年知乎内容质量有所下滑,但如果有一个成功AI大模型,在生产力需求驱动下,知乎很可能重回知识的内核,而去除那些娱乐性质的严选内容。”
当前各个大厂、创业企业纷纷扎堆大模型研发,盘和林分析,这属于正常现象。
“当然,各家资源禀赋各不相同,知乎的资源禀赋类似于百度,但数据质量高于百度,而大模型的竞争对这些企业自身生态发展也有好处,为了竞争,相信这些平台将重新重视系统性、结构工整的知识类内容,这有利于我国科技和生产力的发展,所以要鼓励大模型竞争,越多越好,最终由用户来做选择。”
互联网分析师张京科指出,如今由ChatGPT所引领的大模型浪潮,是科技领域的一次跨时代进步,但也存在巨大的用户隐私安全风险。
“如今,互联网公司正在尝试用自己掌握的大数据投喂AI模型,很多时候厂商会以格式条款的协议获得用户各种隐私信息的授权,面对这些APP签订的协议,用户几乎没有选择的余地。各大互联网巨头源源不断地以用户信息投喂献祭,很多用户也不介意类似的隐私安全风险。”
张京科指出,这意味着用户所有的隐私、喜好、聊天、关系链,甚至密码等等,未来有可能因为一个小小的安全漏洞或者运营事故,而大白于天下。为此,应制定更严格的用户大数据使用标准等措施提前进行预防。
推荐阅读