ChatGPT时代呼唤新的语言学理论
阅读本文前,请先点击上方的蓝色字体“语言学”,再点击关注,这样就能天天免费收到精彩文章了。每天都有更新,完全是免费订阅,请放心关注!
目前我们共有“语言学”“简牍学”和“讲座与学术”三个公众号,三者有所分工而又互相补充;
“语言学”专门发布最新的语言研究资讯、社会热点话题的语言学解析等内容;
“简牍学”专门发表简牍学及出土文献相关研究成果、学术信息;
“讲座与学术”专门发布语言、文学、历史、教育、哲学、社会、出土文献 等人文社科讲座预告和学术会议。
敬请新老朋友关注“语言学”“简牍学”和“讲座与学术”公众号,以便及时获取最新资讯!
编者按:柴语生(ChatGPT的中文名:柴语生 | 堂主唠叨)的爆红引发了全网狂欢,从未有一个智能问答系统获得过这样的关注。然而这种背景下,传统的语言学工作者难免会有一丝隐隐的苦涩:大数据就足够了吗?它就这样如此接近于理解人类语言了?
ChatGPT时代呼唤新的语言学理论
本文作者:林桂思
ChatGPT来了,性能很强大,用户非常多,争议非常大,对语言学、语言教学、写作、出版的冲击很大。
批评和反对的声音总结一下,有三种:
1.ChatGPT不知道自己在做什么,它只是一个超大规模语言数据上训练出来的模型,相当于一个记忆体,并没有多少学习与认知能力,更谈不上思考。严厉一点说,它就是台阅文无数的语言疯子。
2.ChatGPT严重干扰了学校的教学和论文写作等正常秩序。学生们可以使用GPT生成大量的文本,来完成作业、写论文、读书报告、程序代码,甚至可以完成毕业论文、文学作品等等。鼠标轻轻一点就完事儿了,这使得很多学生难以接受正常的知识技能训练,严重干扰了正常的教学秩序。
3.ChatGPT严重挑战了传统的语言学、心理学、文艺学等传统人文学科,也产生了许多知识产权、网络欺诈等相关的法律问题。因为ChatGPT基本没有用到传统的语言学、心理学的研究成果,而主要依赖大数据和神经网络模型。对语言学家来说,这是一个非常大的挑战。语言学有着辉煌的历史,对各种语言有大量的现象描写与规律总结,却没能开发出ChatGPT这样的产品。是理论出了问题,还是时代变了?
支持的声音也至少有两种:
1.ChatGPT有效推动了大数据和神经网络模型的发展,在资金、人才、技术、应用方面都吸引到了更多的资源。将来能够取得更大的技术进步与突破。ChatGPT在很大程度上,已经可以完成书面级别的图灵测试(机器可以像人一样,与人对话)。而图灵测试是1950年图灵的论文中提出来的,人们曾乐观地认为十年、二十年便可以实现,没想到拖到了今天。所以,ChatGPT还有很大的发展空间。
2.ChatGPT非常好用,应该好好利用。ChatGPT是一个非常方便的工具,用简单的命令,便可以生成符合要求的结果,虽然还不够完美,但是可以节约大量的时间与精力,是一个非常好的私人助手。
所以,一方面是技术公司不断涌入不断注资,一方面是用户不断增加,一方面是不断批评和反对。语言学家,应该怎么看?
要回答这个问题,还得回到乔姆斯基20世纪50年代发表的论文《描写语言的三种模型》。在这篇论文里,乔姆斯基就指出了马尔科夫模型的问题,认为马尔科夫这种模型,不足以生成合法的自然语言。作为基于语言数据的统计学习模型的先驱,马尔科夫模型在90年代之后就大放异彩,在计算语言学领域横扫了20年,之后逐渐被其他更好的统计学习模型取代。深度学习的诸多模型,也可以看做是这些统计模型的升级版。乔姆斯基在最近的访谈中依然认为,ChatGPT只是先进技术,并不是科学,没有解决科学问题。
GPT1—4代,不断刷新着语言学家的认知,为什么它越来越能生成合法的句子、甚至篇章?
作为大数据模型的对比,人类的小孩子一般3岁左右就可以学会说话。乔姆斯基就认为,小孩子并不需要成万亿规模的语言数据作为学习基础,较少的样本,便可以习得语言,所以区分出人类的先天语言习得装置(大脑硬件)和后天的语言习得过程。
现在看来,大数据输入+神经网络模型,可以是人脑之外的另一种语言习得与生成机制。就像人类发明的飞机,不一定需要两只会动的翅膀一样。
空气动力学、材料学、各种发动机开辟了航空航天的新世界。
化肥、饲料、育苗等农业技术促进了粮食产业。
主要的不同,是新技术没有脱胎于传统学科。ChatGPT的这种发展路线,是独立于语言学之外的一种技术路径。它本身除了数学基础和硬件技术之外,并没有针对语言、图像、音频的完善理论,就取得了非凡的进步。
所以,我们为什么不发展出基于这些技术实践的新理论、新方法呢?
推广内容如有侵权请您告知,我们会在第一时间处理或撤销;互联网是一个资源共享的生态圈,我们崇尚分享。图片其他平台转载请注明(来源:语言学)。
转载仅供思考,不代表【语言学】立场。
今日文章就到这~近期,微信公众号信息流改版。每个用户可以设置常读订阅号,这些订阅号将以大卡片的形式展示。因此,如果不想错过“语言学”的文章,你一定要进行以下操作:
进入“语言学”公众号 → 点击右上角的 【菜单】→ 选择【设为星标】
重磅 | 2022国家社科基金后期资助暨优秀博士论文出版项目立项名单(语言学)
2月11日-2月14日人文社科讲座32场!相忘江湖一一走近《庄子》内七篇的思想世界;《遇见孔子,遇见最好的老师》(上)
编辑 | 巴婧懿
审核 | 兰娅妮
来源 | 公众号“语言文字周报”