查看原文
其他

ChatGPT时代呼唤新的语言学理论

林桂思 语言学 2023-03-14
点击蓝字,立即关注




阅读本文前,请先点击上方的蓝色字体“语言学”,再点击关注,这样就能天天免费收到精彩文章了。每天都有更新,完全是免费订阅,请放心关注!


   目前我们共有“语言学”“简牍学”和“讲座与学术”三个公众号,三者有所分工而又互相补充;


   “语言学”专门发布最新的语言研究资讯、社会热点话题的语言学解析等内容;



   “简牍学”专门发表简牍学及出土文献相关研究成果、学术信息;  



 “讲座与学术”专门发布语言、文学、历史、教育、哲学、社会、出土文献 等人文社科讲座预告和学术会议。



    敬请新老朋友关注“语言学”“简牍学”和“讲座与学术”公众号,以便及时获取最新资讯!
















编者按:柴语生ChatGPT的中文名:柴语生 | 堂主唠叨的爆红引发了全网狂欢,从未有一个智能问答系统获得过这样的关注。然而这种背景下,传统的语言学工作者难免会有一丝隐隐的苦涩:大数据就足够了吗?它就这样如此接近于理解人类语言了?



ChatGPT时代呼唤新的语言学理论

本文作者:林桂思


ChatGPT来了,性能很强大,用户非常多,争议非常大,对语言学、语言教学、写作、出版的冲击很大。


批评和反对的声音总结一下,有三种:

1.ChatGPT不知道自己在做什么,它只是一个超大规模语言数据上训练出来的模型,相当于一个记忆体,并没有多少学习与认知能力,更谈不上思考。严厉一点说,它就是台阅文无数的语言疯子。


2.ChatGPT严重干扰了学校的教学和论文写作等正常秩序。学生们可以使用GPT生成大量的文本,来完成作业、写论文、读书报告、程序代码,甚至可以完成毕业论文、文学作品等等。鼠标轻轻一点就完事儿了,这使得很多学生难以接受正常的知识技能训练,严重干扰了正常的教学秩序。


3.ChatGPT严重挑战了传统的语言学、心理学、文艺学等传统人文学科,也产生了许多知识产权、网络欺诈等相关的法律问题。因为ChatGPT基本没有用到传统的语言学、心理学的研究成果,而主要依赖大数据和神经网络模型。对语言学家来说,这是一个非常大的挑战。语言学有着辉煌的历史,对各种语言有大量的现象描写与规律总结,却没能开发出ChatGPT这样的产品。是理论出了问题,还是时代变了?


支持的声音也至少有两种:

1.ChatGPT有效推动了大数据和神经网络模型的发展,在资金、人才、技术、应用方面都吸引到了更多的资源。将来能够取得更大的技术进步与突破。ChatGPT在很大程度上,已经可以完成书面级别的图灵测试(机器可以像人一样,与人对话)。而图灵测试是1950年图灵的论文中提出来的,人们曾乐观地认为十年、二十年便可以实现,没想到拖到了今天。所以,ChatGPT还有很大的发展空间。


2.ChatGPT非常好用,应该好好利用。ChatGPT是一个非常方便的工具,用简单的命令,便可以生成符合要求的结果,虽然还不够完美,但是可以节约大量的时间与精力,是一个非常好的私人助手。



所以,一方面是技术公司不断涌入不断注资,一方面是用户不断增加,一方面是不断批评和反对。语言学家,应该怎么看?


要回答这个问题,还得回到乔姆斯基20世纪50年代发表的论文《描写语言的三种模型》。在这篇论文里,乔姆斯基就指出了马尔科夫模型的问题,认为马尔科夫这种模型,不足以生成合法的自然语言。作为基于语言数据的统计学习模型的先驱,马尔科夫模型在90年代之后就大放异彩,在计算语言学领域横扫了20年,之后逐渐被其他更好的统计学习模型取代。深度学习的诸多模型,也可以看做是这些统计模型的升级版。乔姆斯基在最近的访谈中依然认为,ChatGPT只是先进技术,并不是科学,没有解决科学问题。


GPT1—4代,不断刷新着语言学家的认知,为什么它越来越能生成合法的句子、甚至篇章?


作为大数据模型的对比,人类的小孩子一般3岁左右就可以学会说话。乔姆斯基就认为,小孩子并不需要成万亿规模的语言数据作为学习基础,较少的样本,便可以习得语言,所以区分出人类的先天语言习得装置(大脑硬件)和后天的语言习得过程。


现在看来,大数据输入+神经网络模型,可以是人脑之外的另一种语言习得与生成机制。就像人类发明的飞机,不一定需要两只会动的翅膀一样。


空气动力学、材料学、各种发动机开辟了航空航天的新世界。


化肥、饲料、育苗等农业技术促进了粮食产业。


主要的不同,是新技术没有脱胎于传统学科。ChatGPT的这种发展路线,是独立于语言学之外的一种技术路径。它本身除了数学基础和硬件技术之外,并没有针对语言、图像、音频的完善理论,就取得了非凡的进步。


所以,我们为什么不发展出基于这些技术实践的新理论、新方法呢?


温馨提示 

推广内容如有侵权请您告知,我们会在第一时间处理或撤销;互联网是一个资源共享的生态圈,我们崇尚分享。图片其他平台转载请注明(来源:语言学)。


转载仅供思考,不代表【语言学】立场。


今日文章就到这~近期,微信公众号信息流改版。每个用户可以设置常读订阅号,这些订阅号将以大卡片的形式展示。因此,如果不想错过“语言学”的文章,你一定要进行以下操作:


进入“语言学”公众号 → 点击右上角的 【菜单】→ 选择【设为星标】




推荐阅读

如何撰写一篇可发表的文献综述?北外教授的文献综述写作技巧!


重磅 | 2022国家社科基金后期资助暨优秀博士论文出版项目立项名单(语言学)


李运富主编:汉语字词关系与汉字职用学


2月11日-2月14日人文社科讲座32场!相忘江湖一一走近《庄子》内七篇的思想世界;《遇见孔子,遇见最好的老师》(上)


王竹勋:秦汉简帛文献“訾”“赀”“资”的字词关系研究



END

编辑 | 巴婧懿

审核 | 兰娅妮

来源 | 公众号“语言文字周报”























语言学语言之妙 妙不可言既可意会 也要言传




















您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存