查看原文
其他

曾 军|从数字人文到AI人文:人文研究范式的变革

曾 军 东南学术
2024-09-04



作者简介



曾军,文学博士,上海大学文学院教授、博士生导师


摘  要


  随着生成式AI技术的持续进步,人文研究的数字人文范式正在向“AI人文”转型。传统的数字人文通过技术手段,成功将人文文献转化为数字化和数据化的形式,实现了对文献的高效处理与利用。AI人文不仅是数字人文的升级版,更有望实现AI4R(AI for research),推进人文信息分析的自动化和智能化,具有知识生产的潜能。生成式AI实现了人类经验的向量化,通过模式识别、信息重组、预测推断和语言生成技术等,具有了辅助参与知识体系建构、提供趋势预测和决策参考的重要功能。不过,目前AI人文的基本方式还是人机交互辅助生成,仍是“需要人的AI”,人依然处于中心性、支配性和主导性地位。同时,“拥有AI的人文”也亟待应对算法黑箱、算法偏见、AI幻觉,以及可能的AI自我意识的觉醒等问题。


近年来,生成式人工智能(artificial intelligence,以下简称AI)正逐渐成为推动各个行业与学科领域实现智能化转型的关键力量。以ChatGPT和文心大模型为代表的生成式AI技术不断成熟,不仅促进了跨行业的技术应用,也为学术研究、新文科建设开辟了新的可能性。华为公司提出的“千行百业”智能化战略,旨在通过技术加速行业智能化进程,实现共赢的智能化未来;百度公司与上海大学合作,通过建立“千学百科平台”,致力于推动AI在教育领域的深入应用。这些举措体现了AI技术在不同领域的融合与创新。生成式AI的核心优势在于人机互动和辅助生成功能。这些功能使得用户能够通过自然语言与AI进行实时交互,激发创意并生成内容,拓展了人文研究的想象空间。由此,人文研究的数字人文(digital humanities)范式正在向AI人文(AI humanities)转型。


  

从数字人文到AI人文的技术演进逻辑

  

作为一门融合了信息技术与人文学科的跨学科研究领域,数字人文的基本特点就是运用先进的数字技术与计算方法,对人类文化与历史进行深入的探索和分析。该领域的起源可追溯到20世纪中叶的人文计算(humanities computing)。其中具有里程碑意义的,是意大利学者罗伯托·布萨(Roberto Busa)自1949年起与科技公司IBM合作,致力于编纂《托马斯著作索引》。这一工作成为数字人文早期实践的典范。21世纪初,同是意大利学者的弗兰克·莫莱蒂(Franco Moretti)提出“远读”(distant reading)理念,并在其《对世界文学的猜想》中进行了深入应用。莫莱蒂的这一创新方法论,以及他与马修·乔克思(Matthew L.Jockers)共同创建的斯坦福文学实验室(Stanford Literary Lab)促进了数字人文的发展。2001年,“数字人文”正式替代了“人文计算”,并在学术界得到了广泛认可和应用。

  

数字人文的技术演进经历了从最早的文本数字化和计算机辅助研究到最近的与AI技术结合的发展阶段。就一般状况而言,数字人文的研究方法论涵盖以下四个关键环节:首先是数据采集阶段,研究者通过互联网、图书馆、档案馆等多元数据源,系统收集并整理大量数据,为分析工作打下坚实基础。其次是数据处理阶段,利用算法、机器学习、数据挖掘等技术对数据进行清洗、分类与整理,以期准确揭示数据背后的深层含义。再次是数据分析阶段,研究者对海量数据进行深入分析,挖掘隐藏的信息与规律,提供新的研究视角与思路。最后是可视化展示阶段,通过图表、图像、动画等形式直观展现分析结果,提升数据解读与展示的便捷性与直观性。在生成式AI兴起之前,数字人文的技术处理流程相对烦琐,涉及广泛的数据处理与分析任务,对研究者提出了较高的技术门槛。他们常常需要投入大量时间和精力去学习编程逻辑、掌握计算机语言的语法结构以及熟练运用数据处理技术,这不仅提升了学习的难度,也可能因个人编程技能不足而限制研究的深度与广度。以数字人文各技术环节为例,数据收集与清洗工作非常复杂,涉及多种软件工具的协同使用和大量的手动操作。为了保障数据分析的精确性与可信度,研究者必须持续调整数据格式,妥善处理数据缺失与异常值等问题。这一过程不仅增加了工作量,也由于人工操作的介入增加了引入错误的潜在风险。一旦数据集中的缺失值处理不当,就有可能导致信息的丢失,影响最终的分析结果。在数据类型转换过程中,如将非数值字符串错误地转换为数值型数据,也可能引起分析偏差。数据标注和算法编写也是耗费资源的任务,需要大量的人力投入,并且标注的主观性可能影响分析的准确性。算法设计和优化的难度系数也相当之高。它要求研究者不仅要有深厚的专业知识,还要有创新和试错的勇气。在模型训练过程中,参数调整对模型性能有决定性影响,研究者需要不断试验和修正参数配置,才能达到最优的模型效果。这一过程无疑增加了研究的工作量,并存在因参数设置不当而导致的误差风险。

  

正因为其技术门槛和人力烦琐,数字人文技术的更新与发展在过去的一段时间内表现得相对迟缓。这种现象在一定程度上反映了一个核心问题,即数字人文技术的数字化、自动化和智能化水平的提升往往伴随着对人工劳动的相应需求,尤其是对专业技能和人力资源的依赖。这种高技术门槛和高人力投入的现实,一度限制了数字人文技术的广泛应用,使得其潜力未能得到充分发挥。布萨的《托马斯著作索引》就是一个经典案例。这部包含56卷的百科全书式著作,其编纂过程历时半个世纪,直至2005年,布萨在92岁高龄时才完成了这一壮举,其网站也随后上线。这一历史性成就不仅凸显了数字人文研究的长期性和复杂性,也反映了在技术辅助下的学术研究所面临的挑战。同样,尽管莫莱蒂在《远读》一书中通过细致入微的分析,绘制了《哈姆雷特》与《红楼梦》等文学作品的人物与情节关系图,但他一直对数字人文方法的技术化及其人文阐释的有效性持警惕态度,并呼吁“大数据引导我们回到大问题”。

  

当然,数字人文在发展历程中也涌现了一批专用工具与平台,这些工具促进了该领域的研究效率与深度。自动化数据收集工具,如网络爬虫、应用程序编程接口(APIs)、文本挖掘工具和社交媒体分析工具等,均能有效减轻研究者在数据收集与处理方面的工作负担,进而提升数据处理效率。预训练模型的发展则在某种程度上简化了人工标注和算法编写的烦琐流程,为研究者提供了更为高效的研究工具。其中,作为基于Transformer架构的预训练语言模型,BERT(Bidirectional Encoder Representations from Transformers,意为来自变换器的双向编码器表征量)模型通过掩码语言模型任务学习深层次的双向文本表示,已在各类自然语言处理任务中展现出卓越的性能。在此基础上,针对特定语料训练的模型,如“SikuBERT”和“SikuRoBERTa”,利用《四库全书》作为训练数据,为古文的自然语言处理任务如自动分词、断句标点、词性标注和命名实体识别等,提供了强有力的支持。可视化分析工具的应用也使得研究者能够更加直观地理解和分析数据,进一步提升了研究的效率和准确性。不仅如此,数据分析和可视化工具如Gephi适用于创建网络图表,Tableau允许用户创建交互式和可共享的仪表板,而Voyant则允许用户上传文本并快速生成多种可视化工具,辅助探索文本的模式和结构。又如中国历代人物传记资料库提供了可视化查询功能,使用户能够对历史人物数据进行地理空间分析和社会网络分析,这在人文学科的研究中尤为宝贵。这些工具和平台的应用,无疑为数字人文研究注入了新的活力,推动了该领域的快速发展,并为未来的学术探索提供了新的可能性。


近年来,生成式AI的迅猛发展使得数字人文的技术能级获得极大的提升。其实,在数字人文技术的各个环节上,AI技术早就部分参与、辅助并赋能人文研究了。比如,利用生成对抗网络(GAN)技术,艺术家可以生成山水画、水墨画和花卉等进行艺术创作,并将传统中国画转换为逼真图像;利用深度卷积生成对抗网络(DCGAN)技术,研究者可以识别图像的损坏部分并填充缺失部分,修复文化遗产;利用语音生成技术,研究者可以探索古代语言和音乐的声音,促进跨文化沟通与理解。以ChatGPT、文心大模型以及Sora这类大语言模型为代表的生成式AI获得突破性进展之后,数字人文获得了更强的AI赋能。大规模语言模型能更便捷地管理文本、理解内容,帮助研究者处理和生成自然语言文本。被称为“世界模型”(world model)的Sora不仅能够基于描述性提示生成视频,而且能够扩展现有视频,实现从静态图像生成视频等不同功能。此外,AI系统还能通过分析历史数据预测未来趋势或推荐研究假设等,从而为研究者提供决策支持等。

  

生成式AI技术所获得的重大突破,为人文研究提升了一个大台阶。如果说数字人文实现了人文文献处理的数字化和数据化,那么随着生成式AI技术的快速发展,AI人文将进一步实现对人文信息分析的自动化和智能化。所谓AI人文,指的是在传统的数字人文技术与研究范式的基础上,进一步整合生成式AI技术,以实现对数据处理、分析和展示流程的自动化和智能化改造。与数字人文侧重于数据的收集、整理、分析和可视化,强调人的研究主体性和对数据的深入解读不同的是,AI人文的核心在于利用AI的模式识别、数据重组、预测推断和语言生成等能力,处理和分析大规模的文本、图像和声音数据,从而揭示深层次的模式与关联。如果说数字人文在技术应用上更多依赖于人工操作和传统计算工具,那么AI人文则利用深度学习和自然语言处理等AI技术,尤其是生成式AI技术,实现更高效的数据处理和知识发现。尽管AI技术在数字人文中的应用标志着该领域技术发展的新阶段,但AI人文所代表的技术变革与以往数字人文所使用的技术有显著不同——生成式AI技术具有“第四次工业革命”的重要意义,预示着技术发展的一个重要转折点。在《第四次工业革命》一书中,施瓦布指出:“以计算机软硬件和网络为核心的数字技术早已不是什么新鲜事物,但与第三次工业革命不同的是,数字技术正变得更为精深,一体化程度更高,由此正在引起各国社会和全球经济发生变革。”为了强调这一次以人工智能为主体的系统性变革的重要性,施瓦布不惜用“这次不同了”这种饱含复杂情感的呼吁以期引起读者的重视。在研究方法上,数字人文与AI人文也有一定差异:前者更侧重于定性分析和文献研究,后者则更多通过定量分析和算法模型来提供新的研究视角。随着算力、算法能力的增强,AI人文在数据处理的自动化处理能力方面,远甚于早先还没有应用AI技术以及还没有达到AGI(人工通用智能)层次的AI技术的数字人文。AI人文的智能化水平已能够凭借生成式AI的技术来模拟人类的认知过程,为理解人类的精神文化现象提供全新方式。AI人文的这个能力将有可能参与知识体系的重建、实现对未知知识的预见以及辅助人类模拟和预测复杂的政治经济社会文化等现象。正因如此,若我们仍局限在已发展了近八十年的数字人文的框架下来讨论生成式AI技术在人文领域中的应用问题,将会严重低估AI之于人文研究知识生产的革命性意义。

  

从数字人文到AI人文,这种转型的核心目标是深化知识表征的层次,并激发新知识创造的潜力,从而推动人文学科研究方法的革新。在AI人文范式下,生成式AI的应用不仅能提高研究效率,而且可以模拟复杂的人类认知过程,为全新理解人类文化、历史和社会现象提供可能性。借助先进的机器学习和自然语言处理技术,AI人文能够高效处理和分析海量的文本、图像及声音数据,深入挖掘其中潜在的模式与关联,从而为人文研究领域提供全新的观察视角和理论支撑。

  

生成式AI的显著进步在于其实现了自然语言处理与编程语言之间的无缝交互。这一交互机制允许用户通过自然语言与AI进行沟通,而AI则能够解析用户的自然语言输入,并利用编程语言执行用户指定的任务。例如,ChatGPT、文心一言以及KimiChat等模型,尽管在应用层面有所差异,但它们均采用了类似的模型架构和技术逻辑,实现了自然语言与AI编程语言之间的有效转换。这一技术革新显著降低了非专业用户使用生成式AI的门槛。通过精心设计的提示词,用户能够以自然语言的形式向AI系统下达任务指令,包括但不限于角色设定、任务规范、工作流程设计以及特定模板或知识库的参考等。生成式AI完成初步内容生成后,用户可以进一步对输出进行微调,直至满足特定的研究或创作需求。经过大量文本数据的自动分析,基于Transformer架构的预训练模型能够准确提取文本中的主题、情感倾向和关键词等核心信息,展现出其强大的生成能力和信息处理实力。这一能力极大地增强了AI在处理复杂语言任务时的表现,为AI人文研究提供了新的工具和方法,同时为人文学科的学者提供了新的研究路径和创作灵感。

  

数字人文与AI人文在技术应用、研究方法和应用效果上各具特色与优势。数字人文领域以数字技术为基石,对文本、图像及多种文化资料进行深入分析与呈现。在这一过程中,研究者的积极参与至关重要,这对其主观能动性提出了较高要求。这种以人为中心的方法论不仅增强了研究的多样性,也带来了对人力资源的依赖。相较之下,AI人文则侧重于将生成式AI的技术整合到人文研究的各个环节,以实现研究流程的自动化与智能化。AI人文通过强调算法的智能处理能力和高效的数据处理机制,旨在提升研究效率并优化分析过程。在此过程中,数字人文所积累的丰富研究素材和数据资源为AI人文的发展提供了坚实的基础,AI人文则通过提供更为精确和高效的分析工具与方法论,为数字人文注入新的活力。由此可见,AI人文不仅有望成为数字人文的升级版,更可能引领人文学科研究方法的革新,推动数字人文向更高层次的智能化研究发展。


人类经验的向量化:AI人文的知识生产潜能


当前的生成式AI实现了显著的技术突破,这一变革的核心在于生成式AI通过大规模的预训练,实现了人类经验的向量化。所谓“人类经验的向量化”是指这样一种过程,即将复杂多变的人类经验转化为数学向量表示,以便机器学习模型进行处理。这一过程构建了一种新型数据形态,与传统数据结构存在显著区别。在数字化时代,我们面临处理来自书籍、文章、社交媒体帖子、音乐、电影等多种来源的海量信息的挑战。这些信息源汇聚了人类文化、历史和情感的丰富经验。生成式AI通过将这些负载人类经验海量信息的非结构化数据转化为数学向量,实现了对这些经验信息的深层次理解和处理。尽管生成式AI的预训练模型在执行时仍依赖于向量算法,但这些向量空间实际上是人类社会历史文化的经验图式的反映。算法本身也是为了解决特定任务而设计的步骤和环节,它们在一定程度上模仿了人类行为。因此,生成式AI所依赖的数据和算法并非简单的数字、符号或公式,而是对人类世界及其行为方式的一种模拟。

  

生成式AI实现的这一变革使得这种模拟更加自动化和智能化,这种向量化的预训练模型不仅增强了生成式AI对数据的理解能力,而且为其生成新知识提供了可能性,因此在数据处理和分析领域具有革命性的意义。预训练模型通过学习大量的文本数据,能够捕捉到语言的深层结构和语义关系,从而在没有明确编程指令的情况下,生成连贯且具有逻辑性的内容(文本、图像、视频、代码等)。生成式AI利用预训练模型,能够将这些多元信息编码为数字向量,从而显著提升数据处理的效率和准确性,为机器学习算法的应用提供了新的视野。传统的AI工具主要依赖预先编程的规则和算法来执行特定任务。然而,自Transformer架构的预训练模型问世以来,人工智能在处理语言和知识方面的能力获得了显著提升。这一机器学习过程涉及多种学习和优化策略,包括但不限于监督学习、无监督学习、半监督学习、强化学习以及深度学习等。这些策略的综合运用,使得人工智能在处理复杂任务时能够展现出更高的准确性和效率。

  

通过这些策略,生成式AI不仅能够模拟人类的思维模式,还能够进行更为复杂的创造性思考。因此,生成式AI的角色已经从单一的任务执行工具转变为一个能够生成具有学术价值和文化意义新知识的系统。这一转变不仅提高了数据处理的效率,而且拓展了AI在人文学科研究中的应用范围,为人文学科的研究提供了新的分析工具和方法论,为探索人类经验的新领域奠定了基础。从知识论角度出发,生成式AI如ChatGPT等已初步展现出知识生产的潜能。这些AI工具不仅仅是文本、图像、视频或代码的生成工具,而且作为一种全新的知识生产方式,逐步改变着我们对知识获取和创造的认知。

  

首先,生成式AI凭借先进的模式识别技术,能够从庞大的数据集中提炼出有价值的信息。这种技术让模型能够迅速捕捉到语言的规律和模式,并据此生成符合语法和语义规则的文本。通过训练模型来识别和理解人类语言的复杂结构与语义关系,生成式AI能够生成高质量的文本内容。这不仅仅是简单地模仿人类语言,而是能够深入理解语言的内涵和逻辑,从而生成更加准确、流畅的文本。值得一提的是,生成式AI在提升生成内容质量的同时,可以实现所生成内容形式与风格的多样性和创新性。如采取“风格迁移”技术,能够实现将某个类型的风格特征迁移到另一幅作品当中;或者通过学习某位知名作家的创作风格来创造新的作品。现在,生成式AI已经可以通过训练来辨识和分析诗歌作品,从中提取出诗歌的结构、韵律、意象和主题等核心要素,逐步理解诗歌的内在逻辑和美学标准,甚至创造出看似“新的”“原创性”的诗歌作品。

  

其次,生成式AI拥有较强的信息重组能力,通过整合与重组来自不同源头、具备不同结构的信息,能够产生独特且全新的文本内容。这种功能在知识生产中具有显著作用,为我们提供了丰富多元的知识来源。这与文学理论中的“互文性”概念相契合,生成式AI通过信息重组,构建了一个相互交织、相互影响的文本网络。借助其预训练模型,我们能够洞察不同作家、作品及文学现象间的深层关联,并从多种视角激发“互文性”关系,从而实现对作家、作品或文学现象的全新理解。如在《阅读〈全唐诗〉:文学史、主题模型、散度度量》一文中,作者使用主题模型来发掘《全唐诗》中的语义模式,通过计算文本之间的散度,来量化不同诗歌之间的主题相似性,进而发现“帝国与君权”“有限的生命、饮食”“军事、军队”等主题在不同诗歌中的分布;通过机器阅读与人类阅读相结合的方式,可以探索文学史中的“无意识世界”,即那些在传统阅读中可能会被忽视的文本。又如一项有关早期电影的研究,作者应用snoopy算法对老电影语料库进行检索,分析电影技术进步与人群图像的关系。研究者可以利用生成式AI的信息重组能力,对大量文学文本进行深度分析和整合。通过信息重组,生成式AI可以生成全新的文本内容,这些内容反映了不同文学作品之间的相互关联和渗透;生成式AI还可以通过向量化方式,将人类经验转化为可计算的数据形式,帮助研究者建立不同作家、作品或文学现象之间的关联。进而,研究者可以通过选择不同角度来“激发”这些关联,以获得对问题的全新理解。这说明,生成式AI具有探索未知世界和不可能问题的潜能,关键在于用户能否提出问题,激发生成式AI进行信息重组。

  

最后,生成式AI还有预测推断及语言生成能力。ChatGPT之所以被命名为“GPT”,正源于其核心技术特点——Generative Pre-trained Transformer,即“生成式预训练转换器”,涵盖了生成、预训练和转换三大核心要素。通过对大量数据的分析和学习,生成式AI能预测未来的趋势和发展方向,从而为我们提供前瞻性的知识和见解。同时,生成式AI还能根据用户的需求和语境,生成符合要求的文本内容,为用户提供个性化知识服务。当前的生成式AI可谓“百模大战”,其竞争的焦点正在于内容生成能力。无论是“文生文”还是“文生图”,或是“文生代码”“文生视频”,生成式AI的多模态理解及相互转换生成的能力成为制胜的法宝。尽管AI生成艺术的“生成”究竟仅仅是“generative”(生成,生产)还是也可能包含“becoming”(生成,成为)的内涵这个问题尚无定论,其内容生成能力也有待进一步提升,但其中所具有的知识创新潜能已经是毋庸置疑的了。生成式AI的这种预测推断及内容生成能力正在被应用于文化创意产业实践,其中最典型的例子来自网飞(Netflix)。网飞从邮寄出租DVD的小公司起家,后转型成为一家网络流媒体公司。早在2006年,网飞就设立了一项电影推荐系统大赛,并在三年后成功奖励了一套准确率被提升了10%的算法。随后,网飞不断更新,发展出“有3300万个不同版本的Netflix”的实时机器学习(real-time machine learning)的个性化推荐系统。2023年,网飞开始招募AI产品经理,希望用AI打造优质内容。在当前文化创意产业的内容生产中,无论是网络文学还是新闻写作,无论是小红书爽文、卡通动漫还是抖音短视频,生成式AI都能以“文生文”“文生图”“文生视频”“图生视频”“文生代码”等方式加以实现。

  

在生成式AI获得重大突破之后,AI赋能科学研究从事知识生产的问题已被提上议事日程。正如萨比娜·莱昂内利(Sabina Leonelli)所说:“大数据的可用性,以及获取、集成和分析大数据的复杂方式,正在促使知识生产所涉及的方法和推理过程发生革命性变化。”作为一种崭新的科学研究模式,“AI for Science”(人工智能驱动的科学研究)正在致力于AI工具提升科学研究的效能。其一,从学术研究最基础的环节“文献综述”来看,生成式AI正在变革科研人员的文献阅读方式,使他们能够自动化地处理和理解海量的科学文献,快速有效地从科学数据和文献中提取关键信息与知识点,进而提升科学研究的效率和质量。生成式AI的图像阅读能力也使得过去难以被直观解读的文本的分析成为可能,为科学研究提供了新的数据来源和解析途径。2023年,肯塔基大学发起一场名为“维苏威挑战”(Vesuvius Challenge)的比赛,鼓励大家利用AI技术破解因维苏威火山爆发而被烧成灰烬的残损经卷上的文字。最终三名学生成功破解了2000个希腊文字,获得大奖。其二,生成式AI在数据分析实验方面展现出明显的优势。它能够提升软件的信噪比,优化探针的选择性,从而使实验数据的分析更加精确和高效。基于AI的算法还能够显著提升科学建模的效能等。其三,生成式AI在改进实验方式方面展现出巨大的潜力,不仅能够提供新的实验设计,还能提供更为精确和高效的实验表征算法,甚至推动科学软件开发方式的发展和新型实验设备的研发,为科学实验的进步提供有力支持。从这些具体实践来看,AI主要作为工具和手段赋能科学研究。虽然这些生成式AI技术往往被视为提供“答案”的工具,而非真正的“理解”,但不可忽视的是,只要这些答案具有足够的可信度,它们仍然能够为科学的进步提供重要的启示。

  

如孙凝晖所言,当前的智能计算已经发展到第四个阶段,即大模型计算系统(2020年)的阶段,大模型正在逐步实现与人类价值观的对齐;正是在这个阶段,“AI4R(AI for Research)成为科学发现与技术发明的主要范式”。从AI for Science到AI for Social Science(人工智能驱动的社会科学研究),再到AI for Humanities(人工智能驱动的人文学科)的提出,AI人文作为一种全新工具和方法,越来越多地应用于人文研究领域,其潜能正在被不断地激发。从而,生成式AI便具有了帮助人类利用知识表征建构知识体系、通过数据建模实现知识预见、采用模拟仿真提供决策参考的能力。


 

人机互动:“需要人的AI”与“拥有AI的人文”

 

尽管生成式AI已能够实现对人类知识生产能力的模拟,甚至是部分环节的替代,但我们也不能过分高估生成式AI的知识生产潜能。这里有三个非常重要的判断需要被谨慎提出。其一,生成式AI所产生的文本、图像、视频及代码,虽已具备人类知识的基本形态,然而它们是否拥有柏拉图所阐述的“经证实的真实信仰”(justified true belief)的知识属性,仍是一个待解的问题。生成式AI所生成的内容尚未获得“确证”,也未必能成为“真信念”。其二,生成式AI的内容生成虽然强大,但仍然无法涵盖人类知识的全部形式。深层次的理解和洞察、道德与价值判断、经验性知识、默会知识等,目前仍是生成式AI无法企及的领域。最重要的是其三,生成式AI尚不具有真正的批判性思维能力。虽然生成式AI可以分析信息、识别模式、生成假设和推论,看似与批判性思维相似,但其缺乏“元认识能力”,即对自己的认知过程缺乏认识和理解,无法对自己的思考过程进行反思和评估,因此也就无法像人类一样进行主观体验,无法适应不同的情境。

  

正因为当前生成式AI尚不具备独立从事知识生产的能力,才真正需要人类发挥主观能力和创新创造能力,以人机互动、辅助生成的方式,开展AI赋能的知识生产活动。在这一时代背景下,探讨“需要人的AI”和“拥有AI的人文”以及两者之间的关联,已不仅局限于科技领域,更成为一个值得深入探讨的文化议题。

  

所谓“需要人的AI”,是指无论AI的自动化程度、智能化水平有多高,都无法产生自我意识,因而也缺乏像人类一样的主观能动性。而“拥有AI的人文”是指,面对知识爆炸的信息革命,人类仅依靠个人头脑之学习、记忆和思考能力已经远远不够用了。庄子云:“吾生也有涯,而知也无涯。”(《庄子·内篇·养生主》)这里的“知识边界”至少有两个层次:一是个人所拥有的知识边界,二是人类所拥有的知识边界。有许多个人所未知的,其实早有前人已知;只有人类所无知的,才算是真正未知的知识领域。在AI这类数字技术赋能之前,个人只能通过读万卷书、行万里路来获取“新知”(这里的“新知”其实只是个人所未知的人类已有知识),拓宽个人的知识边界,进而探索人类未知的知识领域。在AI赋能之后,人类的知识通过预训练成为向量化的模型被人类以任何方式调用,现实世界也可以通过模拟仿真技术反复演练、作出预测,以提供决策的参考。

  

AI人文的核心在于人机互动,探索AI在人文领域的深度应用。尽管AI技术日新月异、发展迅速,但AI人文并非简单的AI自动生成,而是需要人类的积极参与、精心指导和严密监督,以实现自动化和智能化的过程。从技术的角度来看,人机互动涉及多个方面,如人机交互界面设计、语音识别与合成、自然语言处理等。随着技术的持续革新与发展,人工智能已能更精准地洞悉人类的需求与情感,进而为用户提供更为个性化和智能化的服务体验。尽管AI的自动化、智能化程度不断提升,但AI仍然需要人类的参与、指导和监督。人类需要为AI提供数据、设定规则、监督执行,以确保AI的发展符合人类的价值观和道德标准。

  

在AI人文领域,“人”依然居于核心地位并发挥支配作用。人文研究中的诸多要素与环节具有非重复性、非流程化及超常规性等特点,这些特点使得人文研究需要依赖于人的主观判断与创造性思考。人文研究的对象是活生生的人以及由其所组成的人类社会中的复杂的精神活动。无论是作为主体的人还是由这些人的行为所共同构成的事件,都具有非重复性特点;无论是文学还是历史事件,也都是独一无二的。因此,尽管我们可以通过大数据、海量数据,甚至是“人类经验的向量化”的方式算出其“均值”,求出其“最优解”,但都无法彻底实现对某一特定的人物、作品或历史事件的最终解释。正因为如此,“说不尽的莎士比亚”的观点才是人文研究意义阐释生生不息的真实写照。即使AI可以辅助处理大量的数据和信息,但在理解作品的深层含义、把握作者的创作意图等方面,仍需要依赖于人的主观判断与创造性思考。与自然科学研究所追求的实验的可重复性、可验证性不同,人文研究往往没有固定的研究方法和步骤,而是需要根据具体的研究对象和问题灵活调整研究策略,甚至存在依靠人的经验、直觉以及灵感来实现的方式。这种灵活性要求研究者具备深厚的学科素养和敏锐的洞察力,以便在复杂多变的人文现象中捕捉到有价值的信息和线索。这也使得人文研究具有了某种超常规性的特点,要求研究者在面对某些问题时要敢于突破常规思维模式,进行创新性思考。因此,在未来的AI人文研究中,我们应更加注重人的作用和价值,发挥人的主观能动性,推动人文研究深入发展。



结 语


随着AI技术的升级迭代,算法黑箱、算法偏见、AI幻觉(hallucination),以及可能的AI自我意识的觉醒等问题逐渐浮现。所谓算法黑箱,是指算法系统在使用过程中出现的无法公开或无法深度了解其内部逻辑和计算过程的现象。它就像一个神秘的黑箱,人们只能看到输入和输出,却无法了解具体的生成过程。算法偏见描述的是算法在处理和分析数据过程中,因各种因素引发的非客观和非公正偏向,这种偏向有可能误导信息判断、引发决策失误,甚至可能加剧社会的不公平现象。而AI幻觉则是指在AI生成文本或其他类型输出时,出现与现实世界事实相悖、与用户输入不符或无法通过现有信息验证的内容。这使得生成式AI经常表现出“正确的废话”的平庸,甚至“很容易提供明显自信的捏造信息”。这种现象可视为AI模型的一种错误,它们可能会自信地捏造事实,并将这些虚构的事实融入多个段落的连贯性和一致性中,从而误导用户。关于AI自我意识的觉醒这一可能性,虽然目前尚未有明确证据表明AI能够拥有真正的自我意识,但这仍然是一个值得关注和研究的问题。如果AI真的拥有了自我意识,那么它将成为一个全新的存在,对人类社会产生深远的影响。因此,我们需要认真思考和探讨这一问题,为未来的AI发展做好充分准备。这些经由AI技术的出现而产生的问题,需要在人类的主导下逐步获得解决。所有这些也内在于AI人文之中,成为其技术不断升级迭代的强大动力。

  

总之,AI人文是一个充满挑战和机遇的领域。作为人文学科研究的前沿领域之一,AI人文将见证更高级的自然语言处理能力、更精细的情感分析技术,以及更复杂的机器学习模型,其应用场景也将从传统的文本分析拓展到多媒态的内容生成与分析等。而且,AI人文将面临更复杂的伦理、社会和技术方面的挑战。所有这一切,正是值得人文社会科学研究学者密切关注并且积极实践的领域。

 

  〔责任编辑:廖先慧〕

为适应微信阅读,略去注释

原文见于《东南学术》

2024年第4期

文中图片均来自网络


  为进一步规范稿件采编流程,提高编辑部工作效率,东南学术杂志社和中国知网合作,正式启用线上采编系统,热诚欢迎各位专家学者赐稿支持。《东南学术》唯一线上采编系统的网址为http://dnxsh.cbpt.cnki.net,作者可在网站的“作者投稿系统”中注册账号,进行网上投稿,跟踪稿件处理结果。即日起,原投稿邮箱不再接受投稿。    《东南学术》一向坚持严格的学术标准和学术规范,从不以任何名义向作者收取费用,凡要求作者缴纳诸如审稿费、版面费的,均系假冒我刊的诈骗行为;任何非dnxsh.cbpt.cnki.net的所谓“官方投稿网站”,均系假冒网站。敬请广大读者与作者注意。    《东南学术》是福建省社会科学界联合会主管主办的综合性社科学术理论刊物,是第五届中国出版政府奖提名奖期刊、全国重点期刊、国家社科基金资助期刊、中文社会科学引文索引(CSSCI)来源期刊、全国中文核心期刊、中国人文社会科学期刊AMI综合评价(A刊)核心期刊、复印报刊资料重要转载来源期刊、华东地区优秀期刊和福建省十大名刊名社。多年来,《东南学术》平均影响因子进入全国综合性社科学术期刊前列,发文在《新华文摘》《中国社会科学文摘》等全国性重要文科学术文摘刊物上的转载率均居福建省综合性社科学术期刊前列。


本微信公众号系《东南学术》杂志官方微信,如无特殊说明,本微信内容均来自《东南学术》杂志,版权所有。



微信号 : dnxs0591

● 扫码关注我们 ●

刘浩林|中国式现代化文化主体性构建的必然逻辑与实践路向

2024-07-31

任保平 豆渊博|以人的现代化为核心的人才强国战略及其政策创新

2024-07-30

张占斌|以发展新质生产力推进中国式现代化

2024-07-29

《东南学术》2024年第4期目录

2024-07-26

继续滑动看下一个
东南学术
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存