查看原文
其他

2023计算机前沿技术研究生创新示范课程精彩回顾VI

罗思晓 | 陈天祥 深大计算机与软件学院
2024-09-16

11月04日,计算机前沿技术研究生创新示范课程之“智能系统”如期而至,浙江大学的陈刚教授与北京理工大学的袁野教授分别带来题为“领域大模型应用生态构建关键技术及平台”和“神经符号数据库技术及应用”的两节精彩内容。

学有所思、学有所悟、学有所得。让我们通过两位同学的Lecture Review再次走入课堂,近距离感受前沿科技的力量。


Lecture 11 陈刚教授

领域大模型应用生态构建关键技术及平台











学生

罗思晓

深感荣幸能够在计算机前沿技术课程中学习浙江大学陈刚教授《领域大模型应用生态构建关键技术及平台》的主题报告。陈教授向我们深入介绍了领域大模型应用生态构建的关键技术与系统,将人工智能技术与实际产业需求相结合,为我们呈现了一幅令人瞩目的发展蓝图。


陈教授首先阐释了什么是领域大模型。他指出,领域大模型将成为一个组织的核心竞争力,但现有AI大模型,如ChatGPT等,缺乏专业知识推理能力,同时还有数据泄露的风险,难以满足产业应用的需求。因此,一个拥有专业知识自然语言交互能力,可以精准定量解决专业问题能力,并且具有100%安全和所有权的领域大模型成为迫切的需求。而构建面向行业场景的领域大模型面临能力、成本和算力三大挑战,因此需要研制面向产业应用的领域大模型构建平台,建设领域大模型应用生态,帮助企业低成本快速构建、私有化部署自身专属的领域大模型,推动产业智能化转型发展。


然后陈教授详细介绍了构建领域大模型的总体技术框架。他提出了多个技术方案,一是硬件平台,即需要构建兼容异构芯片的混合算力平台和自主研制高性能AI算力芯片;二是数据处理,其中建构领域大模型需要处理的数据形态有三类,包括自然语言、多模态和结构化数据,而处理数据还需要有各种大模型作为模型层,为领域大模型生态提供底座支撑;三是研制工具链,为构建领域大模型应用生态提供平台支撑;四是构建应用生态,推动物流、医疗等领域的智能化转型发展;五是安全保障,包括算法可解释性、内生安全性以及使用安全性三个方面的考量。


陈教授还分享了其团队的一些进展,包括TableGPT和启真医学大模型。其中TableGPT是针对现有语言预训练大模型无法直接处理结构化数据的问题研发出的一款结构化数据大模型,该模型具有基本数据操作,多轮数据分析,分析结果可视化,智能构建模型的功能。而启真医学大模型则是一个具备知识问答,文档解析,病例生成,检查报告解读,科研助手,医嘱助手功能的面向临床医疗的领域大模型,该模型在多项医学相关任务上的效果均优于现有的模型。


最后,陈教授通过一系列生动的应用案例,包括银行贷款风控系统、智慧公交、新型抗菌化合物发现以及3D打印工艺参数优化等,生动展示了领域大模型在实际产业中的广泛应用前景。


陈刚教授的精彩演讲使我获益颇丰,拓展了我对领域大模型的认识,让我了解到大模型技术对各行各业都将产生深刻的变革,也让我对大模型技术与实际产业需求相结合的未来发展充满了信心。我相信,在不久的将来,我们可以迎来大模型技术应用的新篇章。



Lecture 12 袁野教授

神经符号数据库技术及应用











学生

陈天祥

近年来,大模型已经成为人工智能领域的一股重要趋势。随着计算能力的提升和数据集规模的扩大,研究者可以训练更加巨大的神经网络模型。神经符号数据库试图结合神经网络和符号逻辑,以实现智能数据库系统。在本次计算机前沿技术课程中,我们很幸运地听到了北京理工大学袁教授关于神经符号数据库技术的讲座。袁教授用浅显易懂的语言向我们介绍了这个激动人心的新兴技术。这场讲座内容丰富,观点精辟,为我们深入理解当前神经符号数据库技术的发展现状及应用提供了宝贵的机会。


讲座伊始,袁教授首先从应用背景出发,与我们分享了他的观点——以应用为导向,将能更好地推动相关学术研究的发展。以深度学习为代表,数据的价值在于它可以更好地驱动人工智能技术的发展,也可以说数据本身就是人工智能的基石。为了使同学们更清楚当今数据库面临的挑战,袁教授举了三个应用实例:视频数据分析、数据湖管理以及大模型应用。三个例子都指向了同一个问题:AI时代的大数据体量更大,类型更杂,尤其是如今信息化社会,非结构化数据增速极快,例如视频、图片等数据,分析难、管理难度大。面对极速增长的非结构化数据,袁教授提出要将非结构化数据通过AI转换成结构化数据,加上结构化数据的计算,完成计算机对非结构化数据的处理。面对上面提出的问题,袁教授为我们介绍神经符号数据库的层次架构。



神经符号数据库可分为三层。最上层为表达层,表达层包括结构化操作和AI模型,数据分析人员需编程调用AI模型,结合SQL进行实现非结构化数据分析。由于分析人员直接面向表达层,需要掌握AI技术,熟悉模型细节,实现难度较大。面对这一挑战,袁教授提出要实现基于自然语言实现AI模型调用,利用大语言模型实现自然语言到模型调用程序的转换。


中间层为计算层,主要作用是联合AI模型和SQL指令实现复杂数据分析操作。由于SQL与模型执行逻辑相互调用、SQL与模型执行结果相互等待,导致结果精度各异,计算资源各异,查询优化复杂。袁教授介绍计算层现状为统一Tensor化、统一SQL化、神经符号化计算,同时也提出他们的不足。针对上面的情况,袁教授提出要将神经符号协同计算,基于开销估计的执行计划构建,确保准确率与性能双目标优化。


最底层为存储层,用于存储模型库、结构化、半结构化和非结构化等多模态数据。该层的难点在于数据规模量大,数据访问延迟长。袁教授提出要进行多粒度数据分割存储,基于语义的数据压缩,非结构化数据的存储以编码后的形式进行存储,并需要降低冗余数据的存储规模以及查询分析的数据解压缩规模。


最后,袁教授进行了总结。神经符号数据库利用神经网络对数据进行表示学习,得到向量化的特征表示。然后基于这些学习到的特征,使用符号逻辑规则来查询数据库。查询会转换成对嵌入向量空间的操作,从而实现比传统数据库系统更智能化的查询。相比直观的神经网络检索方法,神经符号方法可以实现更加解释性强且鲁棒的查询。但也存在将神经网络表示有效融合到数据库框架中的挑战。未来的研究需要在表示学习、索引结构、查询优化等方面取得进一步进展。



精品课程

扫码访问课程主页

学院官网开辟了“精品课程”栏目,第一时间发布课程资讯、学习动态和优秀学生作品。


欢迎全院老师积极联系加入,在官网分享传递自己的课程主页。


https://csse.szu.edu.cn/pages/courses

继续滑动看下一个
深大计算机与软件学院
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存