查看原文
其他

大模型行业应用加速落地,助智慧办公“再进化” | 星科技•专精特新“小巨人”

联想之星 2023-10-20


前沿科技

 国家级

专精特新

“小巨人”




智慧办公能够帮助企业实现办公信息化、网络化、数字化、智能化,具有成本更低、效率与安全性更高的特点。随着AI、5G、物联网、云计算等新技术的快速发展,智慧办公正进入⼀个崭新的时代。今年以来,“大模型”持续火热,也为智慧办公赛道注入了新的动能。


01

智慧办公需求持续扩大升级


根据“洞见研报”的《智慧办公研究报告》,随着AI、5G、物联网、云计算等新技术的快速发展,智慧办公正进入⼀个崭新的时代,许多硬件以及互联网企业纷纷进军智慧办公赛道。


智慧办公是指⼀种利用云计算、物联网、智能感知、移动互联等手段对办公业务所需的软硬件设备及环境进行智能化管理,实现企业应用软件统⼀部署与交付的新型办公模式。


智慧办公能够帮助企业实现信息流、资金流、物流、业务工作流的高度集成与融合,实现办公信息化、网络化、数字化、智能化。与传统办公相比,智慧办公具有成本更低、效率与安全性更高的优点。



按照智能化方向的分类方式划分,智慧办公可分为办公环境、业务场景、个人工作设备三大类。

其中,面向B端的业务场景类关注度最⾼,构成行业80%以上的市场规模,其次为同样面向B端的办公环境类,而个人工作设备类目前市场关注度最低。


在智慧办公需求持续扩大升级,行业不断发展的趋势下,智慧办公市场仍存在⼀些待解决的痛点,其中最具有代表性的有:1)行业服务无序化;2)研发设计能力欠缺;3)平台管理水平不⼀;4)供应链整合度低。在行业朝高度智能化方向蓬勃发展的同时,智慧办公领域内的企业以及行业相关监管机构也需持续破解这些痛点,助力行业不断升级。

02

“大模型”背景下的智能文本处理


今年以来,“大模型”持续火热,对智慧办公赛道的企业也带来了新的启发。

36氪在采访相关企业后发现,大模型并不是万能的,客户要的是最终效果。那么让大模型在适当场景中,适时地发挥其出色的语义理解和学习能力是否就成了关键?

实际上,从36氪上半年观察到的现象来看,正按照上述思路实践的AI应用厂商不在少数。

总的来说,无论是新涌现的创业公司,还是已有产品和市场的在位者,切入AIGC赛道的方法大致可以分为两类:一是,通过大小模型协同、多个大模型API调用等方法,去大模型糟粕,取其精华;二是“借力打力”,利用大语言模型的能力解决特定领域的具体问题。

在2023年的WAIC世界人工智能大会分论坛上,专注于智能文本机器人的高科技企业达观数据推出了智能文本处理领域垂直大模型“曹植”

达观数据创始人、CEO陈运文向观众阐释了曹植采用的多模型并联(Ensemble)技术架构,即融合多个模型能力,将新一代LLM与以往的Bert模型、知识图谱,以及过去在NLP领域建立的业务规则引擎等相融合,并进一步借鉴复旦MOSS的插件思想,实现了多模型和多插件的融合。

达观数据对这一多模型融合思路做了形象比喻:如果把各类模型比作各种各样的武器,之前的Bert模型是冲锋枪,业务规则引擎是手枪,GPT(生成式预训练)模型是大炮。GPT威力是要强大很多,但并不表示以后打仗只需要用大炮,不用冲锋枪和手枪了。

陈运文告诉36氪:“每个模型都有自身的缺点。要完成复杂任务,需要在模型之间灵活的分工、协调。不同模型承担不同的职责,有的模型生成的文字通畅,有的解析文档表格能力强,有的则擅长解决数学一致性检查,有的还要画图,或做规则校验等。像知识图谱就能确保输出结果的准确性、专业性。”

最简单的例子是,在具体的专业报告写作中,通常需要边抽取边写作,也就是从A文档中抽取内容,融合一些内容、组织语言后,再写入到B文档中。其中,内容抽取是Bert模型比较擅长的,生成和润色则是GPT模型的拿手好戏,几种方法是相互融合的。

陈运文认为,客户其实并不在意用的是什么模型技术,关键还是看解决问题的最终效果,所以大小模型融合,甚至多个大模型并用是未来的发展趋势。因此,达观的Ensemble模型还设置了支持外接第三方模型的扩展功能。

03

助力金融行业智能文本处理


随着互联网的快速发展,客户获取信息的方式正在发生重大变化。越来越多的金融从业者倾向于通过搜索引擎来获取所需的相关信息。传统的金融机构在搜索引擎方面存在许多困难。

首先,金融产品信息复杂多变,传统的关键词匹配方式往往无法准确匹配用户意图。许多金融词汇具有专业性,如果直接匹配关键词,将返回大量无关结果。其次,金融机构自己的网站搜索功能较弱。网站内搜索只能匹配本站内容,无法提供全面的查询结果。最后,金融机构内容存在“信息孤岛”,重要内容分布在多个网站和系统上,搜索引擎难以整合。因此,金融机构在搜索领域面临着关键词匹配不准、站内搜索功能贫弱、信息分散等多重困难。

金融搜索中台是达观数据为券商投行、研究所、银行等领域B端或C端用户打造的金融搜索产品。对于金融领域的结构化数据,能够快速、高效、精准地获取搜索结果;对于非结构化数据,集成OCR、NLP、机器学习等技术, 对底稿、研报等非结构化信息进行多方面解析、抽取,能够搜索非结构化数据中的观点、图表等信息。全面支撑投行智能搜索、投研投顾搜索、证券APP搜索等多个金融领域搜索场景。

1、投行智能搜索

投行智能搜索打通投行业务中可能涉及到的所有数据,覆盖整个投行业务流程,分角色、分项目、全方位提升信息获取效率。其深度融入各关键业务流程,理解业务语义进行智能检索,大幅提升信息检索效率。它支持客户报告、交易记录、邮件等各类外部和内部文档的统一检索,让业务人员只需一个搜索窗口,即可寻找所有相关信息。同时,实现了从部门、小组到个人的精细权限控制,确保搜索结果完全符合投行的数据安全与隔离需要。


2、投研投顾搜索

投研投顾搜索基于OCR、NLP、GPT等技术对研报信息进行提取,能全面搜索研报图表、观点、数据,提高研报搜索的工作效率。能深度结合投研投顾业务搜索习惯,获取非结构化研报数据中的深度信息,实现非结构化信息的深度解析与搜索;融入了达观自研的“曹植”大语言模型,可以快速生成研报摘要、观点,辅助用户快速阅读定位关键信息,让研报阅读更加高效;并开发了投研数据搜索应用,能够快速进行信息检索、关联关系分析、风险评估判断、海量文档资讯管理、比对公司分析等。


3、证券APP搜索

搜索引擎可内嵌C端APP,支持结构化和非结构化数据语义级别的搜索,应对各类C端的搜索需求,提升用户搜索体验,提高APP日活和转化率。证券APP搜索内置拼音搜索、首拼搜索、拼音纠错、多音纠错等多个搜索处理模块,并且结合了达观自研的OCR、NLP等人工智能前沿技术对非结构化信息进行文字识别、版面解析、表格解析,从而实现内容深度搜索以及能深度理解用户搜索意图进行语义搜索。其能够实现资讯、研报、政策法规、视频、音频、图片等多类型信息检索。



参考来源

https://mp.weixin.qq.com/s/nnb_-FbWt_qojJCQvW2SIg

https://mp.weixin.qq.com/s/yPeW3ULrAsyjwbp2Oc_0mQ



END



相关阅读




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存