打造可信专业高效应用，追一“博文”大模型助力金融政务智能化

一小博大追一科技 2023-08-31

收录于合集 #大模型 4个

AI大时代，短短几个月，大模型就狂风席卷。

据不完全统计，目前国内号称投入大模型的厂商有30多家之多，市场拥堵。不同行业、不同体量、各种规模、不同层次的大模型争流而上，各种版本让人眼花缭乱。对于企业级市场而言，大模型距离落地是“一步之遥”，或者是“万水千山？” 面对细分复杂的场景，如何在经济、可信、高效的基准上，与客户一起共创大模型，让数字化转型再上新台阶？

基于多年的NLP技术积累与行业实践，面向客户洞察和需求，追一科技全面拥抱大模型技术，自主研发“博文”领域大模型，现有AI数字员工产品矩阵也将陆续整合大模型技术和能力，进化升级，提升效能，更好助力金融、政务等领域客户数字化、智能化升级。我们将适时推出大模型的进展突破，同时也期待与更多客户和合作伙伴一起，共创合作、打磨场景应用，加快推进大模型成熟落地。

AI大模型落地的三大挑战

1、安全

不管什么样的技术创新应用，安全都是一道红线。从宏观层面“安全发展”到企业自身数据安全、用户隐私保护、合规信创的角度，都需要考量安全挑战。ChatGPT火爆全球，出于数据跨境监管要求和国家层面数据主权安全风险考虑，政务、金融等行业不适合在业务中直接接入ChatGPT模型。从技术自主与信息安全的双重角度来看，国产大模型独立自主发展均具有必要性。

2、性价比

大模型的落地和商业应用，需要考虑成本的经济性。庞大的数据、算力和研发投入成本，而场景、收益的相对不确定性，让大模型至少在短期阶段，还面临落地挑战。“大力出奇迹”、“暴力美学”在推高效果同时，效率也是必须关注的问题。特别是企业级市场，如何以更低成本和更高效方式，研发可精准解决垂直领域任务模型，将是一个新课题。

3、专业、可控

通过对话交互形式，ChatGPT大模型表现了极强的出圈、跨界、多任务能力。“一本正经地胡说八道”，放在一些消费级和通用场景无伤大雅，但在专业和垂直领域，如何确保“不翻车”？保证内容的确定性、专业化，真正解决用户问题？从信息“高速公路”到终端家门口，还需要弯弯绕绕一段路。

深入领域应用实践

追一“博文”大模型助力行业智能化

在多年的企业数字化服务实践基础上，追一科技紧贴安全、合规、信创等新时代智能化要求，推进创新AI技术能力应用，并不断探索智能化应用的新范式，构建以垂直领域大模型“博文”为核心的大模型平台能力，赋能人机对话交互和协同、分析等场景应用。在行业大模型解决方案上，锚定金融、政务领域，整合大模型能力引入到当前成熟的技术栈，提升产品效能，使客户实现“降本增效”，并赋能更多智能化应用场景。

相比通用大模型，追一自研领域大模型将拥有更垂直适用的任务能力，可适配具体行业业务场景中的任务，如金融、政务领域中的咨询服务、文案生成、专家决策等；在知识能力上，更有领域内纵深优势，且保证即时性。在应用方式上，支持私有化部署，对于金融、运营商等垂直行业的特定场景，保证数据安全的同时，还能更灵活地去应对业务场景。

咨询服务

为客户提供高质量的精准服务，优化流程性任务的体验，可根据客户交互信息、历史数据做出快速而准确的建议。例如，在金融行业的理财咨询中，根据历史数据与客户风险偏好，为客户提供金融产品或定制化个人理财建议。政务场景中，各地相关政策具有多样性，基于大模型能力，可根据与居民/企业的交流内容，快速判定并精准适配最新政策，实现高效便民服务。

辅助生成

可根据公开市场信息及实时数据，辅助相关文案的生成。在金融领域中，可根据公开市场信息及实时数据生成时效性报告（如财经新闻、金融市场报告）与分析类报告（投研分析报告）等。在政务领域中，生成如指挥类、通联类、公布类、记录类、报请类等规范性公文以及如工作报告、简报、书信、启事类等非规范性事务公文。

专家系统

根据相关政策法规，以及与用户对话信息做出专业、准确的判断与决策。例如，在保险理赔中，通过与客户的对话快速识别问题，了解损失详细情况，更快处理理赔请求。在信贷投保审批过程中，协助银行分析借款人的信用状况和还款能力，协助保险公司分析投保人资格和匹配险种。在舆情监控方面，对相关舆情数据自动化处理和分析，为政策制定提供科学依据；在警务处理上，可对报警信息进行快速识别、判断，提高决策与出警效率。

而随着大模型的落地，除了现有AI机器人场景的升级提效外，未来将有更多场景解锁。

深耕NLP，技术攻关极致创新

大模型的创新，离不开坚实的AI技术底座。

追一科技作为深耕NLP多年的佼佼者，在发展中一直紧密追踪学术前沿，保持预判并率先布局前沿技术。在自然语言预训练模型方面，先后研发了Simbert、T5-Pegasus中文模型、RoFormerV2等创新模型。自研Roformer模型中的旋转位置编码RoPE技术被Google、Meta、腾讯等大厂大模型采用，成为大模型的标配位置编码方式之一。

团队还致力于通过工程化能力，实现资源、效率、效果平衡与最优解，挖掘模型参数与训练数据量平衡点同时保证模型涌现能力，为大语言模型研发提供保障。自研bert4keras框架，适配数十个中文开源模型，在中文NLP圈应用。自研Tiger优化器，在训练阶段将显存优化到极致，降低训练成本。

在领域大模型的构建中，追一科技研发团队采用生成式预训练+强化学习算法，将所有任务统一转换为文本生成任务，通过采用「领域数据」预训练+Prompt 数据微调和基于RLEF「领域专家反馈」强化学习(Reinforcement Learning from Expert Feedback)，搭建垂直领域大模型。

同时，以垂直领域大模型作为核心，以其它专有模型辅助，共同支持需求，并通过知识外引与注入，如搜索、推荐、查询等知识工具，结合知识整合模块，整合各类垂类知识，形成一套安全可控且高度适配下游业务逻辑的完整AI系统，为客户提供高效、高质的解决方案。

延伸阅读

更美好 AI 世界

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

13岁！史上最严重霸凌案宣判，如何亡羊补牢？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

打造可信专业高效应用，追一“博文”大模型助力金融政务智能化

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

13岁！史上最严重霸凌案宣判，如何亡羊补牢？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

生成图片，分享到微信朋友圈

打造可信专业高效应用，追一“博文”大模型助力金融政务智能化

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡