企业级AI应用开发平台-毕昇(必胜)
最近有一款开源的知识库问答系统毕昇,初步了解下来,这跟我之前设想的AI能力接入平台很像,非常适合企业级AI应用开发。试用了一下,设计上有很多亮点,很是惊艳, 代码中也有不少缺点, 但瑕不掩玉。总的来说,值得关注,未来可期。
Bisheng是什么?
https://github.com/dataelement/bisheng
Bisheng是一款领先的开源大模型应用开发平台,赋能和加速大模型应用开发落地,帮助用户以最佳体验进入下一代应用开发模式。“毕昇”是活字印刷术的发明人,活字印刷术为人类知识的传递起到了巨大的推动作用。我们希望“毕昇”同样能够为智能应用的广泛落地提供有力的支撑。欢迎大家一道参与。Bisheng 基于 Apache 2.0 License 协议发布,于 2023 年 8 月底正式开源。
说它是一款知识库问答平台,是因为就目前来说,这类平台最大的应用场景也就是知识库问答相关的了。但这样说可能有点低估了它,它支持Agent编排,外部工具调用,会在大语言模型应用落地应用开发上,有更多的想象空间。
设计亮点
从菜单中来一个个说。
模型管理
相比于OneAPI是统一管理LLM 服务接口,Bisheng的模型管理则是设计为统一管理私有化部署的大模型。两者有异曲同工的效果,但模型管理可以做得更多,特别是在企业级应用场景下(私有模型部署)。模型的配置,资源分配,启停等,真的可以做成LLMOps。要使用模型管理功能,对应要安装 Bisheng-RT服务, RT是runtime的缩写。我开始以为是Router呢, 了解后发现Router可以在技能中编排Agent来实现。
知识管理
也就是知识库,无非就是上传文档,分隔文档,计算向量并储存。但其实这里面每一步都值得去实验和探索更好的方案。Bisheng默认支持Milvus向量储存,方便伸缩扩容,适应于企业级应用。Bisheng还加了Elasticsearch,让向量检索与关键字检查结合起来,对于搜索内容的准确度有很大提升。
技能管理
Bisheng提供的技能建立在Langchain之上,所谓技能,也就是各种不同的Chain和节点组合,在FastGPT(另一个知识库应用平台)里是包含在应用的编排流程中。而Bisheng将它剥离出来,作为技能,可以在不同的应用中复用。有做QA的技能, 写报告技能,总结技能,提取结构化信息技能等。官方也整了个技能市场,有兴趣的话去添加一个分析舆情择时选股的技能,哈哈。
应用管理
创建一个应用,可预定义流程,每个流程涉及到不同的技能。比如合同审核,预定义审核的问题,比如
在合同审核场景中,有很多不同的审核维度,我们选取三个具有代表性的问题:
合同中约定了有关知识产权的权属条款吗?是否存在类问题 合同中首尾部主体名称一致吗?一致性校验 合同中违约金利率的设置是否符合规范?要求以合同签订当月中国人民银行授权全国银行间同业拆借中心公布的一年期贷款市场报价利率(LPR)标准为基础,不能超过LPR的150%。涉及逻辑推理的复杂判断问题
而每一步又涉及不同的技能。通过串联起流程和技能,就形成一个应用。这是把工作拆分得明明白白的啊。
改进建议
百闻不如一用。试用下来,我觉得有以下可以改进的地方。
安装步骤能否更简单点?
我知道,企业级的应用一般部署都比较繁琐。但现在不是开源了嘛,目的就是让更多的人接触它,了解它,喜欢它嘛。所以,接触它的第一次感觉很关键的。准备一个简化版本,让人很快就能部署出来体验一下,认清它的真正魅力,对扩大bisheng影响力很重要。比如准备个all in one的docker-compose.yml,向量数据库换个更轻量的, 准备个直接可用的config.json,里面的什么内网IP等都可以写shell的方式解决,目的就是我在一台正常的机器上,一条命令就可以跑起来体验,那真的很香。调试有难度
组件模块有那么多,日志到处切换着看,确实麻烦。这个可能不是产品本身的重点,只能说尽量用到灵活且清晰的配置,支持热部署会方便一些。发布版本不够稳定
比如我在使用中就发现当前最新版本中知识库不支持中文,创建技能时出错, 每一个细小的问题,都会让首次尝试的人打退堂鼓。建议发布的版本还是要尽可能的多测试,DevOps造LLMOps。或者建立FAQ 知识库,在群里整个机器人来问答,对广大用户(开发者)来说,体验不错的。FAQ KB也可以让机器人(AI)来整理添加撒。推出拳头技能
我认为技能市场应该是bisheng的核心。用户自己开发可以,但如果有现成的,拿来就用,企业客户肯定是愿意花钱的。我们在企业内要落地一个新应用,都会考虑是采购还是自研,最主要的考量就是成本。Bisheng团队应该是有自己的一些核心能力和优势的。包装一下,或者结合自己的特有服务推出优秀的技能,也会牢牢吸引住用户。