查看原文
其他

工程落地实践|基于 ChatGLM2-6B + LangChain 搭建专属知识库初步完成

黄勇 技术人生黄勇 2023-12-23

 经过前期的探索和准备,我们终于迈出了第一步:使用 ChatGPT 和 LangChain这些强大的工具,初步完成了专属知识库的搭建。


01


继昨天部署 ChatGLM2-6B 成功后,工程落地实践|国产大模型 ChatGLM2-6B 阿里云上部署成功,今天继续向“专属知识库”的目标前进。


在成功部署 ChatGPT 模型的基础上,用咱们国产的大模型 ChatGLM ,以及 LangChain 开源框架搭建“个人专属知识库”。


LangChain:是现在最流行围绕大语言模型构建的框架,可用于聊天机器人、生成式问答 (GQA)、摘要等。‍‍‍‍


朋友们可以上传自己感兴趣的文章、资料到这个知识库中。之后,大模型就可以根据这些个人资料,利用其强大的推理能力,回答朋友们提出的相关问题。


例如:收集某位喜欢的公众号或博主的文章,上传到自己的知识库。当您对这些内容有任何疑问时,知识库就可以为您提供解答。这就像拥有一个私人的、基于自身兴趣的问答专家。


因为之前经历过一次次踩坑填坑的过程,这次搭建过程还算顺利,没过多久,Web 界面就成功启动了。




02


  1. 系统支持直接和大模型聊天对话,和知识库对话。

  2. 支持切换后面支持的大模型:ChatGLM,Chatyuan,Vicuna,Bloom,Baichuan,Ggml,FastChat,OpenAI-ChatGPT。

  3. 和知识库对话需要新建知识库(不支持中文名字知识库名),再上传知识文件/文件夹,等待后台将知识文件的内容向量化后,就可以向知识库提问。


您已进入知识库测试模式,您输入的任何对话内容都将用于进行知识库查询,并仅输出知识库匹配出的内容及相似度分值和及输入的文本源路径,查询的内容并不会进入模型查询。

知识相关度 Score 经测试,建议设置为 500 或更低,具体设置情况请结合实际使用调整。3. 使用"添加单条数据"添加文本至知识库时,内容如未分段,则内容越多越会稀释各查询内容与之关联的score阈值。

单条内容长度建议设置在100-150左右。

用一个问题试试知识库:


往期热门文章推荐:


又一家顶级的大模型开源商用了!Meta(Facebook)的 Llama 2 搅动大模型混战的格局


Claude 2 解读 ChatGPT 4 的技术秘密:细节:参数数量、架构、基础设施、训练数据集、成本


AI人工智能大模型失守!ChatGPT、BARD、BING、Claude 相继被"提示攻击"攻陷!


为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(二)


拥抱未来,学习 AI 技能!关注我,免费领取 AI 学习资源。





继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存