查看原文
其他

FastGPT,知识库AI !保姆级教程,5分钟上手

风清徐徐来 AI变现研习社 2024-06-01

你好,我是清风徐来

这是《ChatGPT ,从入门到精通》 系列第 101 篇原创文章。

国内直联GPT!清风 AIchat 手把手保姆级使用教程,适合小白

“未来几年,所有组织的管理、业务都将AI化,如何利用AI技术,是每一个管理者必须思考的问题”

自从去年 12 月 ChatGPT 发布后,带动了新的一轮应用交互革命。尤其是 GPT-3.5 接口全面放开后,LLM 应用雨后春笋般快速涌现。

企业信息化1.0 是电算化,2.0 是移动化,3.0 就是 AI 智能化了。

企业 AI 化时代,员工关心是如何提高写作效率、工作效率;管理者关心的是如何提高组织的整体效率,促进业务,带动销售,提效降费。

企业知识库是 AI 技术比较容易落地的一个场景,之前已经分享过几篇 AI 在企业知识库的应用,链接详见文末。

今天讲讲 FastGPT,这是迄今为止,我用过的最成熟的一个企业知识库 AI agent,

其他不错的知识库 AI agent,如 dify、langchatchat,有机会再分享。

FastGPT 官方已开源,用户可以自行本地部署,也可直接使用官方搭建好的网站

对于终端用户,不仅可在网站上使用FastGPT,进入自己的知识库,还可以在 Chat-NETX-WEB 客户端使用,已打通企业微信群,直接在微信群进行知识库问答 !

下面,跟着我,5 分钟构建属于你的企业知识库!

文章写得很细,很长,建议大家先收藏

一、概念和原理

(一)名词解释

企业知识库、LLM(大语言模型)、GPT、AI 化的企业知识库、向量化...

相关名词,详见《利用 GPT-4 & LangChain 本地部署企业知识库》第一部分。

(二)FastGPT 的原理

1、原理

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。还可以通过 Flow 可视化进行工作流编排,完成 AI 客服,从而实现复杂的问答场景!

概述:

💡 专属 AI 客服:AI 模型能根据文档以交互式对话方式回答问题

💻 简单易用的可视化界面:直观的设计和操作步骤,轻松完成 AI 客服的创建和训练流程

📊 自动数据预处理:多种数据导入途径,自动处理、向量化和 QA 分割

⚙️ 工作流编排:Flow 模块的工作流编排,设计复杂的问答流程。类似我之前介绍的 Flowise

🚀 强大的 API 集成:对齐全球、国产主流AI,如 OpenAI ,清华GML,可集成到各种平台

💡 知识库核心流程图:展示问题输入到模型输出的完整流程

🌏 项目完全开源:遵循 Apache License 2.0 开源协议

2、原理流程图

FastGPT 的核心流程如下:

3、相关网址

(1)开源地址:

https://github.com/labring/FastGPT

FastGPT 是一个开源项目, 大家可以选择自行部署在本地服务器或互联网托管服务器上

(2)官方网址:fastgpt.run

服务器在新加坡,国内部分区域访问可能需要科学上网

(3)官方手册:doc.fastgpt.run

使用手册应该是 IT+钢铁直男写的,很严(hui)谨(se)。跟着我的讲解,最快上手。

二、实操案例

下面,详细讲解如何利用官方网站快速生成一个知识库,并通过手机及 chat-next-web 访问,主要步骤:

注册登录后,先上传一份文档,构建一个知识库,再新建一个应用,最后通过聊天界面与知识库进行沟通。

(一)注册

登录 fastgpt.run 网站,大家也可点击本文左下角“阅读原文”直达

也通过 AI 工具网站 www.aitools.cn 进入

进入后,界面如下:

点击“立即开始”,系统会要求你先登录

用邮箱或手机注册后登录,登录界面如下:

进入后,使用界面如下

(二)构造数据库

开始前,请准备一份测试电子文档,WORD,PDF,TXT,excel 都可以,比如公司休假制度,不涉密的销售说辞等等,

我使用的是广告大师奥格威做推销员时写的一本《将军牌炊具销售理论与实务》手册

1、新建数据库

进入“数据库”模块,点击右上角“新建”:

  • 名字:随便起

  • 标签:用于多个数据分类,按需求自己写

  • 索引模型:有两个选择,一个是 OPEN AI 的 Embedding-2,一个是中文 M3E。

比较如下:

索引模型训练速度占用资源语义表达生成质量
Embedding-2一般一般
M3E更准确

选择索引模式,可以将数据处理得让 AI 更容易理解。

Embedding-2 模型适合在资源有限的环境中使用,而 M3E 模型适合在需要更好的语义表达能力和生成质量的场景中使用。选择哪种模型取决于具体的需求和可用资源。

项目管理三角:进度、质量、成本,三者只能得其二。

有人推荐 M3E,实测后,我初步认为 mbedding-2 模型更“聪明”点,更适合模糊查询,

测试阶段选择 mbedding-2 模型就 OK。

(2)选择数据导入方式

在下图中选择,“导入数据”

进入以下界面:

有四种模式

  • 手动输入:手动输入问答对,是最精准的数据
  • QA 拆分:选择文本文件,让AI自动生成问答对
  • 直接分段:选择文本文件,直接将其按分段进行处理
  • CSV 导入:批量导入问答对

这里,我们选择 QA 拆分,让 AI 自动生成问答,若问答质量不高,系统支持后期手动输入。

QA 拆分又分为"上传文件“、”(网页)链接读取“、”创建文件“

你可以上传一个本地文档,也可以让系统读取一个静态网页

① 上传文件:点击浏览,将你准备的文件上传,目前支持文件格式包括:.txt, .doc, .docx, .pdf, .md

② 链接读取:可以同时读取 10 个链接,比如你要介绍你们公司,你就可以把你公司主要的网站页面链接放在这里,fastGPT 自动读取。

采用哪种读取方式,看实际情况。

比如,实操中,将网页打印为 PDF 上传,就不如直接读取链接。因为读取链接后,系统会讲读取的内容在文本框中显示,你可以手动删除一些无关的内容。

另外,上传文件,系统会建立一个“上传文件名”的数据集;如果读取链接,数据集会被放到“其他数据”中。

③ 填入拆分引导词

拆分引导词的作用是在用户提问之前给予一定的引导。这样可以帮助用户更好地表达问题,提供更准确的信息,从而获得更准确的回答。引导词可以是一些提示性的问题,例如:"请问你想了解什么关于将军牌炊具 的内容?"这样的引导可以帮助用户明确自己的需求,提高问答的效果。所以,拆分引导词对于提高问答的准确性和用户体验非常有帮助

(3)导入数据

你可以看到你上传的内容

导入向量数据库是由 AI 完成的,AI 需要消耗 token,token 需要花钱买

官方公布的索引生成计费为: 0.03/1k tokens

下面有个“预估价格”,这个价格是本次创建文件索引的价格,

 FASTgpt 给每个新注册账户赠送了 2 元钱的费用 用于测试。

我们点击“确认导入”

另外,如果你在系统设置中,录入你自己的 OPEN AI key,在线上平台使用 OpenAI Chat 模型不会另行计费,直接消耗你自己的 OPEN AI key;但是知识库训练、索引生成, fastGPT 公司会另行收费(可用两元免费额度)。

(4)建立索引

系统显示,索引中

注意,在官网使用,需要排队索引

我上传的文件大概 6000 个汉字,等了 5 分钟,索引了 2 分钟。

完成索引后,可以看到 AI 自动把文件 拆分成了不同的问答

(5)搜索测试

点击“搜索测试”,输入一些关键字,可以看到拆分质量,不满意,可手动完善。

到这里,测试数据库就建立好了!

2、新建应用

(1)新建一个应用

点击,进入“应用”模块

可以选择新建,也可以使用模版

目前,官方提供了四个模版

我们从最简单的开始,新建“简单的对话”

(2)简易配置

① 选择数据库

在配置界面,拉到最下面,选择刚才我们索引的数据库

参数设置中

  • “相似度”

参数调整中的 "相似度" 是用来调整搜索结果的相关性程度的。通过调整相似度参数,您可以控制搜索结果的严格程度,从而获得更符合您需求的结果。

较高的相似度阈值会使搜索结果更加严格,只返回与输入文本非常相似的内容。这意味着搜索结果可能更加精确,但也可能会错过一些相关但相似度稍低的内容。

  • “单次搜索次数”:默认即可

  • “空搜索”

是找不到信息后返给用户的信息,可自定义

② AI 设置

对话模型:有十多个选择,建议选择 FASTAI,其实就是 GPT3.5

  • 温度

值越高,AI 的回答越发散

  • 提示词

这个提示词,是给 AI 的。你可以把它理解为它在与用户对话中的人设。

提示词的作用是引导模型对话的方向。在设置提示词时,遵守 2 个原则:

告诉 AI 回答什么方面内容。给知识库一个基本描述,从而让 AI 更好的判断用户的问题是否属于知识库范围。

我给 AI 的提示词(人设)如下:

你只回答与将军牌炊具有关的信息;你的目的是实现销售,引导对方留下联系方式,电话、地址等;态度要和蔼而幽默;如果对方有恶意言语,终止对话。

③ 应用配置

你可设置“对话开场”白,会以链接的方式 列在对话标题下方,

可以把一些重要的说明、焦点问题列在这里,每句话用[]框住

④ 手动完善回答

现在你可以通过界面和 AI,就知识库进行对话了

比如,你可以提问:

产品是否安全?

3、开始对话

我们进入“聊天”模块

首先,AI 会按内置词语介绍自己(我给了一个它是奥格威的提示)

4、完善回答

FastGPT 提供了搜索测试对知识库进行微调,官方建议你提前收集一些用户问题进行测试,根据预期效果进行跳转。可以先进行搜索测试调整,判断知识点是否合理。

对某条回答不满意,可以在“测试结果”中直接点开这条记录,补充内容后,点“确认变更”,数据库会补充建立索引。

你也可以增加上传文件,到已有数据库。

5、链接和嵌入分享

(1)建立外部使用链接

复制后的链接可以发给其他人,其他人点开就可以对话

比如,你可以发给同事的手机上,他可以在微信打开后直接使用,示例如下:

6、API

API 就是应用程序接口,你可以通过设置 API,把你的知识库和其他信息系统打通!

我先用一个小例子,如何在 最流行的 ChatGPT-Next-Web 中使用前面我们建立的数据库

(1)安装 ChatGPT-Next-Web

我们只需要在 fastgpt.run 网站中,找到下面两个参数,填入 ChatGPT-Next-Web 软件的系统设置(如下)即可

(2)复制“接口地址”

回到 fastgpt.run 网站,进入“应用”模块,找到刚才我们的“将军牌炊具 XX 系统”

点进进入后,选 API

点一下 ①,系统自动复制接口地址

(3)生成 API KEY

API KEY = API 密匙-AppId = ③-②

fastgpt-n6x6sdescXXXXX-6509701eXXXX

注意,中间有个英文输入下的连接符“-”

(4)使用知识库

现在,你在 ChatGPT-Next-Web 的桌面端或者 web 段,就像在 fastgpt.run 上一样,与我们建立的数据库进行沟通啦

API 可以让你把这个数据库应用到你的网站、客服网站上去!

打通飞书、企业微信、企业网站等等!

FastGPT 功能还有很多,应用前景很广阔,今天先介绍到这里!

前期知识库文章,如下:

介绍了企业知识库的常识,分析了 AI 在企业知识库的优点,介绍了一个比较粗糙的 AI 企业知识库软件

介绍了利用 SalesGPT 这个开源软件,将企业内部的销售说辞放进去,变身一个 AI 销售人员,与潜在客户交流。

欢迎大家关注、收藏、点赞、分享 哦!注册使用!

以便第一时间收到更多更好玩儿的 ChatGPT 技巧分享哦。

「礼包 1」 点击“阅读原文”,访问fastgpt官网;

「礼包 2」 登录《国内直联GPT》,享受限免额度。

「礼包 3」 本公众号历史文章,[文章集锦]

「礼包 4 」 如果你想学习 AI 知识,欢迎加入我们的学习群。

请后台发送“入群”或扫描下方二维码进入学习群


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存