其他
好久没写文章了,因为最近一直在推进自己的创业项目。目前项目已经上线了MVP,正在融资阶段。关注我公众号的朋友应该都了解,我从去年9月就开始关注生成式AI带来的新一轮创业机会,我们团队也做了几个方向的探索和尝试,并最终选定了当前这个方向作为长期目标。今天写的这篇文章跟以往产品分析类的不同,会从技术教程的角度来教大家搭建一个基于私域数据的ChatGPT,但这里核心要提到的一个关键产品是LangChain,一个针对大模型应用的开发框架,帮助开发者快速实现基于大模型结合外部数据和API的AI应用开发。LangChain在最近拿到了硅谷传奇风投Benchmark领投的1000万美金种子轮,估值在4000~5000万美金之间,这是Benchmark在生成式AI领域的首次出手,具有重要的标志性意义。另外之前创建的深思圈信息分享群已经运行快半年了,里面会实时分享最新有用和有趣的信息,特别是AIGC这块,群里的信息密度和新鲜度非常高,交流氛围也很好,大家一块在群内讨论和学习。目前1群、2群和3群都已经满员了,我刚刚新建了4群,欢迎感兴趣的朋友可以后台回复关键词【信息】,扫码入群。此外,我还在文末特别为大家准备了一份最近海外在AI方向出手的投资人列表,总共有近600位投资人,并且包含了各方面的详细数据,欢迎大家领取。导语最近一款名为ChatPDF的应用很火,其底层基于ChatGPT的API接口,用户只需要上传PDF文件,即可用自然语言的方式进行对话获取PDF相关的内容信息。这就是典型的一个基于用户私域数据打造的ChatGPT,大家都知道ChatGPT本身的知识库数据只截止到2021年,同时无法添加外部的数据源进行分析。但很多时候,我们需要的是将ChatGPT自身的语言理解和表达能力与数据进行解耦,将ChatGPT强大的语义能力运用到我们私域数据和内容上,比如ChatPDF、ChatDocs还有ChatExcel等产品就是典型的例子。01.教程指南那么今天的教程就是教大家零基础上手,搭建一个基于私域数据的ChatGPT。本教程的目标人群主要是零基础的普通人,而非专业的开发者。因此,我会教大家以最快最简单的方式搭建出个性化ChatGPT。在此,我们会用到在线代码开发平台Replit,这样就不需要在本地安装和配置相关的开发环境,只需要打开网页即可进行开发和搭建工作。而且Replit官方就提供一个类似的样例项目,我们只需要在已有代码的基础上,稍加修改即可实现目标,真正做到标题中所讲的“零基础”。在开始搭建之前,需要首先有一个OpenAI账户,因为我们需要调用OpenAI的API来实现私域数据ChatGPT的核心问答功能。在登陆成功后,点击右上角头像,选择“View