印象笔记 |大象GPT & 印象AI
最近有关AI的话题实在是太🔥了,🐘也收到了很多象亲们的询问:
利用这个机会,我们一并回答大家的问题,也和大家介绍一下印象笔记在AI领域的产品与规划。
01
AI是印象笔记长期践行的战略方向
早在2019年,印象笔记成立7周年时,印象笔记研究院院长常诚就介绍了印象笔记在AI领域的布局:“印象笔记作为最大的非结构化数据沉淀平台之一,里面包含了文本、图片、音频等内容,而且,内容之间做了紧密的关联,印象笔记在下一代人工智能发展中潜力巨大。”
而印象笔记CEO Ray当时也已经指出:“如何通过自然语言处理、语义理解以及其他形式的人工智能,结合用户对模块化的信息、标签和知识图谱的运用,结合编辑和知识组织方式的变化等,真正为用户提供增强的人工智能,帮助用户联想、创造,在已有知识和信息的基础上提炼、理解、行动,这是我们要长期思考并深耕的事。”关于AI技术在印象笔记产品中的落地,Ray当时说:“这将是一个随着AI技术的发展不断推进的过程。”
时间来到了2023年,在这4年中,印象笔记已经陆续推出了一系列以人工智能为核心技术驱动的智能化产品功能:智能推荐、智能标签、智能摘要、知识星图等,也一直在AIGC(内容人工智能自动生成)领域持续深耕。
今天,我们希望为大家交上一份阶段性的答案 —— 「印象AI」。
02
大象GPT & 印象AI,一起了解一下
印象笔记在持续研究世界领先的包括OPT、BLOOM等类GPT-3.5结构的大语言模型(Large Language Model)基础上,结合多年来对高质量数据的处理经验,进一步基于自行设计的Multi-task Instructs数据集,Fine-Tune形成了数十亿参数规模的自主可控的轻量化大语言模型 —— 大象GPT,这也是目前国内相关应用厂商率先进行自主研发的轻量化大语言模型。「大象GPT」与国内外领先的大语言模型进一步结合,构建出混合驱动的生成式人工智能产品 —— 「印象AI」。
与大家见面初期,「印象AI」将为印象笔记用户提供丰富场景下的开放式写作助理,从专业的采访提纲、新闻稿写作,到日常工作所必需的日程待办、广告文案、促销邮件、头脑风暴,亦或是生活中常常要遇到的餐馆点评、优劣对比,甚至是充满趣味的emoji转换、现代诗创作,近30个不同的创作场景,「印象AI」会为你一一安排。当然,你也可以跳脱这些场景,让「印象AI」配合你的创造与想象,成为你最佳的创作助手。
随着「印象AI」与大家见面,在广大用户的不断使用、反馈与创新应用的过程中,印象研究院将进一步利用基于人类反馈的强化学习来优化模型,即 ChatGPT背后同样在采用的模型训练方式Reinforcement Learning with Human Feedback(RLHF),让「印象AI」更加聪明,更懂你。
03
让我们共同发掘「印象AI」的无穷潜力
GPT驱动的多模态知识管理助手
在未来,「印象AI」所承担的角色不仅是一个开放式的写作助理,它将深入到知识管理的每一个环节,从信息的收集获取,到知识的组织与连接,以及进一步的创作与表达,都充分发挥它的作用。
试想一下,当记录的信息可以被「印象AI」有效地完善与补充,整理的信息可以被「印象AI」高效地总结与归纳,不同模态信息之间的关联可以请「印象AI」挖掘,分享的创作内容可以通过「印象AI」进行润色与升华,「印象AI」就会变身成为你的多模态全能知识助理,协助完成数据-信息-知识-智慧(DIKW)的知识管理全流程。
构建私人生成式语言模型
对于重度记录用户而言,除了希望「印象AI」扮演通用型知识管理助手之外,一定还希望能获得更个性化的AI服务。「印象AI」不仅仅是基于公开语料的大语言模型,更有可能在用户进行授权的情况下,与私人语料相结合,训练成为保存个体记忆,传递个体经验,呈现个人创作风格,展现个人特点的私人化生成式语言模型。
当个人数据积累到一定程度,将有机会把私人独有的高价值数据与大语言模型通过适配层(Adapter Layer)对接,让AI帮你记住一切,随时随地将灵感和知识联系起来。想象一下,无论是与朋友的露营计划还是每日工作会议回顾,所有内容都会自动索引,并且被智能连接。如果AI能够立即找到你所经历过的每一件事,回忆起谈话的每一个细节,读过的每一本书,曾经涌现过的每一个灵感,你的个人「印象AI」将变成你生活信息的宝库,更可以是你在信息世界里的数字孪生。
总结一下
基于印象研究院多年来对自然语言处理、深度学习等人工智能相关领域的持续研究,对多模态编辑器、知识图谱等信息处理领域的应用实践,以及印象笔记十余年来专注处理知识密集型内容、服务于知识型用户的经验,即将与大家见面的「印象AI」已经初具规模。随着数亿印象笔记用户与「印象AI」共同成长,在工具领域拔得头筹的「印象AI」将持续领先,最终为大家带来知识管理的全新形态。
一张图了解「印象AI」布局
官宣之外,你关心的都在这里
Q:近期AIGC的技术风潮很🔥,但更火的是ChatGPT。有不少产品都已纷纷表示对ChatGPT进行适配,或引入ChatGPT 类产品,为什么印象笔记不照方抓药,让我们尽快在印象笔记内用起来?
🐘:截至目前,ChatGPT并没有开放API提供给第三方用户,以ChatGPT形式提供的服务是以虚拟登录的方式或反向工程的方式在进行;无论从服务的可用性、合规性、稳定性,亦或是数据的安全性、保密性,都无法满足规模用户的使用。而印象笔记推出的「印象AI」之所以采取自研模型与国内外模型相结合的方式,就是要力求模型自主可控,保证AI产出的内容合法、合规,让大家用起来安心、遂心。同时,这种混合模型方案也为未来向用户提供更丰富的应用场景预留了充足的空间。
Q:印象笔记推出的「印象AI」与业内一些其它产品所提供的 「某某AI」有什么区别?
🐘:以GPT3为代表的新一代大语言模型(LLM),引入Instruction Tuning后具备了涌现能力(Emergent Ability),相比上一代语言模型,它们可以更好地理解人类的自然语言并做出合乎预期的响应。目前业内其它产品提供的AI能力通常都以产品内直接对接某种特定大语言模型的API为用户提供服务。
但大语言模型自身的发展也面临着挑战。它仍然是一个“静态”模型,必须定期更新以吸纳世界范围内的新知识和新常识,同时需要避免“遗忘”之前已经具备的能力。如果某一AI服务仅依赖单一大语言模型服务商,服务的输出结果与此大语言模型的输入语料密切相关,在现今环境下,很难避免输出结果所呈现出的社会偏见。而用户要想更好地利用大语言模型,需要理解何为Prompt Engineering(提示工程),要设计兼顾任务背景和结果的多样性复杂提示,高质量的 Prompt还需要大量的试错过程,这些都大大提高了用户使用的复杂程度。另外,大语言模型本身发展所需要的大量资金投入,也会通过AI服务商,转嫁到用户身上。
为平衡单纯依赖某个特定大语言模型所带来的挑战,「印象AI」以自研轻量化大语言模型相配合,采用混合模型方案提供服务,从而做到针对用户需求,定制任务并快速迭代模型,成为解决通用场景的大语言模型之外的有力补充,同时可以迅速地引入新常识或者特定领域的专有数据,进行有针对性的微调。在用户常用的记录与创作场景下,我们对相关Prompt已经进行了深入的研究与优化,借助Self-instruct等前沿技术,持续优化Instruction Tuning过程,以更好更快地满足用户对高质量输出的需要,有效降低用户使用成本;同时,混合模型方案在一定程度上提高了用户使用大语言模型的公平性,减少偏见和滥用等问题。
需要强调的是,「印象AI」不仅是印象笔记推出的语言生成式人工智能服务,它更是印象笔记人工智能版图中的重要一环,不但满足开放式辅助写作的基础需求,更有着成为知识管理助手、建立私人生成式语言模型的愿景。「印象AI」与印象笔记的一系列智能功能以及智能硬件产品相配合,进一步帮助印象笔记向着成为人类「第二大脑」这一使命迈进。
Q:「印象AI」听起来真不错,但我们什么时候才能用得上呢?
🐘:印象研究院的小伙伴们还在持续对模型进行微调,印象笔记的产品和研发同学也在为「印象AI」与「印象笔记」产品对接做着最后的努力。请关注「我的印象笔记」以及「印象笔记」微信公众号,预计在三月份,我们将为大家开启优先体验的报名。
🐘互动
关于更多「印象AI」的想法
也欢迎象亲们在留言区留言讨论~