查看原文
其他

贾扬清做一个 AI 搜索产品只用了不到 500 行代码,包括 Prompt

李榜主 AIhackathon 2024-04-14

2024 年1月13 日贾扬清在朋友圈说,手撸了一个 AI 搜索产品 Lepton Search 只用了不到 500 行代码,而且还包括 Prompt。
AI 搜索不是一个挺复杂的系统吗,底层不仅需要高效的大模型推理,function calling,传统的向量数据库,KV 存储,以及云原生的部署等等,但竟然只用了 500 行代码,就搞定了。
相当惊讶,怎么能如此简单!体验了一下 search.lepton.run 很丝滑,如下。

前几天 Lepton.ai 上托管的所有开源模型,不需要更改任何现有的 LLM,在任何 LLMs 的推理阶段都可以使用 函数调用 功能了,Lepton 叫它结构解码功能,支持的模型包括 Llama2、CodeLlama、Mixtral、Starcoder、Falcon、Qwen、Baichuan 等流行的基础模型及其微调变体,当然也包括贾扬清呼吁就叫原来名字的 Yi

这可能就是贾扬清创立 LeptonAI 的目标,帮助开发者不重复造轮子,把时间放在 AI 应用场景的挖掘上。

这个太重要了。

OpenAI 论技术已经是全球绝对的王者,论人才密度也是全球遥遥领先连 Google 恐怕也比不上,那 ChatGPT 为什么最近半年都停留在 2.5 亿左右的 MAU 上,离传统的超级应用相差 5 到 8 倍的距离,无论是 DevDay 之前还是之后,都相对比较稳定。原因只有一个:没有找到场景。

李榜主会客室,正式开始接客了

本期客人是贾扬清,他给会客室的朋友分享一下:AI 时代 Cloud 应该往哪儿走?这应该是贾扬清创业后第一次公开直播,李榜主也会跟贾扬清大神一起,聊一聊 AI 应用层的观察,直播预约起来,尤其是出海的朋友。

在约这次直播的时候,跟贾扬清也小聊了一会,也帮会客室的朋友问了几个问题问题,涉及到端侧模型模型能力瓶颈开源闭源大模型锤子找钉子 等话题,我们先一睹为快。

也欢迎你在文末留言提问,李榜主跟贾扬清在 2 月 22 日直播的时候会优先为你解答。

李榜主

大模型在消费终端可能会产生哪些应用,你有什么观点和看法?

贾扬清:

这个是个好问题。手机上跑大模型讨论两个问题,第一个它有什么用?第二个它能跑多大的模型?

前两天跟一个以前做消费电子一个公司,以及 Facebook、Google 的人也聊了一下。整体感觉是在手机端上面做 信息提取 跟 summarization 这种的效果应该会比较好。如果说要做创作,展示创造性的东西,一般都需要更大点的模型,大家就觉得在云端会更好。

手机端的举个例子,10 年前 Google 搞过一个很有意思的一个概念,当然很多细节现在也都落地了。

譬如:我在路上走着,走着走着,我看见一个招牌,我拍一下那个招牌,那招牌上有个电话,点一下电话,就可以打这个电话点餐。有点像是说你所见到的东西,它都可以实时的给你分析出来,这段话到底是个地址还是个电话还是什么?然后它能够帮助你来识别,说这个东西不光是文字的,还有一些其他物品什么的,你再点上去的时候,你的意图是什么?它相当于信息提取以及意图判断,这个大语言模型肯定显然做得更好。

刚刚我们上周的时候发了一个叫结构解码功能,你讲一段完整的话进来,这话里面到底要做什么东西?它的这个结构化的信息是什么?它都可以输出来,这些事情其实小一点的模型就能搞。

如果你要说,你要跟他聊一聊,假如你是林黛玉或贾宝玉,应该怎么跟我对话,还是云端的比较好。

因为这些结构化的信息也不需要特别复杂的模型,因为它本来就是个规则,就我们可以简单的就理解成,比如说你说找个高中生,然后说这名片上面的那个电话号码给我提出来,大家初中生和高中生也都会了,这个时候一个小模型是能搞得定。

李榜主

手机终端用好大模型的话,更多的是要增强原来的应用,而不是说去搞一个新应用出来?

贾扬清:

对,我觉得有一点这种感觉,今天其实很多大模型的应用都有点这个意思。在一个以前的应用的上面,提供一个更好的能力,而不是说搞一个全新的应用,譬如:虚拟角色聊天这事其实好长时间的都有的那么一个事儿。但聊天机器人这个事天能做的很多事以前做不了。

李榜主

除了Transformer 这种架构以外,还有没有其他的架构,有可能有突破?

贾扬清:

Transformer 从就这个模型出来,有的时候得过个那么一段时间,突然出来一个全新的一个架构,现在有像RWKV等,但是目前还是 Transformer 比较占主流一点,突破,还不太好说,估计还得看时间。

李榜主

GPT 已经发展到什么阶段了,是说已经达到了它的能力上限,还是说还有很大空间?

贾扬清:

我觉得有一点达到瓶颈的感觉,因为前面其实用大量的算力跟大量的数据在堆,但是背后的怎么做 reason 等等,其实还会要依赖到很多传统的技术。

大模型它的能力也不是那种就一下子就能够完全颠覆了已有的技术,比如说最近比较热的 RAG,就是基于搜索增强。在 RAG 里更多的是说你先检索(retrieve) 出来的效果好不好, 检索效果好,他回答效果也好点, 检索效果差一点,他回答的效果就差一点。

所以说从纯模型的能力可能是遇到了瓶颈,但好处是什么呢?

模型效果好到一定程度了,把周边的这些组件搭一搭,可以搞出一个有意思的应用来,我觉得这个事情是接下来就很有可能会发生的,所以我们现在做 LeptonAI 也是基于这种思考,譬如我们最近用 Lepton 搭的 AI 搜索产品,不足 500 行代码,还包括 Prompt,极大的降低了做 AI 应用的难度。

李榜主

你对模型的开源 vs 闭源 发展怎么判断的?
贾扬清:

在通才领域有一个闭源的模型是挺典型的状态,比如搜索,Google 在搜索上面就是第一名。在垂直专业性的领域,其实越来越多的垂直领域模型就变得更加重要,就是而且效果会更好。

如果说能靠一个秘诀(secret sauce)一吃就能吃 10 年,那大家就肯定不开源,但是这个技术本身发展非常的快,这个时候大家藏着掖着就没意义了,也就能藏两个月,突然就被新模型超越了,那还不如我索性开源出来,还能够给我赚流量。国内例如、零一都在做很优秀的开源模型

模型开源这个领域它在非常迅速的发展,能够获得attention,能够获得adoption,能够进一步的迅速的迭代,是更加重要的一个事情。开源一直会继续往前走,如果有谁突然说我不开源了,会有人来代替它。

李榜主

有一个比较流行的看法是,现在大模型是拿着锤子找钉子,你怎么看?
贾扬清:
这是一个普遍现象,特别是在技术热潮的时候。寻找适合工具的需求是常态,通常有几种情况:
当锤子与钉子完美匹配时,大家觉得挺好,没啥特别。
常见的情况是,需求在,但是技术还没有能力解决,有钉子却找不到合适的锤子。问题无法解决,大家也就忘了。
当技术进步,出现了新的锤子,但是还没落地,这时候大家就会认为是“拿着锤子找钉子”。这实际上是一个正常的过程,但我们更容易记住这个阶段。
虽然我们经常说第三种情况,但是其实其他两种也很多,只不过我们不注意。锤子找钉子,即使在这个过程中有些浪费,这些“锤子”通常最终还是会有一定的用途,这是个经济规律。

李榜主会客室 直播预告:

本期客人:贾扬清,是业内耳熟能详的「框架大神」他不仅是业内主流 AI 框架 Caffe 的创始人、TensorFlow 的作者之一、更是 PyTorch 1.0的共同创始人。
浙江绍兴人,高考中榜清华,遗憾差几分与计算机专业失之交臂,于是进了自动化专业,作为 2006 届清华本科优秀毕业生毕业,其后又继续在清华完成控制科学与工程的硕士学位,之后去了加州大学伯克利分校攻读计算机博士。
在读计算机博士,本该在当年 12 月完成的毕业论文硬是被他拖到了第二年5月份才写完,原来大神跟很多人一样也不想写毕业论文呀。在不想写论文期间,贾扬清完成了他的成名作,开源深度学习框架 Caffe。Caffe 一经诞生,就成为了诸多深度学习初学者最青睐的工具,同时也被微软、雅虎、英伟达、Adobe 等大公司采用。
这可能就是大神跟普通人的差别,不是论文不重要,是有更想干的事。
贾扬清的导师 Trevor Darrell 教授,也说出了那句:你是想多花时间写一个大家估计不会很在意的毕业论文呢,还是多花时间写一个将来大家都会用的系统?
之后贾扬清加入谷歌大脑,在谷歌大脑的负责人 Jeff Dean 麾下担任研究科学家,又开启了另一世界级深度学习框架代表作 TensorFlow,作为核心作者参与。
2016 年 2 月贾扬清离开谷歌加入 Facebook(Meta),在 Yann LeCun 领导下担任研究科学家。11 月贾扬清代表团队在 Facebook(Meta)官网发文,我们在移动设备上开发了一个新的深度学习平台 - Caffe2Go,首次实现了实时的捕获、分析和像素处理——这一最先进的技术仅在手上就能实现。…… Caffe2Go 与 PyTorch 构成了 Meta 机器学习产品的核心,2017 年晋升为 AI 架构总监。在 2018 年 12 月的 NeurIPS 大会上,Facebook 正式发布 PyTorch 1.0稳定版,贾扬清担任 PyTorch 1.0 项目的共同负责人,贾扬清发文介绍 PyTorch 1.0 = Caffe2 + PyTorch 。
2019 年 3 月贾扬清加入阿里巴巴,担任技术副总裁,领导大数据计算平台的研发工作,9 月贾扬清成为阿里巴巴开源技术委员会负责人。2022 年云栖大会上,贾扬清带领阿里云智能计算平台事业部推动魔搭(ModelScope)开源模型社区建立,目前阿里云魔搭社区已聚集 180 万 AI 开发者、以及 20 多家 AI 机构贡献的 900 多个优质 AI 模型。
2023 年 3 月 贾扬清从阿里离职创业,创立 Lepton.ai。


李榜主会客室 2024年 开始接客啦,后台回复关键词 “会客室” ,跟一群 AI 产品榜上榜团队创始人&联创、AI 投资人、AI 创业者、海内外大厂产品/技术/战略 一起搞钱。



AI 产品榜

好评如潮,业内前沿 

官网:aicpb.com  对你没猜错 AI产品榜 首字母.com

AI产品榜 联名发布继续招募 中,公众号回复 “联名” 咨询。


2023 年 AI 产品榜 12 月共 33 个重要榜单,以下列出3个,关注本公众号查看全部榜单:



AI 产品榜官网: aicpb.com 

对你没猜错 AI产品榜 首字母.com


官网可访问 AI 产品榜 50 + 榜单,后续月份榜单也会在这个文档更新,记住就行。


- 都看到这了,在看、转发一下吧 -



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存