查看原文
其他

Z Potentials | 张海龙,CODING 创始人,被腾讯收购后再启航,要做复杂软件生产的AI Agent

Z Potentials Z Potentials 2024-03-04

软件开发的历史是一部技术革新与人类创造力相互激发的史诗,早期,软件开发是精英的专利,代码编写像古老的羊皮卷撰写,只有少数人能触及其神秘面纱。随着个人电脑的普及和互联网的兴起,软件开发开始步入千家万户,变成更加大众化的活动。开源运动的崛起打破了技术壁垒,让全球的开发者共同参与,像构建一座座数字时代的金字塔。移动互联网的出现,又让软件开发的边界扩展到了每个人的掌中,从而诞生了像 Facebook、Instagram这样的世界级应用。


现在,我们站在 AI 的肩膀上,这个时代预示着软件开发的又一次革命。AI 不仅为软件开发带来了新的工具和助力,更为思维方式和创新路径带来颠覆性的变革。AI 时代可能将催生出一种全新的软件工程模式,我们期待看到,AI如何在软件领域续写其尤里卡时刻,将传统工作流转变为创新的奇迹。


本期我们有幸邀请到了 CODING 创始人张海龙先生,CODING 作为国内领先的开发者工具SaaS,于 2019 年被腾讯收购。在这场深入的对话中,我们一同探讨了 AI 在软件开发中的潜在角色、未来软件的开发范式以及技术发展趋势等问题。让我们一起走进此次对话!Enjoy!

01 为软件为生,开启五度软件创业之旅

ZP:先向读者们介绍一下自己吧!

张海龙:我觉得自己可能比较幸运,大多数人在高中甚至大学可能还不确定自己想做什么,但我在初中时就已经确定了自己的职业方向。我从 96 年就接触到电脑并开始尝试编程,从那时起,我就一直沉迷于计算机,当时还是组装机时代,直到高中时我参加了信息学奥林匹克竞赛,大学我选择了软件工程专业,研究生也是学的计算机,我的第一份工作也是和计算机相关,之后创业也是在计算机领域。渊源是初中时的一个物理老师,当时他非常喜欢拆装电脑、搞盗版软件,算是我走上编程生涯的引路人,为我介绍了许多相关信息,所以当其他同学在晚自习写作业时,我却在看厚厚的四本全年合订本电脑报,这对我的影响一直持续到现在。直至今日我们在招聘过程中,也倾向于寻找对软件有着发自内心的痴迷和狂热的人,因为很多在工作中遇到的问题,是偏门的隐性知识带给你的解法。


本科在复旦读软件工程,研究生在CMU读硕士,毕业后开始在 Oracle 工作,但当时由于工作过于清闲,就搭建了一个从国内进口鞋子到美国销售的网站,那时我注意到美国的电商系统做得很好,叫 Magento,后来被 eBay 收购,而中国当时的类似系统很少,做得也不好,我就觉得我们应该搭建一个电商系统帮助商家卖货。但我们回国做了一年电商系统后发现这条路不行不通,中国市场需要的不是电商系统而是流量。我们当时服务过许多品牌,发现它们销量不好并不是因为网站做得不好,而是缺乏有效的流量体系。我们意识到中国的电商市场其实只需要淘宝这样的平台,不需要独立的软件,所以我们后来放弃了这个业务。


2009 年我开始兼职做开源中国,2011 年后开始全职投入,但尽管流量越来越大,我们在尝试变现时发现除了些许的广告费外别无其他,这个问题在CSDN时代已经被验证过不可行,但是不信邪又跑了一遍,当时就意识到很多时候有些事儿不成,问题不在于人是否聪明或是否努力,是因为这个事儿本身就不能成,看到别人做了十年都没成功,就不应该再尝试了。后来就把这块业务卖给了国内一家想要上市的公司。


后来阿里的云栖大会给我了新的触动,我感到云计算的时代到来了,加之当年爆火的各种 O2O 概念,所以当时搭建了一个关于程序员的 O2O 平台“Uber for Developers”(客户临时需要一个程序员可以在平台上找到人解决问题),最后失败的原因是需求无法标准化,需求的标准化是 O2O 能成立的核心标准。但当时我们为了配合O2O平台的交易管理,做了一套管理工具,包括代码托管,项目管理等等。


虽然O2O不work,但是工具沉淀下来了,所以在18年确定放弃O2O业务后,开始转型做开发工具SaaS——CODING。当时我们已经积累了200万开发者和跑通的工具体系。也恰巧是18年,腾讯决定征战 2B,Dowson带队组建 CSIG,主要产品是腾讯云。可能是因为CSIG的老板们都是技术背景,CODING很快进入了腾讯云的视野。当时我们转型做 SaaS 其实挺困难的,很感谢腾讯云对我们的认可,才有了后续产品和资本层面的合作,也才有了后面 19 年的收购。进入腾讯以后我开始学习 2B,腾讯为我提供了一个很好的平台,让我能够接触到大量中国各行各业的客户,通过与各个层级的 B 端客户交流,我逐渐意识到了一个问题:除非拥有“独门秘籍”,否则你只是在参与一个招投标游戏,这也是为什么 2022 年后腾讯开始转向做产品和供应商,让合作伙伴去参与招投标。


随后我开始思考新的业务,当时 CODING 的产品体系已经非常完善,我们几乎覆盖了软件工程除了安全之外的所有领域,但我意识到尽管产品解决了管理问题,但并没有真正提高软件开发的效率。在 22 年下半年,随着 GPT-3.5 的推出,GitHub Copilot 开始变得更加实用。在这样的背景下,我开始构思 Babel 这个项目。我的想法是设计一套全新的工程方法论,希望通过这个项目将开发效率提升十倍,这套工程体系和产品交付的设计旨在彻底改变软件开发的方式。2023 年我们开始投入到 AI 领域,AI 对我们产生了巨大的冲击,我们花费了大量时间研究 AI,并将其融入产品力中,为我们的产品增加了类似于 Copilot 的功能,按照这个思路,我们一直开发到今年10月并推出了 beta 版本。


在这个过程中,我们进行了很多关于 AI 的思考,比如 AI 是否会取代传统软件开发?它在复杂工程中能发挥何种价值?但到了 10 月,我们意识到这个方向可能有些问题,基本的问题在于,仅仅提高现有开发者的效率可能并不是一个真正的机会——因为这应该是 Github Copilot 的机会,Babel 并没有实现质的飞跃。Idea to Code 并不 Work,中间遗漏了需求,一个想法并不等同于一个需求,一张图变成一个网页,或一句话变成一个贪吃蛇游戏,这都是错误的创业方向,这种能力与实际应用关系不大。


02 复杂工程才是创业公司的机会,要为AI设计一套工作流程

ZP:如何理解 Idea to Code 不 work 这件事?

张海龙:因为这会变成通用能力,如果一句话的需求能直接被代码解决,那么这个需求在ChatGPT的Code Interpreter这个工具就能解决,或者说直接可以在通用 AI 助手中被解决,不需要一个单独的软件处理这个需求,而 ChatGPT 无法做到的是生成一个完整的 CRM 软件。


一些严肃的玩家也意识到了这个问题,开始去解决软件复杂工程的问题,如果将编程语言视为一种模态,则需要在这个模态上针对复杂工程进行开发,比如电影是图像的复杂工程、写书是文字的复杂工程、软件是代码的复杂工程,图像、文字、代码等模态的生成能力那一层是 ChatGPT 的机会,而复杂工程才是创业公司的机会,不再是生成问题,而是工程方法论的问题。


ZP:那么您如何看待AI的出现,对软件行业会带来哪些影响?就像蒸汽机之于工业革命,电脑之于信息革命,AI的出现意味着什么?

张海龙:AI是智力革命,AI是对智力的替代。工业革命让英国的农业人口从 60% 降低到 10%,信息革命让美国的工业人口从 40% 降到了 8%。按照这个思路,如果说AI是智力革命,白领在就业市场的占比会从 60%+ 变成个位数。


AI在某种意义上是对人的替代,GPT-4 的智力水平已经相当高,GPT-5 可能超越 80% 的人类智力。在这样的背景下,问题就变成了如何让AI真正去替代某一个工种。以当下的话语背景来看,我们如何让 AI 去替代初级程序员?目前的情况是,像 Github Copilot 这样的工具不能完全替代初级程序员,因为它本质上是一种生产工具的增益,而不是生产力本身。如果AI要替代一个人,那就意味着它替代了一种生产要素,这对于生产力的影响是巨大的。因此,我们需要思考的是如何让 AI 能够在软件生产这个长链条上独立完成任务。我们成立公司之初是想“让人人都可以写代码”,但现在变成了把更多的人“赶出”写代码的工作。


ZP:一个发散性的讨论,“让人人都可以”在什么事情上是成立的、什么是不成立的?

张海龙:让绝大部分人感受到快乐的事情,或者说是人的本能驱使的事情。比如让人人都可以拍照,因为变美是人的本能,但让人人都可以骑马就不是,因为骑马对于很多人来说不是一个目的,而仅仅是从A地到B地的一种方式,所以当有了汽车之后,人们就不再骑马。能让大多数人感到快乐的事物肯定是值得追求的,但写代码不属于这类活动,或者说只有少数人能通过写代码获得快乐。所以最终的问题变成了,即使我们能降低编程的门槛,使得每个人都能编程,这也不是人类本能的需求。要吸引人们去做某事,那一定是与他们的本能需求相关的,而不是强迫他们去做他们不感兴趣的事情。


ZP:所以把更多的人“赶出”写代码的工作,我们如何基于此做成一个产品?

张海龙:中国目前被雇佣的 700 万程序员中,35% 是月薪 1 万的初级程序员,取代这部分人力就是产品能够占有的市场份额。本质上可以将 AI 看作一个清华大学的毕业生,他能够完成编写代码和文本的各种任务,但要将他培养成一个能解决实际问题的工程师,还需要向他灌输大量的行业知识和经验,同时提供优秀的工具,这正是我们目前所做的事情。因此,这个过程并不是单纯的模型套用,特别是对于复杂软件而言,更多是一个工程问题,而不仅仅是编写代码的问题。


我们希望开发一个 Agent,能够 take serious specification,而不是一句话的 idea,包含了详细的需求,这个 Agent 背后可能有多个子 Agent,可以将其理解为一个施工团队,这个团队会根据需求不断工作,如果遇到无法解决的问题,会发出警报请求人类介入。在简单需求上,这个系统能够在半天到一天的时间内交付一个完整且可用的软件,而人类的工作则转变为定义“做什么”,因为AI目前还无法解决“做什么”的问题。这种方法为软件开发提供了一种新的工作模式,由 AI 处理任务,而更复杂的决策和创造性工作仍然由人类完成。


ZP:那么未来这个Agent,背后需要有人么?会是什么角色的人?

张海龙:需要有高级程序员写技术规范(specification),人类扮演的是架构师的角色,把架构问题解决后由AI填充内容。在今天的工作流中,如果一个任务很简单,高级程序员通常会将产品需求直接转发给初级程序员去处理;如果遇到复杂的需求,高级程序员则会指导初级程序员如何解决问题。这个模式在今天的软件开发中同样适用。高级程序员会撰写详细的技术规范(specification),然后交给 Agent 去执行。未来,我们预见高级程序员亲自编写代码的频率将大大降低,他们将更多地扮演AI的监督者(supervisor)角色,事实上,高级程序员当前也在担任这样的角色,我们的观点是,高级程序员是不可替代的,因此我们首先解决的是替代初级程序员的问题。


ZP:但今天的 Copilot 无法实现的功能,未来会不会实现?

张海龙:很有意思的问题。在现有的工具链下,任何代码相关的机会都是微软的机会。但当下的工具链大多是为人设计的,而不是为AI设计的,所以有大量的兼容性问题,我们从头开始设计可能更快。可以理解为我们的产品是为 AI 设计的,Agent 自带工具,是工具+劳动力的形态,更像一个 AI 外包公司。


ZP:那么我们如何定义我们的产品?

张海龙:人类比 AI 强的地方在于,在定义“What”,我们有能力创新而不仅仅是模仿,而且根本没有抄袭对象。目前我们实现的程度是,给AI一个明确的规范或 specification,让它完整的生成一个软件,这是已经实现的。但一个负责任的“施工队”,需要反复检查以确保工程的一致性,这是目前我们还不具备的能力。同样,包括运行过程中的 debug,如果 AI 能够自主分析、修改和部署,那将是一大进步,但这个能力目前也还没有实现。这背后涉及到许多个 Agent,如何将行业经验传递给它们,以及如何确保它们工作的有效性,这是一个巨大而复杂的问题。我们需要为 AI 设计一套工作流程,并且赋予他一系列工具。目标非常明确,关键在于我们能否实现这一切。


ZP:这个产品的实现难度会在哪?

张海龙:AI 在工作方式上与人类截然不同,人类可以通过键盘和鼠标进行手眼协同操作,这使得在长串代码中修改一个字符对人类来说相对简单,而对AI而言却是一个挑战。因此,我们需要理解我们服务的对象不同,许多工作方法和工具都需要相应的改变。这也是为什么我们认为,在 GitHub Copilot 的垄断下仍然存在机会。


Copilot 已经推出了一段时间,但它依然局限于之前的产品定义,主要是由于它需要在开放领域中处理各种编程语言、开发平台、工程逻辑和结构,面对的问题复杂度极高。我们重新开始做就是要削减这些变量,采取类似于电动车的逻辑,不需要的零件全部去掉。


ZP:我们目前的进展如何?产品已经上线了吗?

张海龙:目前上线的这个不是我们期望的产品最终形态,现在这个产品还是给人使用的。真正的产品我们预计在半年内能推出一个简单版本,虽然处理像 CRM 这样复杂的系统可能还做不到,但制作一个日历应用还是可行的。不过,即使是日历应用,它的需求也不是一句话就能概括的,相对来说也比较复杂。


在追求这个领域的“圣杯”时,大家都知道目标在哪里,但通往这个目标的路径却多种多样。我们当前的结论是,我们不做前端开发,只专注于后端。我们不涉足视觉部分,只处理后端 API。我认为视觉部分过于非标准化,需要另外一层抽象,所以我们先专注于后端 API 的开发。


ZP:我们在定义产品的过程中,如果把“用户”视为AI,应该如何验证产品?

张海龙:我们有现成的输入和输出素材,验证过程就是看AI能否将输入和输出匹配,整个过程线上完成,类似于训练大型模型时所进行的填字游戏,相对简单且直接。


ZP:我们为什么取名叫 Babel?

张海龙:Babel 是巴别塔,传说人类想做一个通天塔,但上帝创造了各种语言将人类分裂,这个计划就落空了。我们认为(编程)应该统一,不需要过多语言。


03 要做非共识的、大多数人不愿意去做的事情

ZP:AI领域未来发生什么变化,对我们想做的产品是有帮助的?

张海龙:GPT-5。主要是智力的提升,软件工程有一些固定的工程方法论,Agent需要理解方法论后自己进行规划。Agent 和非 Agent 的核心区别在于环境的感知和反馈能力,它需要感知哪些代码是正确的,哪些是错误的。


ZP:我们现在探查到GPT4在我们场景里的边界是什么?

张海龙:从解决“如何做”(how)这个问题上来说,如果你给AI一个非常具体的任务,让它专注于编写代码,它已经可以超越80%的程序员了。但AI的一个主要问题是,它无法自动理解和组织上下文信息。因此,如何撰写一个好的提示(prompt),给它一个清晰的上下文,以及提出问题的方式都非常关键。


当然,有些问题是 AI 解决不了的,比如那些需要极高创新性和原创性的问题。例如,多步推理这种能力对 AI 来说还不够强。如果给 AI 一个需求,让它爬取网页并根据内容决定如何解析,判断信息是否符合需求等等,除非你将需求讲解得非常细致,否则AI无法自动拆解并解决这个问题。


ZP:Agent 是今年非常火的话题,如何看待 AutoGPT 这类产品?

张海龙:首先 Agent 要么做框架、要么带行业属性,但做框架是大厂的机会,微软出了一个产品 AutoGen。AutoGPT 的问题是没有行业属性、没有行业 Knowhow,否则就会落入一个误区,认为 AutoGPT 能做任何事,但实际上它什么也做不了。如果没有特定的行业知识和专业性,Agent 的实用性和有效性将大大降低。


ZP:现在市场是什么状态?玩家是什么切入点?

张海龙:在当前的市场中,切入点主要分为两类。第一类是不使用微软工具的公司,比如我们;第二类则是选择使用微软及其相关工具的公司。我认为,从大的逻辑上讲,如果你选择与微软的工具合作,那么你要么迅速扩大规模,以期待被微软收购,否则几乎没有机会。但 Replit、Cursor、Vercel 这些公司都是选择不与微软的工具合作。而那些合作的公司,比如 Copilot、CodeGen、CodeRabbit,它们的方向也各不相同。CodeGen专注于根据 GitHub 上的 issue 提交 PR,这个智能代理只处理软件工程的某个环节,不涉及前置需求的理解等工作。CodeRabbit 则在你生成PR之后帮助你进行 review。市场上有很多公司都在尝试做这类事情,但切入点不同。我还看到过一家公司专门做开发文档编写的 AI 工具。最终,许多公司都会意识到,真正的价值不在于简单地提高人类的工作效率,而是在于通过智能化工具将特定的工作流程从人手中完全转移到 AI 上。

ZP:从 GPT-3.5 到 GPT-4 的提升,对我们有影响吗?

张海龙:GPT-3.5 的时候完全没有想法,到 GPT-4 出现时我们意识到这个事变得可行,因为 GPT-4 带来的提升非常显著。其中第一个显著的改进是上下文长度。上下文长度极其重要,如果上下文长度不够,我根本无法将软件的需求完整地传达给 AI。第二个提升点是推理能力。第三点是指令遵循。在我们的工程逻辑中,我们不需要 AI 有太多自己的想法,我们需要的是它能够老实按照标准执行任务,因此指令遵循的重要性尤为突出。


ZP:您过往的创业经历非常丰富,假如回到 CODING 创业那个时候,还会做 CODING 吗?

张海龙:如果回到当时我不会做CODING,或者不会做O2O,我会选择做Gitlab这个方向,我认为当年做Gitlab是有机会的。但是 CODING 那段经历对我来说非常重要,我经历了融资,也遭遇过资金紧张的困境,我面对过团队的动荡和裁员,也经历过招募新人,经历过大规模的扩张,也经历过最终将公司出售,还是要感谢腾讯,其实是在我困难的时候拉了我一把。可以说除了上市,我几乎经历了企业发展过程中的所有阶段。


ZP:经历了这些事儿之后,您自己最大的改变是什么?

张海龙:我觉得整个人变得淡定了一点,就不用那么着急,很多东西急也没有用,而且很多东西没有你想象得那么严重,天塌不下来,很多时候会有一些这样的感觉。


ZP:当时有什么感到着急和茫然的时候吗?后来有什么心态上的调整吗?

张海龙:有,2017 年的时候,我已经确定之前的市场策略不起作用,而且无法获得融资,感到孤立无援。


所以对行业 Know how 和方法论有更全面的理解变得尤为重要,如果我认为某件事任何人都能做,我就不感兴趣了。我更愿意去做一些非共识的,大多数人不愿意去做的事情。在移动互联网领域取得成功的公司,都不是简单地+移动互联网元素就能成功的。像字节跳动和美团这样的公司,都是原生移动互联网公司,如果没有移动互联网这个要素,这个事情是不成立的,大机会一定在这。现在 AI 时代也是一样的,如果干所有事儿都是 +AI,要么肉很少,要么就是别人的肉。


AI+ 这件事儿目前看起来一定是不清楚的,移动互联网早期的切水果那样的产品,并不是真正的机会,真正的机会是在移动互联网后期才出现的,对于AI而言这个过程可能会来得更早一些,历史虽然不会简单重复,但历史一直在押韵。因为经历过,所以大概知道哪些是机会、哪些不是机会,首先一定要做一个 AI 原生的项目才是大机会;其次,这件事情必须足够难才有价值。


ZP:CODING 成功退出被并购,您觉得是什么原因?

张海龙:我认为谈不上成功,但是一次有交代的创业。我们一直都是认真做产品,我们有一个好的 Git 平台,当时还是有非常多的开发者在用我们的产品。不投机取巧,即使在比特币非常火热的时候,有很多人建议我们发币,但我们始终没有这么做。如果你总是偏离轨道,虽然看起来像是在抓机会,实际上可能只是在浪费时间。另外,我们运气也很好哈哈。


ZP:从您的角度来说,为什么持续创业呢?

张海龙:创业已经成为我生活的一部分,这也受到了我的父母影响,因为他们也是创业者。人生终究是有尽头的,关键在于我们如何体验这个过程。虽然从美国回来时放弃了很多东西,但我不后悔自己的选择。对我来说,创业的过程带来了许多独特和不同寻常的经历。


ZP:您有很崇拜的人吗?

张海龙:马斯克,这个人很有意思,17 年很迷茫的时候去中欧商学院读书,有一门课讲授了马斯克的薪酬体系,他给自己定了一个很高的目标,不达成目标就无法获得激励,达到目标就能拿到很丰厚的薪酬(1000亿美金的股票)。


ZP:您有印象很深刻的书或电影吗?

张海龙:印象很深刻,花了很多时间去阅读的是凯文凯利讲“涌现”的书——《失控》。那本书对我产生了巨大的影响,极大程度改变了我的认知。整本书的核心逻辑就是“涌现”,他用了很多例子解释“涌现”这个概念,实际上大模型也是一种涌现。一本书再厚,可能只是讲一句话。电影喜欢看星际穿越和盗梦空间这类烧脑片。


ZP:如果这次创业成功了,下一件事想做什么?

张海龙:抗衰老。我可能会去研究合成生物学,我认为它非常有价值。目前不做是因为在这方面投入的资金可能是亿元美金起步。但是很多想法会随着不同的人生阶段改变,根本上来说,创造是一种快乐的来源,写文章、画画、创作、做音乐,某种意义都是一种创造,也并非所有人都能从创造中获得快乐,但对我来说,创造是我的快乐来源。


ZP:今天有很多年轻创业者在AI领域耕耘,有什么话想对他们说?

张海龙:找壁垒。这也是我在最近思考的一个问题,我看了无数的项目,觉得很多项目缺乏明确的市场壁垒。文生图领域存在一个潜在的壁垒,如果你能够拥有世界上最全面的某一类画风的素材库,然后训练一个 Diffusion 模型,使其能在生成特定画风的图像上做到非常出色,就是一个强大的壁垒。但这也意味着你的市场将非常细分,但这可能是 Midjourney 未来的发展方向,只有这样才能避开大模型的挑战。


请注意,此次访谈内容已经过精心编辑,并得到了张海龙的认可。欲了解更多关于 Babel 的信息,敬请访问其官方网站 https://babel.cloud/。我们也欢迎读者通过留言互动,分享您对本访谈或 Babel 的看法。


Z Potentials 将继续提供更多关于人工智能、全球化市场、机器人技术等领域的创业者访谈。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。

-------------------------------

扫码获取社群二维码,加入社群



欢迎与我们交流和分享你们的故事和想法,我们会是最好的倾听者。
投稿邮箱:zpotentials@126.com
稿件经采用可获邀进入Z Potentials内部社群,优秀者将成为签约作者,00后更有机会成为Z Potentials的早期共创成员。

我们将经认证真实身份的产品、技术和创业者邀请至对应的产品群、技术群和创业者群,若想加入认证实名群可以扫码填写问卷,经认证后邀请加入。

关于Z Potentials

继续滑动看下一个

Z Potentials | 张海龙,CODING 创始人,被腾讯收购后再启航,要做复杂软件生产的AI Agent

Z Potentials Z Potentials
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存