查看原文
其他

季逸超 Peak:AI 竞泳十年|Z Circle

与你同在的 真格基金 2024-02-01

「00后狠人计划」持续招募中!自我们发布计划一个月以来,已和数百位伙伴建立了联系。他们中有从 9 岁就开始编程的技术小天才,有 B 站上最早的百大学习 up 主,也有从高中就设计研发测试各类火箭炸药的超级发明家……


当然我们也知道,或许 20 岁的你还没有一个成型的创业想法,因此我们找来了比你年纪稍长几岁的学长学姐,请他们聊聊自己在 20 岁时的困惑与选择。


第二集,我们请到了「少年极客」季逸超。2009 年,高中时的他便独立开发了猛犸浏览器 ,凭借强大的手势功能、惊人的效果动画使其成为当时 iPhone 上用户量最大的个人开发第三方浏览器。20 岁时,他拿到了真格的投资,创立了 Peak Labs,之后开发的知识引擎 magi.com 更是风靡一时。从知识图谱到大模型,我们和这位少年极客聊了聊他的 AI 创业十年背后的故事。


真格,你的创业第一站!「00 后狠人计划」仍在滚动招募中,欢迎一切有想法的年轻人来投递,无论羽翼是否丰满!



观看视频,了解 Peak 的故事



2020 年底,Peak 感受到了一种名为「绝望」的情绪。


这种情绪是从这年 6 月,GPT-3 的发布开始发酵的。作为一个 AI 创业者,他和他所创立的 Peak Labs 把全部的精力都投入了知识搜索引擎 Magi,与「基于不可靠的纯文本由机器自动构建尽量可信的知识图谱」这一使命上。


但 AI 最怕通用。不仅是知识图谱,更通用的大语言模型 LLM 在逐渐地吞并所有下游任务。以前耗时半年训练的专有模型,可能效果还不如一句给 LLM 的 prompt。


看到 GPT-3 之后,Peak 先是怀疑。在一个领域深耕太久,很容易有一种惯性、一种错觉。想象中的 AI 应该是通用的,但通用的曙光迟迟没有到来。「你知道吗?就是 too good to be true(好得不真实)。」


一个月后,Peak 拿到、上手测试了 GPT-3 API。他有一种顿悟的感觉,好像是真的。「但这时候你的心还没有死,你只是觉得『危险危险危险』。」


随着不断地使用、相关的研究越来越多,他最终意识到,信息抽取模型乃至知识图谱本身都正在「缓慢地死亡」。宣判死刑的这一刻,比著名的「11 月的最后一天」还早了两年。「你早已经知道你死了,ChatGPT 是世界知道你死了。就是这样的一个区别。」


一家潜在的巨头收购方曾和他们谈判了一整年,无疾而终。两年后,当 Peak 又问起对面的 AI SVP 的评价时,对方冷漠地回复,现在看来是「technically nothing interesting(技术上没有亮点)」。


这个世界就是这么快。「在整个 AI 行业,一年是算上古吧?三年算远古。」但从 2012 年创立 Peak Labs 到 2022 年被另一家公司最终收购,他已经在这条路上走了十年。


小小 Peak


01

竞泳者


那是深度学习爆发的前夜。2014 年 7 月 5 日下午 13 时 38 分,知乎上有人提问,猛犸浏览器为何不更新了?Peak Labs 最近有何动向?


一个小时后,一个顶着 @季逸超 的 ID 在一楼回复,猛犸不是不更新了,「只是 Peak Labs 现在做很棒的新东西。」若干年后他在采访中表示,和他同时创立公司的知乎那帮人,就不点名周源了,「太坏了,欺负老实人」,告诉他 Peak 你过来吧,知乎是个实名社区。


但无论是 Peak,还是季逸超,这两个名字背后的那个高中生,曾经是中关村一带最传奇的少年极客。


他在高中时独立开发的猛犸浏览器,是 iPhone 上个人开发的浏览器中用户量最大的产品。第一次穿正装是在成人礼;第二次穿正装,他获得了 Macworld Asia 特等奖;第三次穿正装,他已经拿到真格和红杉的天使投资,成立了 Peak Labs,登上了福布斯封面。


封面上的他穿着白色衬衫,打着黑色的领带,拿着一张猛犸浏览器的涂鸦。封面上书大字「互联网新人类」,底下一行小字——「天使投资人让他做『能想到最野的事』」。


那条知乎回答中「很棒的东西」在 2015 年初发布了——一款名为 Magi 的知识引擎,有着「很大的野心」。形式上,Magi 是一个黑色的长方形搜索框。如果你输入「暴雪娱乐是哪些游戏的开发者」,它会将这个问题分发到标准知识图谱、概率统计、神经网络这三种不同的策略,并选取最优结果呈现答案,「战网、魔兽世界、星际争霸II」。


在融资 PPT 的第一页,Peak 写下,「To be the shared brain for human, AI behind AI.(融会人类知识,贯通人工智能)」


「当时心就是这么大,我们觉得 Google 一定会被淘汰。」如果未来 AI 必定会替人类承担大量的工作,现在要做的就是为 AI 准备一个世界的大脑。


但他交了一份过早的答卷。2015 年,残差神经网络(ResNet)的提出,使训练更深的神经网络成为可能。随着训练数据集更大、计算能力进一步提升,循环神经网络(RNN)和长短期记忆(LSTM)取得了大幅改进。2017 年,Transformer 横空出世,彻底颠覆了自然语言处理(NLP)。2018 年,OpenAI 发布了 GPT,紧接着是 Google 的 BERT。


那几年他过得非常痛苦。从几个定向的 NLP 小模型出发,逐步把整个互联网上有价值的信息抽取出来,结构化地形成知识库,Peak Labs 花了很大的精力去打造了一套信息的处理流水线,再套上搜索引擎交互的外壳。


好不容易做出一个 Magi 的新版本,觉得终于达到了自己最好的标准,同事一伸手,刚有这么个推特,你要不要看一下?Peak 一拍大腿,「三个月的活又白干了。」


外面的技术日新月异。底层搜索的基础设施在沉淀中越来越坚实,但在最关键的语言理解层面,Magi 的模型永远在迭代,接着被反超。


一直到 2018 年,Magi 才推出了相对稳定的小范围 toB 测试版本。此时,Magi 已经能够将互联网上的文本与数据提取归纳成为结构化知识,自主获取、学习互联网信息,来增强自己的 NLP 处理能力。「完全能够对得起我们一开始的 PPT 里想象的事情。」


2019 年底,效率更高的公众版「magi.com」上线。原意是给 B 端客户演示用的 demo,意外在 C 端爆火了。


大量个人用户涌入。用户量在 10 天内突破了 100 万,一个月内达到了 300 万。半夜两三点,各种 504 超时报警把 Peak 从被窝里炸起来。冷冰冰的 AI 人声告诉他,访问量剧增,服务器崩了。


还没来得及做 B 端推广,100 多家客户就找来合作,「那段时间过得当然很爽,人也很飘,对吧?就天上天下唯我独尊。」但客户要的从来不是一个 Magi,他们要的是明确的落地。


与此同时,C 端的爆火带来了路线的动摇,「你就会犹豫说,这东西是不是能做成 C 端产品?」闻风而至的投资人把 Peak 关进小黑屋,直接问,「现在给你一个亿,你敢不敢当 Google?」


在狂喜与现实之间持续折返,直到 1750 亿参数的 GPT-3 诞生。


Magi 是一场与 NLP 前沿模型的大型赛跑,「其实到现在还是这样的感觉。」


前段时间,一个在底层大模型公司工作的朋友向 Peak 描述,感觉自己像在海边游泳。有时候你在睡觉。每次睡醒之后,你发现海平面又上涨了。有时候一觉醒来,海水已经淹没了你的鼻子。


就是这种感觉,Peak 觉得特别精准。「我理解他的心态,但他现在只是一个员工。真正你要是创业的那个带头人的话,你不是一个人在游泳。你是背着员工、股东、客户所有人在肩上,一块游泳。水面往上涨,上面还在压着你。这很痛苦。」


2015 版 Magi


2019 版 Magi


02

少年匹克


1992年,第 25 届奥运会在巴塞罗那举行。残疾运动员安东尼奥·雷波罗在开幕式上射出了惊世一箭;乔丹、魔术师率领美国「梦一队」一路横扫,以全胜战绩夺得男篮金牌;13 岁的伏明霞从 10 米跳台一跃摘金,她的身后是整个巴塞罗那城和圣家堂。


Peak 在这一年出生。他的名字「Peak」取自「奥林匹克」中的「匹克」。如果生出来的是个女孩,「懒惰的」父母会为她取名「奥林」。


8 岁时,Peak 从美国回到北京,因为英语好,出国比赛能给大家当翻译,被老师拉进了北大附小机器人队。初中,他又沉迷操作系统,当上了北大附中电脑俱乐部的社长,在那里认识了「俩神人」——后来 Peak Labs 的联合创始人刘昕旸和任东昊。


每天早上,Peak 的妈妈在去中关村大街上班的途中,会顺路把他放在校门口。一路上,担任 IT 公司高管的妈妈会聊起股份、抱怨公司董事会最近在打架。晚上,Peak 下了地铁站,在物理系担任教授的爸爸接他回家,路上就会和他讨论 PN 结的结构、怎么修扫描隧道显微镜。「很好玩,能学到不同东西,科学训练和商业常识。」


2008 年 7 月 10 日,乔布斯向全世界介绍了 App Store。


这是 Peak 人生中第一个决定性时刻。他意识到独立开发者可以从中赚到钱了,热爱写程序,也能让人以此为生。系统更新后,Peak 的手机上就多了那个图标。「那一刻是最切身的体验,很震撼。当时的第一反应就是,我一定要参与其中。」


Peak 一连写了 7 款苹果 App。其中一款是给孩之宝的 Monopoly(大富翁游戏)开发的记账软件,帮玩家记录过路费,卖得挺好。于是 17 岁的高中生由于使用了「Monopoly」这个词,第一次收到了跨国 500 强的律师函。


在 2013 年的一次采访中,Peak 提到了自己的偶像约翰·卡马克(John Carmack)。这个被称为「卡神」的技术天才创立了 id Software,几乎凭一己之力推动了整个 3D 游戏行业的发展,后来成立了自己的太空火箭技术公司,然后加入 Oculus 担任 CTO,在 Oculus 被收购后,加入 Meta 负责 VR 研发。他曾说过,在这个信息时代,客观障碍已不复存在,所谓障碍都是主观上的。「如果你想动手开发什么全新的技术,你不需要几百万美元的资金,你只需要在冰箱里放满比萨和可乐,再有一台便宜的计算机,和为之献身的决心。」


刚满 20 岁的 Peak 对媒体表示,他想和卡马克一样,不断做出很酷的东西,让人们记住我的作品,而不是我这个人,于是我就可以轻松地忙下一个作品了。他总结道,一定要「快折腾,小折腾,迅速失败再折腾」。


2010 年夏天,高二的 Peak 开始折腾他的第八款 App——猛犸浏览器。「白天画草图,晚上写代码」,他在 3 个月内更新了 3 个版本。快捷,流畅,功能强大,标价 $1.99 的猛犸 3 一经推出,3 天内达到了 12 万下载量。2012 年初,他花了 48 小时开发出了 iPhone 手势输入法 Rasgueado 1.0,又花了 48 小时更新了 2.0 版本,售价 $0.99。


在自己喜欢的东西上,不用刻意去努力,他天然地会投入很多精力。程序员什么时候会真正感觉到困?是他站起来上厕所,回来的时候,才发现自己困了。但只要你一直在全神贯注地做事,「你几乎不会困,直到自己身体极限。」


在被带到徐小平老师面前时,猛犸已经卖出了 30 万份。当徐老师走进真格的国贸办公室时,Anna(方爱之,真格基金创始合伙人兼 CEO)问 Peak,你知道这是谁不?


Peak 没认出来,「我不知道。」


Anna 又问,你知道徐小平吗?


Peak 诚实作答,「我不知道。」


徐老师尴尬而不失爽朗地一笑,介绍了一下,一拍自己脸,「难怪没有预想中的惊喜效果!」Peak 也「尴尬而不失爽朗地回应」。


徐老师向 Peak 指出两点,一是承诺让 Peak 自由发挥,哪怕失败了,只要继续创业,「我们仍然出钱」。真格大幅减少了合同中的约束条款,最后只剩下几页纸。但真正让 Peak 印象深刻的是第二点。徐老师说,「你要想清楚,你这事不成功便成仁。」


第一次见完真格,Peak 还没有做出创业的决定。Anna 说,没关系,我们一起去美国玩一玩,就带着 Peak 去了一趟湾区。


他们一起参观了移动互联网浪潮中的第一批硅谷创业公司——大多从很小的独立开发者起步,成长为充满活力的组织——例如 Evernote 和 Bump。前者在当时的硅谷如日中天,后者是一个碰碰手机就能交换联系信息的 app,2013 年被谷歌以约 3500 万美元收购。


Anna 还带 Peak 去了扎克伯格起家的房间。那个房间被一些湾区的华人租下,用来举办黑客马拉松(Hacker house)。「就是氛围到了」,在那个房间里,Peak 决定发起 Peak Labs,成立自己的公司。Anna 对他说,「Peak, you’re gonna be rich.(匹克,你会变得很有钱)」


在西海岸的金色阳光下,Peak 看见了一个初期公司的物理形态。「好像 CEO 不过就是和大家坐在一起写程序,也没有太大的区别」,脑中的疑虑和担忧消失了。还有很多很酷的 T 恤。Peak 着重强调,「一定要有很多的零食。」


一回来,20 岁的 Peak 就印了自己的 T 恤,接受了真格和红杉的投资。徐老师说,你得给公司想一个好名字,要么就叫 Peak Labs。「我说,挺好,挺好,挺好。」


19 岁的 Peak 在扎克伯格起家的房间

18 岁的扎克伯格和朋友在同一间房间里创立了 Facebook


03

洁癖


作为一名忠实的果粉,Peak 几乎拥有所有的 iPhone——和它们的包装盒。每换一代 iPhone,他都会留着原厂的膜、3C 认证标志、苹果贴纸,用酒精消毒、擦干净,再原封不动地放进包装盒收起来。电子产品的包装盒他一个也没扔。4090 的显卡盒子,「那么大一个」,Peak 放在架子上供着。


家里所有的东西都用无印良品的塑料盒收纳。统一大小,机打标签。「肯定是机打的,我字很丑」。


在 Peak 的对外发布上,你也可以感受到这种强迫症。猛犸 5 浏览器的宣传片,画图、配音、翻译、制作、发布,都是他一个人完成。Peak Labs 发出的公众号文章,所有的字体、行距、排版,他都会负责把关。


以及,所有从 Peak Labs 官方渠道的出来的文章,「我能保证一点,英文和中文之间一定是有空格的。」甚至你碰巧有他的微信,和他聊过几句,如果你往前翻聊天记录,会再一次证实他对空格近乎严苛的恪守。


他有强烈的技术洁癖。Peak Labs 的每一行代码,在进入主干分支前,Peak 一定会再检查一遍。他永远是代码贡献量榜上的第一名。「我知道有些人水平比我高,但我一定要过目所有代码。」


好的地方是,很多潜在的问题被提前捕获并解决掉了。但 Peak 因此成为了产品迭代的瓶颈,「浪费了大量时间。」


这种特质也体现在他对产品的选择上。在 2012 年 Peak Labs 的第一次发布会上,和猛犸 5 一同亮相的还有一款名为 Zine project 的产品。Peak 为 Zine project 定位,「有无限可能」、「一旦成功,不亚于谷歌对世界的颠覆」。


Zine 想做的事情,是根据用户的视角进行推荐信息。从技术上来说,和今日头条做的事情一样。但张一鸣改变了一件事,看见技术后,「他把搜变成了推」。而 Peak 看见技术,想把搜变成更结构化的、更具美感的搜。


一方面,他自嘲「境界不够」,另一方面,他不想做强推给用户的信息流。Anna 批评他身上的一些洁癖,创业者不该有。


Peak 指出自己的另一个缺点——「亟需改正」——他会天然逃避自己不喜欢的东西。他喜欢和电脑打交道,不喜欢管一大堆的人。


一开始创业,他觉得三个人能就足够做好很多事情。一直到最后,Peak Labs 的人都非常少,人效极高。招进来的都是想干事的、技术够硬的人,离开 Peak Labs 时都说,「我要去追求学术梦想」,无一例外。逐渐地 Peak 意识到,团队是必需的,人才是公司运作的基本单位,就「逼着自己去改」。


但从另一个角度看,洁癖与高标准的背后是极度的责任心。对 Peak 来说,创业没有回头路,一旦背上了这份责任,就该背,就要做到最好,而且一定要坚持到最后。平日那些半途而废的人,他挺看不起的。


后来他又会想起那句话——「不成功便成仁」。一定要对得起员工、对得起股东、对得起客户。在 GPT-3 刚刚诞生时,他没有立即踩下刹车Anna 说过,创始人都没放弃,我们为什么要放弃?Peak 反而觉得,所有支持我们的人都没有放弃,我们也不能放弃。「我们必须要自我催眠,并且骗自己能成功。


2020 年,Peak 在重构 magi.com 的代码


04

极客依旧


31 岁的 Peak 微胖了。十二年前,他曾在知乎问题「季逸超是一个什么样的人?他有什么轶事?」下挥笔作答,「在他 20 岁前夕,季逸超同学在知乎社区被人肉,一个同名 ID 写下了一个回答,预言季某可能会脂肪肝、高血压、糖尿病、颈椎病、腰间盘突出、坐骨神经痛。」


青年 Peak 面对少年@季逸超的预言,他表示「完全命中」,只是血糖不高反低。


吃是很重要的获得快乐的途径,除去过敏的海鲜,他什么都喜欢吃。中午吃饭,他喜欢在 B 站上看「中年男人最爱的政论节目」。


晚饭就不一样了。吃晚饭时通常已经很累了,工作了一天,就喜欢看看动画:最近他的电子榨菜是《古立特宇宙》。


每天,Peak 会打 1-2 个小时游戏。和所有年轻人一样,他玩《魔兽世界》花了「很长很长很长的时间」。曾经他也玩《原神》,喜欢优菈,「物理系毒瘤,多好」,后来他弃坑了。「《崩铁(崩坏:星穹铁道)》我还在坚持。」


在坚持的事情还有写代码。每天醒着的三分之一时间,他会雷打不动地坐在电脑前敲击键盘,以保持对一线的手感与觉知。曾经很钦佩的一些前辈,在聊天的只言片语中发表见解,Peak 会敏锐地感觉到,完了,这人已经脱离一线了。「要时刻提醒自己不要活成讨厌的大人。」


以前,Peak 看到一个好玩的软件,他会拉到下面去点「你可能还喜欢」的 app,往下点两层,一个一个下载来试用。他意识到人的荷尔蒙确实很受年龄影响,现在的他没有这种精气神。「但你还得强迫自己去写、去试、去用。」


保障自己做到这一点的重要机制是,Peak 非常依赖 newsletter。他打开邮箱,里面全部都是 AI 相关的订阅内容。每周公认的重要论文,他一定会读。开发者投的广告、Product Hunt 上比较火的产品,头部的他一定会用。因为这是一群人绞尽脑汁想到的东西,「你可以窥探别人思考的成果,很有意思。」


Peak 严格地控制自己的信息摄入。他专门买了一部手机试用新 app。随身的手机上,app 一旦不好就卸掉,「留下来的都是大逃杀的胜手」。


他举起手机,展示了他的主页——主页上的 app 只有一屏。还有一些 app 在资源库里,他又打开了从 A 到 Z 的资源库,轻轻滚动了两下,就到底了。


作为信息学的第一性原理,他把所有的媒体当作通知来用——看见任何报道都往前看一层,真正摄取信息,要回到源头。


开了一次发布会后,Peak 决定摒弃通稿,发布会也不再开了——「不如每一句话都是我说的」。削薄媒介的中间层,起码控制了最终受众所接收到的信息。后来每次发布产品,知乎他一定是第一个抢答,甚至自问自答,「你先得占领一个高度,哈哈哈,一楼定调。」


他再次嘱咐我,「发文后马上把链接给我,我要抢一楼,因为一楼定基调。」


人的塑造和大模型有什么区别呢?


Peak 说,「其实我跟整个世界的交互就两个途径,一个是我看到的,一个是我输出的。如果这旁边,空气中有一个机器人,它每天和我看一样的东西,和我说一样的话,它久久地训练,它就是我。所以我对我每天看到的信息还是比较在意的,因为这是世界塑造我的唯一的渠道。」


在 Magi 关停之前,他也塑造了这个世界。2021 年,Peak Labs 向国内外 40 多家研究机构公开了 Magi 的数据集,下载量达上万次。


其中,开放领域信息抽取(Open Information Extraction)数据在此前的中文 NLP 学界处于空白,Peak Labs 提供了唯一的大规模数据集。另外一套经过清洗的网页数据集,直到今天很多大模型训练者还会使用。


虽然 magi.com 的功能都关停了,但网站还在持续运营,Peak 一直在个人续费。「会一直给它续到天荒地老」,永远留存一份赛博骨灰。


Peak 还在网站上故意留了一个「联系我们」的邮箱入口。关停两年后,商务邮件渐渐少了,但每个月还能收到 7-10 封粉丝来信,「快回来吧」、「yyds」、「今天你们回来了吗?」,诸如此类。他很感动。


他的偶像还是翰·卡马克。2022 年底,这位传奇程序员创立了 Keen Technologies,宣布从 Meta 离职,全身心投入 AGI 研发。从游戏、火箭、VR 到 AGI,他称之为职业生涯的「第四阶段」。


在 23 年初的一场访谈中,卡马克说,他坚信,实现 AGI 程序的源代码,一个人就能编写,规模是几万行。Peak 在朋友圈转发了这句话,「哇,这就是真正的 hacker 该想的事情。」



更多阅读

一个 AI 创业者的反思、观察和预测|此话当真 EP04




「00 后狠人计划」仍在持续招募中

扫描下方二维码

和我们聊一聊



欢迎一切有想法的年轻人

无论羽翼是否丰满



监制|Jiafen

编导|Tammy & Shiyi

拍摄|Max & Tammy
剪辑|Mathew
文|Wendi


推荐阅读


继续滑动看下一个

季逸超 Peak:AI 竞泳十年|Z Circle

与你同在的 真格基金
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存