查看原文
其他

经验主义的胜利,8万人在线的科大校友ChatGPT论坛

关注ChatGPT的 中国科大校友创业投资论坛 2023-04-19

中国科大校友创业投资论坛

让创业的科大校友没有难融的资

————


2月19日,雨水,中国人称水为财(才)。


18日,雪夜,一辆越野车载着几个科大“疯子”, 许四清(815)、李亚(8710)、熊辉(9010)、黄汪(9202)、戴若犁(9705)雪路上几经周折,“杀”到了静谧的密云北庄·荷畔小墅。


他们是冲着ChatGPT来的。


窦剑文(854,海默科技创始人)嘎吱嘎吱踩着雪,一如既往地像迎接亲戚一样把大家勾引到到火热的壁炉前,一场没有GPT的围炉夜话就这么chat起来了。


在此之前两小时,梅涛院士(9610)在雪夜里亲自驾车,带着两位校友沿着盘山路摸到了北庄·荷畔。


谁也没想到,等待他们的是第二天8万人在线的一场科技思想盛宴。

北庄·荷畔 摄于2023年2月19日论坛结束后,照片背后出门直通哲学家小道

一言不合就chat/叉

北京话,叉架即约架。三天前的夜里,中喝大群里有人提议搞个ChatGPT线上讨论,11点半,许四清接到了群主窦剑文的电话:“许师兄,咱们搞个论坛吧”。一拍即合,一天之内,这场中国科大校友创业投资论坛办的“全球科大校友ChatGPT论坛”就发出了帖子,发言和对话嘉宾可谓大咖云集,可惜的是,还有很多科大校友高手时间凑不上。几天之内,哼哈二将忙里偷闲带着海默科技、阿尔法公社、云岫资本的小伙伴们就把论坛筹备完成,褚沁蓉、口莉师妹现场操办,看不见的电波从荷畔开始,把全球校友们chat到了一起。



一本正经地“胡说八道”

北京时间2月19日早上09:30,会议主持人窦剑文最先推出了欧亚科学院院士,原微软亚洲研究院副院长李世鹏博士,当然,还有一个重量级的从硅谷发言,这是后话。李院士为大家描述了ChatGPT的前世今生,从GPT-1到ChatGPT的演进过程,指出人与机器自然交流的恐怖谷已经被跨越,ChatGPT能够准确了解人的意图,答案有逻辑性且有多种技能,但既聪明又擅长套路,甚至聊着、聊着就开始学会“拍马屁”了。在现阶段,部分能力还有待提高,李院士诙谐地形容它能一本正经地“胡说八道”。


经验主义的胜利


硅谷著名科技投资人、《暗知识》一书作者王维嘉(776)在演讲中,从科学和的哲学高度发表了很多精彩观点:


1.只用CNN来做无人驾驶是一条错误的路线,因为CNN是用下意识驾驶,而人类的驾驶应是一个语法过程,Waymo收集了100亿公里的数据,也不敢在大街上走,说明这个路径有问题。


2.Transformer最大的突破在于把原来序列的算法,变成了并行的算法,这样GPU就可以用了,也就让机器一目十行,通过这种方式获取了注意力能力。Transformer本质上是一个提取相关性的机器,吃进去的是数据,挤出来的是相关性。


3. 大模型通过了图灵测试和维诺格拉德测试(反向证伪)这两大人工智能的能力标杆,但我提出一个新的“裤子大(科技大在合肥话中的读音)测试”方法,即任意一个牛逼的大语言模型,总能找到一个死穴,结论是模型无限逼近AGI(通用人工智能),但仍然无法达到。原因是人类对自己的智能是怎么工作的都不真正了解。


4.现在似乎GPT已经有了逻辑能力,有了对因果关系的把握。那么如果相关性都穷尽以后,它的终点是不是因果性?这个猜想还并没有答案,但是GPT有可能帮助人类揭开认识论的奥秘。人类智慧的最后密钥就藏在语法和数学当中。现在的成绩,是经验主义的胜利。


5.GPT将提高人类谈吐均值,降低思维方差。谈笑皆鸿儒,思考全白丁。


视觉生成技术已处于应用爆发前夜


加拿大工程院外籍院士,原京东副总裁,IEEE Fellow梅涛(9610)为大家介绍了AIGC从文本到视觉的发展过程:AIGC正在深刻变革人类内容创作的方式和过程,它可以激发人的创意,同时大幅的提高内容创作的生产力。未来十年,AIGC通过人工智能辅助人类产生海量内容,让内容生产进入新世代。


梅院士进一步指出ChatGPT背后真正的技术变革是从CNN到Transformer,Transformer通过自注意力机制,不仅在文本方面做到更好的encode和decode,在视觉领域也能帮助提高对内容的理解力。梅院士还表示,图片和视频的建模,相比文字是更有挑战性的,视觉的AIGC相比文本大约滞后3年时间,但视觉生成技术已经处于应用爆发前夜。


据可靠校友透露,梅涛院士准备干件大事儿。


到十点一刻的时候,许四清和窦剑文耳语了一阵,原来他们突然发现,各平台同时在线的人数不知不觉已经超过了一万人。


It’s time to jump in,if not all in.


大湾区数字经济研究院工程总监,原微软(中国)操作系统工程院院长谢育涛揭秘了ChatGPT的训练过程:第一阶段SFT(有监督的微调,解决鸡同鸭讲),第二阶段RM训练(打造终极分歧争端机),第三阶段拿着争端机去训练,第四阶段,迭代,训练出更好的奖励模型(reward model)。总之,模型被真实用户使用特别重要,收集的任务越真实,reward model越好,效果就越好。


谢育涛随后总结,在趋势上: ChatGPT是AI时代的重要节点,NLP技术可用了。It’s time to jump in,if not all in.


在技术上:下一个了不起的模型可能今年就会出现,预计会强调多模态,从文字到图片、声音、视频。


在变革上:不止一个ChatGPT会出现,还会有爆炸式的的海量内容涌现,改变信息时代的内容格局。

在机会上:应用,定制模型,超级大模型,未来模型都会有机会。


他们在用ChatGPT“飞鸡”吗?

谢育涛的演讲掀起了大家极大的热情。许四清这时上台和窦剑文客串了一下,他总结谢育涛对ChatGPT训练的过程是四阶段,第一阶段是鸡同鸭讲,第二阶段是鸭训练鸡,第三阶段是鸡自学,第四阶段鸡变成飞鸡。现场掀起一阵哄笑,气氛愈发热烈。


AIGC是商业上离我们最近的机会


云天励飞联合创始人、首席科学家、IEEE Fellow王孝宇首先引用了谷歌CEO“劈柴哥”的一句话:AI对人类进程的影响胜于火和电。他认为现在的新趋势,即自动化AI已经极大降低了所有的行业应用人工智能的门槛。他还引入了Data-Centric AI概念:过去Data Driven的AI,大家给模型喂数据,最终是想得到模型,现在我们意识到,最大的资产不是模型而是数据,模型可以重新训练,数据丢了就不能复现模型,模型也没法再进步。


王孝宇强调AIGC是目前AI投资最火热的方向之一,也是商业上离我们最近的一次机会,它并不是一个公司融了大钱然后去瞎折腾,而是有实实在在的收入。


ChatGPT的能力边界


阿尔法公社创始合伙人许四清的主持下,三位在学术和商业上有大成就的科大校友就ChatGPT的能力边界进行了大讨论。大家自我介绍后,许四清的自我介绍如下:我们投资标的里有差不多1/4是科大校友。


梅涛博士首先发表观点,他认为Google和OpenAI的区别在于,Google是双向模型加fine tune,而OpenAI是大规模暴力预测模型加prompt。这种差别的原因是OpenAI非常执着的追求AGI,属于大力出奇迹,但这并不代表OpenAI一定比Google更先进。


许四清echo了梅涛博士的观点,他认为OpenAI是具有硅谷精神的创业公司,它这种孤注一掷单点突破对于产业的贡献很大。接着他又把ChatGPT对行业的影响这个话题抛给了人本智汇创始人、CEO,原凤凰网总裁李亚


李亚认为ChatGPT带给人们的震撼不下于iPhone出现的时候,因为它不仅是帮助B端降本增效,而且在C端直接对用户带来冲击力,它在语义理解和语义生成方面,某种程度上不下于普通人类的智慧水平。他同时介绍,自己的创业公司做的是智慧助手的关键高频内容的定制和生态。


对于许四清的灵魂拷问:如果华为、小米、华米自己用ChatGPT把这个事情做了,你怎么办?李亚指出人机协同和交互的体验是重点,交互体验比单纯做一个提升效率,降低成本的工具,意义要大得多。


华米科技创始人、董事长兼CEO黄汪(9202)认为ChatGPT帮助一些小型创业公司,在很多方面(例如市场和研发)与上千人,甚至几千人的大型公司水准拉平,比如他花一个小时就用ChatGPT重写了公司的mission和vision,也在内部讨论可以用ChatGPT自动的做智能手表的表盘。


许四清继续追问梅涛博士,OpenAI这种大力出奇迹的方式是否是未来人工智能最后的路径?


梅涛博士表示追求AGI的路径之一确实是大数据大算力,如果模型足够大,会具备很强的逻辑推理能力,从工业上看,它是路径之一,而他希望看到它的边界在哪里。


最后,许四清透露,阿尔法公社正召集建立“ChatGPT上的应用工场”,占未来应用的窗口机会,以及垂直领域的智能平台,征集科大校友做创业探索。


中国也一定会诞生大模型的巨头


第二场圆桌,诺亦腾联合创始人、CTO戴若犁端泉健康科技创始人陈晓薇云岫资本创始人高超(0225),以及自称“乱入”的香港科技大学(广州)人工智能学域主任、教育部长江讲座教授熊辉一起讨论一个大家都关心的问题——怎么用ChatGPT搞钱。


戴若犁首先提问熊辉教授,AIGC或者ChatGPT底层的GPT模型这样的领域,未来的集中度是怎样的?


熊辉教授表示,如果大模型是一个大的机会,那么在刚开始它不会被一家所垄断,而中国的机会来自于基于中文的高质量的语料数据,如果OpenAI和谷歌会形成国际上的巨头,那么国内也一定会产生一个巨头。而且在大模型包括AIGC这方面,中国的机会某种意义上会更好一些,中国既不缺对框架的理解,也不缺数据的积累,很擅长从1到10的部分。


陈晓薇介绍了ChatGPT可以在健康医疗领域做patient education和doctor education,并向熊辉教授和高超提出问题:ChatGPT离诊断准确快速还有多远?从搞钱的角度,哪一种模式能让业务变得更高效,提高利润率?


高超认为创业公司在大模型不能够cover的,足够深的领域,会有机会,就像互联网时代的互联网+,例如ChatGPT本身就是大模型加人机交互。


戴若犁表示,通用大模型将很多行业的天花板从原来的100分提到了200分,这样让很多行业开始兴奋,又有机会开始“卷”了。


熊辉教授接着补充,在创业做一个商业模式的时候,一定要考虑清楚这个技术的能力边界,特别要关注它的缺陷在哪里,这个缺陷是不是从本质上可以克服的,然后去避开它致命的缺陷,利用它的优点去搞钱。


中科深智创始人兼CEO成维忠云岫资本AI研究负责人沈桦鑫也分别做了主题演讲。


成维忠介绍了从互联网时代的GUI图形用户界面到元宇宙时代的NUI自然用户界面的转变,以及做生成式AI虚拟人需要解决的各类问题。


沈桦鑫则从生成式AI的投资方向,中美生成式AI的投资图谱,以及中美生成式AI的商业化潜力对比等角度对中国版ChatGPT的投资机会进行了富有逻辑的分析。



13点,线上在线人数已经达超过了八万人,过10万次点赞。会议截止,现场的嘉宾们意犹未尽,大家还在纷纷议论着。突然有人想起来说,科大校友们不是有个“莫干山共识吗”?莫干山共识就是科大人携起手来,打一场十年的“群架”,大家笑称,这也算是一场八万人的“群架”吧。


中国科大校友创业投资论坛
以“让创业的科大校友没有难融的资”为己任的中国科大校友创投交流平台,致力于帮助科技创新的校友企业有效链接丰富资金与产业资源。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存