查看原文
其他

未来科技创业畅想 | 5Y 3Sigma小圆桌年度回顾

五源 五源资本 5Y Capital 2023-03-28

 

5Y 3Sigma小圆桌是我们自2022年4月起推出的针对早期创业者的闭门活动。过去的一年里,我们一共组织了八场线上和线下的讨论针对消费机器人、通用机器人、自动驾驶、3D元宇宙、大模型与NLP、AIGC等不同领域的话题,有近百位来自工业界与学术界的朋友进行了观点分享与碰撞。


什么是大模型的技术趋势与应用趋势?

自动驾驶如何重新定义未来出行?

3D内容创作,如何看待模糊与充满变量的机会?

人形机器人?陪伴机器人?什么是消费机器人的未来?

通用机器人距离人类社会还有多远?

AIGC新物种:如何用AI实现创意与生产力的释放?

……

 

5Y 3Sigma小圆桌的初衷,是希望邀请对未来有巨大愿景和疯狂想象力的创业者,一起讨论技术与行业的发展。而5Y 3Sigma小圆桌的命名,是我们相信在每一个时代,重塑人类社会的创新者都在3Sigma之外勇敢追随智识的召唤,而非服从多数人信奉的安全法则。


我们梳理了5Y 3Sigma小圆桌的精彩对话,希望对你有所启发。新的一年,5Y 3Sigma小圆桌会聚焦更多技术与创业话题。扫码文末二维码填写表单,与更多创业者、工业界、学术界的朋友在5Y 3Sigma小圆桌一起探讨未来!


 

 

内容回顾


 



AI+机器人:新一轮颠覆式变革


 

我们认为AI是新一轮10x的机会,会带来新的颠覆式的技术与商业模式变化。我们希望能够找到具有巨大消费跟市场价值的商业市场的领域,和更底层的基础设施型的机会。

——陈哲,五源投资人


机器人感知正在从2D向3D发展,在工业界和学术界适用的3D高精度雷达,结构光等方案在消费级落地今天依旧非常难。对于绝大多数的创业公司而言,遇到的核心问题是数据采集成本,标注成本,硬件成本高到难以承受。如果能搭建一套仿真平台,通过Sim2Real的方式来去做各类场景的预训练,同时用廉价传感器去做Real2Sim的环境获取并进行仿真验证,将能推动机器人行业快速的发展,这会是一个非常大的市场。 

—— 王丛,地平线AIoT&机器人事业部GM




 

相比于车内,室内空间对于机器人的移动、操作、感知提供了更大的空间。随着这两年扫拖机器人普及,对市场也有一个较好的教育,移动技术能力已经逐渐成熟。但总体家庭智能机器人目前还属于简单工具类的产品,未来的轻管家类的家庭服务机器人需要实现可移动,还要实现可接驳,以及集成更多泛刚需的工具能力。 

—— 美团机器人专家

 



3D内容创作:如何看待模糊与充满变量的机会?



 

我们认为3D创作平台应有3D、多人、实时、互动、即时的特征,这需要平台有一个强有力的底层架构及引擎能力支撑,同时为开发者和C端提供完善的开发支持和体验交互。

—— Patrick,Yahaha

 

2000年左右发布3DMax定义了经典的3D模型创作范式,今天AI的发展对于3D模型的创作带了颠覆式创新的可能。但3D模型创作水很深,3D模型的格式、点线面的布局,材质、雕刻、性能的优化,都对创新产品快速冷启动提出了挑战。AI变量以外,新产品有两个明显的用户价值,第一个是在线,在线素材就带来二创,带来了创作者生态。创作者发布模型,交易模型,可以获得收入。第二个就是协同,今天图形起源已经实现了一个飞书一样的多人在线协作模型。 

—— 史海天,图形起源创始人


在3D模型的创作和交互领域,我们发现用户有两大痛点:1、模型质量:UGC内容距离这个最后能交付到商用或者有高消费价值,中间还是有比较大的gap ;2、消费场景单一:3D模型本身其实是比较枯燥的,你就算用AR放在现实中,或者放到一个VR场景里,大部分消费者是简单看一看,目前主流消费市场还是游戏领域。所以3D交互体验的新场景非常有价值,会大大拓宽3D应用的边界。

—— 张萌,172 Labs 创始人


在长期正确短期模糊的早期领域,对创始人路径规划能力提出更高的要求,这其中有3个重要环节:验证假设、快速迭代、Derisk 不确定性。

—— 贺开颜,五源投资人

 




技术、产品、情感,AIGC打开了哪些想象空间



AI生成内容将会经历两个阶段,第一个阶段是AI-assisted GC,更多是AI对现有内容创作环节的优化。受限于今天的技术边界,目前还没有到下一步真正的AIGC,即从整个内容创意的产生、制作过程到反馈和迭代机制、以及生成情感,AI都起到主导的作用。 

—— 陈哲,五源投资人


 


如果说AI产品的重要发展方向之一是往更像真人演进,未来最重要的技术突破还是偏自身智能的方向。机器(AI)可以自主探索,为了获取所处环境的状态及知识,它可以主动发起行动和交流,也可以在行动后反馈它的收获和感受,这个是我觉得一个很重要的突破方向。

—— 李嫣然,前小米技术专家

 

我们现在面临的挑战是,AI的memory不够以及AI本身智能度不够。我们需要把强化学习的智能和自然语言的这套统计意义上的智能某种形式上做一种结合,才能够把整个智能度往前再推进。假设彩云小梦现在的智能度是一分,那我们的目标是把它做到十分,应该还有十倍的可能性。

—— 袁行远,彩云科技创始人

 



AIGC新物种:如何用AI释放创意与生产力?


 

AI生成与NLP能力进化速度明显加快,开放与创意有最大收益。创意型产品出现爆发,但PMF与商业模式尚在酝酿早期。不同于传统替代人工,这次AI革命可能会率先在开放性、具有一定不确定性和错误容忍率的创造性劳动力领域率先实现突破。这对我们寻找新范式来说,是一个启发性的思路。

—— 陈哲,五源投资人


AI辅助创作本质上是一个搜索问题,即如何在AI的可行性空间内找到最可以满足我需求的方案。这里涉及两个变量,第一是可行性空间有多大。从GAN到Diffusion的跃迁带来可行性空间的极大扩展。第二是如何有效搜索,这也是目前大家在用文字/图片等作为prompt进行的探索。

——张宇轩  Artflow.ai创始人




创作的可控性原则是指,创意在输入端要实现可控,而创作要在输出端精准可控。在输入端提供规则并不是说让用户严格按照某种方式去执行,而是提供一个选项,让用户可以以一个较为平滑的认知曲线成长。目前部分用户会因为AI技术产生焦虑,因为它不可知、且目前技术自身对用户的适应能力要求较高。现在的AIGC没有成为大部分人的助力,反而加剧了某种程度上的分化,这可能是很多人始料未及的,但也意味着机会存在。 

—— KABA(于家博)韩国成均馆大学信息学在读


 

AI会取代人吗?很多人可能经常说会替代谁、取代谁,真的没必要有这种担心。技术在任何时代都是不可阻挡的,大众的交流与表达的欲望,以及基于这些形成的文创社区,在未来也必然会长期存在。在这两者都存在的前提下,谈论谁会被取代没有意义,更多的是我们要通过有机的耦合去找到那个齿轮契合的点,让现有的技术和生产力得以解放。AIGC更多是扮演了一个合作的角色,把人从无意义的机械劳动中解放出来,将人的创意和思维能力发挥到最佳。


另外我也希望AIGC在解放专业创作者生产力的同时,也可以降低大众的表达门槛,让更多有想法、有认知和知识积累的人,可以绕过非常高的学习成本直接表达。如同印刷机的出现让宗教知识实现了极大的传播,促成了后来的启蒙运动和文艺复兴,我个人期望AIGC技术也可以为人们带来表达的解放。至于这个时代在将来会被如何定义和书写,让我们拭目以待。 

—— KABA(于家博)韩国成均馆大学信息学在读

 

 


大模型与NLP的应用趋势




为什么要开发一个新的框架呢?因为深度学习模型越来越大,参数越来越多,这时原来设计的在小模型上work比较好的一些架构就不太有效了,需要有新的架构。

 

几千亿、上万亿参数的模型太大了,在很多领域搞个十亿、百亿参数我认为是足够的。训练大模型主要的难点是要有数据,有些公开的数据是大家都可以获得的,还有一些数据就是分别都在不同的公司里面,怎么解决数据的问题是非常重要的,就是说数据怎么能够不转移所有权的情况下,能够大家互相去使用。

——袁进辉,一流科技创始人

 

现在任何一个大模型,面临的一个很大的问题是不够个性化,它是一个完全通用的模型,没有自己的性格,没有行为的偏好。所以很有必要去做个性化的研发,让大模型能够根据你的一些特殊性的prompt engineering等方式能够得到一些特殊的喜好,然后去执行特殊的动作。

——宋鸿涌,启元世界





自动驾驶:

如何定义未来出行?




目前只有Tesla在量产上用到一些Transformer,为了更好用好Transformer,芯片需要增加带宽,但算力会减少,需要做取舍,Transformer在征程6上会有更好利用率。

——苏治中,地平线感知算法研发总监



自动驾驶和机器人是要解决两个大的问题perception和behavior,区别很大,需要在这两个大的问题中间做个接口,比如语义空间,然后用深度学习、数据驱动的方法分别解决这两个大的问题。2015年就有人探索过端到端的自动驾驶方案但太激进,需要在中间切一刀,分perception和behavior两个loop。


Perception:长期看视觉会是基础和主流的方案,在不同车型上再配合不同配置的其他传感器。之前自动驾驶感知依赖lidar,对视觉算法的发掘不够。视觉方案的好处还在于非常scalable,有非常标准的压缩、存储、传输的算法。Behavior:需要搭建通用仿真平台,预测和规划两个问题可以放在一个仿真的框架里。

——赵行,清华大学助理教授

 



什么是消费机器人的未来?



无论从当下还是历史来看,最大的机器人公司都是消费机器人公司,核心是要有一个可以服务几亿人或者几十亿人的巨大消费市场。从这个角度看,自动驾驶电动汽车就是一种超大规模的消费机器人。

 

我们希望能够找到以智能机器人形态,影响一代人生活方式或者给一代人提供精神满足的产品。如果能够做到这一点,一定能够诞生伟大和持久的消费机器人公司,就像历史上出现的最伟大的消费电子公司苹果或者特斯拉一样。

——陈哲,五源投资人


家用场景的机器人可能更非标,需要做的事情、产生的价值也非标。但在to B的场景,像公司食堂、办公室等场景,可发挥的空间更多。另外服务机器人不同于工业机器人,它可以有相当高的容错率,比如机器人捡垃圾或者擦桌子,如果捡错了或者没擦干净,not the end of the world,就会有它的生存空间。

——许倬,Google技术专家



中国公司在陪伴机器人领域展现了一种全新的定义产品的能力。未来十年机遇和挑战是并存的。中国有最大的消费市场和最成熟的机器人产业链,以及我们把陪伴机器人的4项能力拆开,感知、移动、认知/情感和操作,那么在感知和移动上面其实已经有了比较清晰的迭代发展,但在认知/情感以及操作上面其实是不太清晰的,挑战也非常明显。

——贺开颜,五源投资人

 

陪伴机器人是一个全新的赛道,用户可能还没有定义出他到底想要什么,所以相当于做产品的人自己去想象一个东西,放到市场里面去试错。陪伴机器人的核心还是在于陪伴本身,形态并不是关键。机器人这个概念能不能增强陪伴的属性,是陪伴机器人最核心的点。

——宋君毅,大象机器人创始人


Tesla做通用机器人的设想是挺宏伟的,但我觉得真正的第一款通用型人形机器人,多半不是一个大而全的东西,而是切香肠型的、部分功能逐渐渗透。

——张笛,本末科技创始人




通用机器人距离我们有多远?




通用机器人和当年的智能手机,从几个维度来讲有相似之处。在算力上,今天已经过了简单的CPU算力增加的阶段,由于深度学习的发展,出现了大量的高性能的边缘的AI处理器。在传输层,5G这种低延时技术的出现让机器人在传输上较10年前有巨大的改进。更关键的是交互层面,像特斯拉在积极地研究人形机器人,试图在机器人的交互场景里面形成统一,因为只有人形机器人才有可能在人类所生活的环境里非常理想地适应不同的交互场景。

——陈哲,五源投资人



 


通用机器人想要使用起来,最关键的是场景,而场景要有很强的AI去赋能。仅仅一个机器人可以走起来、拿东西是相对容易解决的,但要它在一个开放场景去做很多事情的话,要有巨大的AI能力才能真的跑通。而特斯拉拥有的无人驾驶的各种数据、芯片的基础以及顶级的研发能力,是很多公司可能都不具备的。

——张巍,南方科技大学教授


通用和专用机器人是两条发展曲线,专用机器人的护城河在于它的性能是否具有优势,而通用的曲线一定是上扬的,一开始两者是共存的,但当通用可以打死专用的时候,可能会以极快的速度,就像当时手机市场的商业逻辑。那么通用机器人会在哪一年真正超越专用的曲线,可能在通用落地之后怎么也要5年以上。现在很难具体说,不同细分场景也是不一样的。

——王启斌,京东物流末端配送高级总监

 

 

 

 

 

关于3Sigma小圆桌

 

在正态分布中,当一个样本与平均值的距离超出了三个标准差(3Sigma),它就成为了异常的离群者(outlier)。但变革往往始于人们惯常关注的区间之外。在每一个时代,重塑人类社会的创新者都在3Sigma之外勇敢追随智识的召唤,而非服从多数人信奉的安全法则。

 

3Sigma背后是五源长期秉持的信念,创新的本质是走出范式的边界,即使那意味着他人眼中的疯狂。


扫描二维码或点击阅读原文,报名新一年的5Y 3Sigma小圆桌,与更多工业界、学术界的朋友与我们共同探讨未来!







五源寻找、支持、激励孤独的创业者,为其提供从精神到所有经营运作的支持。我们相信,如果别人眼中疯狂的你,开始被相信,世界将会别开生面。


BEIJING·SHANGHAI·SHENZHEN·HONGKONG

WWW.5YCAP.COM



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存