华科出身,师从贾佳亚,从鹅厂到创业,90后如何登上胡润U30?
作者 | 八宝粥
出品 | CSDN(id:CSDNnews)
随着AI 技术的发展,国内外涌现出一大批基于AI 落地的工业项目,例如无人车,巡检机器人、仓储智能系统等等。2019年,一家以 AI 视觉为主要技术、专注智能制造和超高清视频的企业诞生,该企业由香港中文大学终身教授、IEEE院士贾佳亚主导创立,核心团队深耕计算机视觉领域20余年。这家企业就是思谋科技,本次采访嘉宾,思谋科技联合创始人、技术负责人刘枢。今年11月,刘枢作为先进制造业的杰出青年企业家,入选《2020胡润Under30s创业领袖》榜单。
内容要点
工匠精神,如果这个事还能看到哪些地方可能没有做好,或者觉得有提升的地方,那这个事其实还没有完成;
身份转变后,更多地考虑宏观技术架构,如何把握技术方向、让公司的技术保持领先优势;
智能制造和超高清视频,选择两条赛道列入国家“新基建”,前景明朗;
项目落地,保障高准确率和召回率,提供客制化解决方案;
深耕专业领域,努力做到行业头部。
明确目标, 把事情做到极致
CSDN: 从个人经历来看,您在大学就是本科特优生,专业排名第一,25岁博士毕业,可以说是不折不扣的学霸。请问您是如何保持优秀的?
刘枢:首先是要明确目标,为了目标不断努力。如果大家希望能得到一个好的成绩的话,肯定是在考前认真复习,做足准备。另外既然是决定读博,有好的成果出来,就需要花时间去学习已有的方法、思考如何创新,沉淀出自己的知识。这一点和贾老师之前跟我说的“工匠精神”十分契合,“工匠精神”对我的影响也比较大,当时贾老师说:“做事情一定要做到极致!如果觉得这个事自己还能看到哪些地方可能没有做好,或者说觉得还有能提升的地方的话,这个事情其实还没有完成”。
前面提到的是内在的部分,其实外在的环境也非常重要。在贾老师的团队当中,师兄弟们差不多都是各个名校的第一名,有些同学已经有了文章,有些同学手握 ACM 金牌,都有非常强的点。和优秀的同学一起学习交流,就是 push 自己不断变强,对自己有要求,就会不断进步。这种氛围和环境都是可遇不可求的,和他们一起读书、在思谋共事,我觉得非常幸运,也非常享受这个过程。
CSDN: 很多还在读博的朋友还在发愁论文和毕业,作为 20 余篇论文的作者和顶级学术会议 NeurIPS 和 ICCV 的审稿人,这方面有什么经验可以和大家分享呢?
刘枢:这方面我感触很多,做研究一定要沉下心来,不能浮躁。Research 这个词,拆开来看就是反复地 Search,反复搜索,本身就告诉大家,这个过程不会一帆风顺,而是一个需要不断尝试、失败再尝试直到成功的过程。如果遇到一点问题就放弃了,肯定做不出好的工作。举个例子,我当时在打 COCO 比赛的时候,第一步需要复现一个经典的工作,Mask R-CNN,花费了很长时间,结果还是有零点几到一个点的差距,为了这个问题花了大概一周的时间,不断寻找问题到底出在哪里,研究后期我做梦的时候都在 de 这个 bug,非常玄幻的是我梦到了一个位置,而且真的就是这个地方的问题。所以我觉得一定要投入进去,认真去做、反复研究,很多时候问题自然就能解决了。
另外我认为要多想、多试。我也经常和同门师弟师妹讨论问题,给他们一些建议:发现问题的时候一定要大胆假设小心论证,敢于想新的问题、新的点,而后自己通过做实验,把自己的假设验证成功的时候,就很有意义,两者结合起来就能得到一个好的效果。关于论文的话,也不必太过发愁,要享受研究过程,做出好的研究,发文章也是自然而然的事情。另外我认为发文章也不是衡量一个博士能力的唯一标准,读PhD 也是培养自己去发现问题、分析问题和解决问题这样一种能力,这是一个博士核心的能力点,只有掌握这一套方法论,才能担得起 PhD 这个 Title。
角色转换,万变不离其宗
CSDN: 您从腾讯的高级研究员到联合创办思谋科技担任技术负责人,经历了怎样的心路历程,对于身份的转变有什么体会?
刘枢:在腾讯的工作会更加具体,主要是自己或者一个小团队一起做事,不会特别宏观,后来联合创立思谋科技,作为技术负责人,会考虑更加宏观的问题,这时候责任和压力就更重一些,目前考虑的肯定是宏观技术架构,如何让我们的技术体系保持先进性和可扩展性。同时必须要预见技术发展方向,让公司保持技术优势。
这个层面主要还是我们或者我自己对于技术的把握和理解,如何让技术优势实际地去服务公司的产品和落地项目。我们的技术要打造成什么形式?比如单点工具或者线性工具链,或者是更加整合的一个平台。如何降低交付成本,提升交付效率都是需要从更宏观的层面去考虑的。当然还需要考虑怎样提升产品易用性、泛化性,还有在最终的结果上超过对手。这都是目前考虑的问题。
此外还要考虑我们的技术如何配合整个公司的战略方向,提前做好技术布局和支持。总体来说,现在考虑的事情更加宏观,压力也更大,但也更有激情。因为我觉得把这些事做好之后,整个公司技术研发的同学都能够非常开心地工作、快速地成长,还是非常有成就感的。
CSDN:计算机视觉在工业应用和实现,和在学术界或者比赛当中解决问题的情况对比,有什么异同?
刘枢:工业应用主要是关心技术产品能否满足客户最终要求,比如要求达到某个准确率、召回率,完成时间等等,更多的是考虑能否达标,而且解决的也是杂糅的问题,比如我们会发现数据集当中有一些长尾分布、小样本或者脏数据问题,还有如何去增量学习等等。我们为了最终的指标去不断解决问题。这个和打比赛比较像,因为打比赛也是给出数据集和最终的指标,我们对目标结果去做优化,和工业界的追求的目标是一致的。
而学术界发文章,更多的是去解决一些单点问题,比如前面提到的长尾分布、小样本、脏数据等等,它们本身就是一个个研究的 topic,有很多值得研究的地方。许多文章只是为了去解决一个问题,而且,发文章也不仅仅是为了追求最后的性能怎样,文章本身的创新性也是非常重要的衡量标准。
在发现问题、分析问题、解决问题,提升性能这些方面的方法论都是相通的。工业应用中解决难题其实也是很好的研究工作,我觉得计算机视觉本身就是偏实践和应用的学科,学术界和工业界没有那么割裂,在工业界也可以做出非常好的一些研究成果。
选择赛道,突破算法局限
CSDN: 思谋科技选择了智能制造和超高清视频两条赛道,这种选型是出于怎样的考虑?
刘枢:我们公司在 19 年底成立的时候,就已经选择了这两条赛道,当时我们是基于对市场判断和技术的把握做出的选择。今年年初,国家发布了“新基建”重大战略,智能制造和超高清视频这两个赛道均属于“新基建”领域,我们非常激动,觉得在做正确的事情。
选择智能制造的原因是这样,制造业考虑的是怎么把东西造出来,如何做好,然后提升自动化率,怎样进行智能化制造。产业转型升级是一个很大的需求,疫情期间制造业受到了非常大的影响,在复工复产的时候,如果产业自动化率高、需要人力少的话,就非常容易。目前大家可能都是用 AOI 机台,加上机器视觉的方法进行缺陷检验,随着国内外制造业巨头对于品控要求的升级,整个行业的品控要求也不断提升。这时候引入 AI 来解决之前机器学习解决不了的问题,就是水到渠成。整体来看,我们认为在智能制造方面有很大的市场规模,对于 AI 导入的需求也越来越高,是一个很好的切入点。
关于超高清视频,我们可以把 5G 看作是一个管道。随着技术越来越成熟,管道越来越多,里面的水或者叫做媒介,就是视频。此次疫情原因也引爆了居家办公和娱乐的热情。居家办公当中,支撑视频会议重要的技术就是视频处理,娱乐也一样,比如我们有 4k 屏等高清的硬件设备,就需要有片源,超高清视频的需求目前不断增加。以居家娱乐为例,我们可以在传输当中使用更低的码率和质量,在端侧进行超清化处理。视频会议也一样,我们如何保证端侧的画质和传输的效率,如何对视频的内容有较好的理解。
无论在智能制造还是超高清视频领域,我们都有雄厚的技术积累,加上巨大的市场前景,我们就选定了这两个最重要的赛道。
CSDN: 今年早些时候贾佳亚教授曾经谈到通过AI体系架构的研发和落地,突破单一算法能力升级的局限,帮助产业客户实现全面数字化、自动化和智能化。思谋目前提供了哪些产品和解决方案,有哪些成功案例可以同大家分享一下?
刘枢:我们在智能制造和超高清视频上,目前有两个较大的产品,智能制造的 SMore Factory 和超高清视频的 SMore Media。
SMore Factory,主要是针对工业场景中制造过程、质量检测和设备维护等环节的问题,提供全流程一站式的赋能和管理能力。这里面包括两个形态,一个是叫做 SMore ViMo (Vision Inspection and More) 的一个软件平台,另外一个是端上的一个智能的硬件,叫做 SMore Edge。
关于SMore ViMo,我们提供整套软件平台,它包括物体分类、缺陷检测、图像分割,还有 OCR 这4个比较核心算法。软件平台本身除了 AI 算法能力之外,也能够满足整个工业生产的需求。比如集中式项目管理、分布式的数据存储,包括数据标注,客户也可以自己去训练模型,最后去根据能够把训练的模型能够做到一键的部署去测试等等这些业务的需求。对于比较难的算法的问题,我们会派出优秀的算法工程师提供客制化的解决方案,然后可以再把它打包放到 SMore ViMo 里面去,作为我们最终的一个交付形式。
SMore Edge 主要是一个边缘侧的一些智能的相机等一些智能硬件,主要是为了解决像扫码 OCR 等进行智能识别的一些需求,除了软件层面,我们现在也有一些硬件的 AOI 机台,例如我们在 VisionChina (中国机器视觉技术展览会) 也展出了我们的晶圆外观智能检测设备,整个内外的这种方式,我们能够提供整个硬件的 AOI 机台在打包我们自己的 AI 的算法方案,然后完成一个整套的解决方案。
超高清视频方面我们的产品是 SMore Media,是从整个视频的内容的生产到呈现的全链条 AI 解决方案,包括画质的处理引擎、超高清一体机以及智能处理器,这个方案能够提供到端的图像和视频的画质增强能力,能够根据具体一个场景去选择最合适的方案,提供云上的部署以及端侧的部署等不同的交付场景。
我们在3C、新能源以及汽车等行业已经有一些具体的落地项目,例如我们为一家国际知名的3C 巨头 ,落地的多种 AI 外观缺陷检测项目,包括 20 多类缺陷的外观识别,最后实现召回率在 99.6% 以上,误差率在 2% 以下,高质量地通过了验收。这里只是简单举个例子,更多案例在我们网站上也有具体的展示。
积累人才,蓄力提速布局
CSDN: 作为思谋的技术负责人,思谋建立技术团队有怎样的选择标准?
刘枢:首先,优秀的人才是我们最宝贵的资源,我们最近也在大力招聘,选择的标准,首先最重要是一定要志同道合,认同我们的文化价值观。
其次,整个的创业过程,一定会遇到很多“坑”,可能有一些艰难时刻,这时候有共同的文化认可,大家才能团结一致,把事情做成。所以我们把价值观的认同摆在第一位。具体到个人的品质就是要踏实肯干、实事求是,因为技术本身是一个比较客观的,做的时候一定要脚踏实地,千万不能飘,另外一定要清楚自己的优势和劣势,尽快取长补短,把自己的一些缺点或者说欠缺的地方补上来,这才是一个比较好的技术同学所需要具备的一些品质。此外,我希望我们的伙伴对技术本身一定要有追求,不能说浅尝辄止或者非常容易自满,随随便便做了一个东西,就觉得做得非常不错了。其实很多时候还有很多成长和提升空间,大家一定要对自己有一个明确的认识。
最后,我觉得如果有很强的专业背景当然是最好的,属于锦上添花的事情。如果没有的话,我们也很乐于去培养像上面提到的踏实肯干,学习能力强,同时对技术有追求,能够不断去提升自己的同学,这些都会是很好的候选者。
CSDN:思谋科技目前在深圳、上海、香港、苏州都设立了研发与商务中心,同时也交付了多个境外项目,推进全球化商业步伐。请谈谈思谋下一步的发展规划。
刘枢:发展规划主要是两个层面,首先我们会继续加快招聘步伐,持续地加强对于研发、销售人员,尤其是整个业内顶尖人才的招聘力度,尽快去培养和壮大骨干队伍,包括一些中层管理等,来适应我们整个公司的发展需要。这方面我们后续也会重点关注、重点开拓。
另外是商业层面的布局,目前我们在海内外都已经有了一些初步的点,一方面会继续重点开拓海外的业务市场,对于海内外两个市场相关行业的扩展我们也会进行提速。前面提到,我们已经 3C、新能源还有汽车等行业有一些项目交付完成。此后将在这些高端制造业里面继续深耕,尽量把自己做到这个行业里面的头部。我们将在落地的行业中继续打磨自己的产品,呈现新的技术,也会快速地去复制到一些相关的行业里面去,去接触到更多的客户和更多的场景。对于海外的,我们也会用同样的方式快速地去复制迁移和场景落地。
推 荐
CSDN公众号全新搜索技能上线啦!
只要在公众号后台回复消息
就能自动回复想搜索的内容啦!
猜猜回复“Mysql安装”会出现什么