● DeeCamp、人工智能、艺术与科技、DIY方仔
上传一张照片,就可以生成定制积木方仔!千人千面,即刻创造 —— 这就是『方仔照相馆』。黑科技项目的背后,是一支交叉跨界的优秀团队。团队由博士、硕士、本科的同学组成,他们拥有技术、艺术、设计、商业等专业的背景,是一个硬核跨界团队。项目历时2个月,由大疆创新的周谷越博士作为导师带领成团。队员分别是来自:奥地利科学技术研究所的张然,香港中文大学的徐豪,清华大学的李向阳,北京航空航天大学的夏明桢和刘毅然。
DeeCamp训练营由创新工场于2017年发起。
旨在提升高校AI人才在行业应用中的实践案例经验,同时推进产学研深度结合的公益性质AI训练营。
教育理念:用AI解决真实世界的问题
教学方式:知识+实践
培养对象:本硕博
● 大家是在怎样的契机之下,开始组队开发这个Demo的?我对乐高积木本身是很感兴趣的,也有一些情怀在吧。
之前很偶然地看到DeeCamp比赛中有关于乐高积木的这个主题就联系到主办方,看能不能作为导师参与,但官方并没有计划为每个队配单独的导师,他们建议我找人组队并作为参赛队自选的导师参加。
于是我从Mixlab(无界社区)里找了张然和刘毅然,才有了这个项目的开始。
事实上,在大家都没碰过面的情况下远程参与,在短期内建立起合作默契,并从概念到软件完成还是会有一些难度的,但大家还是超预期的完成了这次比赛。今年是DeeCamp第一年以竞赛方式组织活动,要求5人组队,我和谷越(项目导师)分头去寻找合适的队友。目前我们团队多元的背景和大家自身对积木本来就感兴趣,有技术储备,也有积木的设计经验,还了解积木产品的不同品类。在多次meeting后,就基本能确定在DeeCamp要做什么东西。结合之前做三维建模的经验,我们认为通用场景的三维建模从技术,商业,用户参与度上都不够成熟。所以我们选择了这几方面都比较成熟的人像方向,之后考虑了不同尺度的人像积木建模,最终确定为方头仔。● 这个想法从怎样的雏形开始,并历经了怎么样的变化?最开始我们想生成各种fancy的东西,比如人的胳膊能动,或者有功能之类的。当deadline越来越近了就决定,还是先做静态的。最开始头脑风暴的时候想法还挺多,什么编程积木、从视频生成模型什么的,但最后从两个多月的比赛角度来看,这是一个充满感性激情与理性思考的选择。什么都想做,最后看看时间和进度,不断缩小范围、聚焦,聚焦,再聚焦。● 目前这个项目的形成过程,有没有遇到什么状况或困难?一想这个问题,似乎整个过程都挺愉悦的哈哈哈,就是有时候时间比较紧张。因为(我)还有公司的工作,只能在下班后,基本是晚上讨论完,兴奋的睡不着,有时候刚迷糊,脑子里又蹦出新想法,赶紧起来记下怕早上忘了......严重影响工作效率。第二个困难是每次我们讨论完都会很兴奋,并且很晚了,结果就是经常兴奋的睡不着觉。对我来说最大的困难是配合现场,实现在线实时生成模型的网站demo。包括后端的性能优化,和前端小伙伴一起做前后端整合,以及最tricky的bug是现场设备的系统版本问题使图片上传出现问题,这一系列问题在总决赛前一天晚上才完全解决。张然不在国内和我们有时差,大家平时白天又还有自己的事,基本每次开会都是BJ时间晚上10点,聊着,聊着,聊兴奋了就睡不着了。大家配合得也很好,整体效率比较高,遇到问题,#点子王# 张然总能给出许多好的建议。最 “惊险” 的应该就是刚到服务器上,模型不能并行运行的问题,当时不到24h就要最终提交了。● 『方仔照相馆』的技术过程,是方便拆解和展示的吗?● 输入一张图片之后,我们的算法会将上半身的图片送进人脸特征分割网络,进行人脸特征预测,将下半身的图片送进另一个卷积神经网络,进行人物衣着类型,颜色,logo等信息的定位及分类。这两个网络提取的特征会被合并,并参数化成积木拼法的高维空间中的一个向量,来作为这张输入图片的唯一编码。之后我们的积木生成算法,会自动根据这个编码,来检索各个部位最相似的积木块,并最终经过碰撞分析,可拼装性分析后生成得到最终模型。
最后,我们将图片上每个识别出来的像素点,进行色彩空间内的聚类,通过对每个类像素点的多少来排序,从而确定出在每个区域内视觉影响较大的颜色,经过这样一个过程,就生成了积木方仔。
我目前还在清华读本科,即将大四,专业是艺术与科技、心理学。在学校干的事情挺多,实践、社团、科创、文艺都搞过不少,慢慢的也发现了自己很想做的一些事情,比如有创新性的教育、融合科技的艺术、偏向人本的心理学等。我目前是香港中文大学计算机系的博士三年级。博士嘛,就是天天做科研,具体就是看文章->想idea->写代码验证->失败了->从头开始,这一个循环之中。好在我的文章已经可以毕业了,只是好多项目已经做了一年以上了,涉及的其他合作者也很多,自己也非常喜欢,所以得继续做下去。等我把这些project做到一个我自己满意的程度我就可以退役啦。平时基本上就是做研究,玩游戏,玩工具和各种小玩意儿这样。目前,刚好赶上2020届毕业的末班车,研究生顺利毕业。八月底,九月初与导师在深圳汇合,为创业的小伙伴们打个头阵,做些准备。● 大家目前都还在校园阶段,分别是怎样看待创业的?我真相信创业是改变世界的事情(估计是传记看多了)。我觉得吧,人活着不折腾折腾搞些有信仰的事情,很无聊。本来就是光着来的,留下点东西再光着走。我喜欢《列奥纳多·达芬奇传》,达芬奇是我从小到大的偶像。这本书为我提供了一个视角来了解他的一生和他这个人(但也没准不是书里那样)。最喜欢书中的部分是:描述达芬奇对智慧极致的追求。他不是一个画家,不是一个科学家,不是一个建筑师,也不是一个生物学家,他只是一个对未知世界极度好奇,对未知知识极度渴望的人。有时候就在想,现在还有哪个孩子,可以那样渴望探索这个充满魅力的世界呢?但这个的确是我内心的想法,比如现在小孩抱着手机刷抖音嘻嘻哈哈,他很难看到一片叶子植物质感的美啊!关于创业的问题呢,我们在比赛结束后也认真讨论过了,达成一致的是:我们都不想就此中断这次比赛建立起来的项目合作,所以会继续下去。张然和刘毅然可以投入的精力是最多的(他俩都即将毕业),所以后面的决策和思考会以他们两个为主导(包括分配任务),余下的人尽力提供配合。目前我希望留下来的主要原因是,我们的作品技术上还有很多缺陷,我希望可以尽可能的把它完善。我认为创业是做一些能帮助到其他人,对社会有意义的事情,至于回报应该是顺其自然的结果。我本身在科研界,经常感觉自己做的技术只发文章太没劲了,我希望能够看到自己的研究能真的对社会产生价值,因此我个人对创业还是抱有积极态度的。这次比赛在预料之外为自己开启了一个创业的契机,也很开心能够把自己的科研技术应用到一些能惠及他人的场景。从个人职业选择的角度看,我比较追求自由度,也希望去寻找一些比较新奇有趣的事来做,新技术创业的话可能就是正好能够结合这两点。对创业的理解的话,我觉得创业可能就像一本书一部电影,一个好故事并不一定会有高票房,高销量。但一段能有好故事,有起承转合的创业经历,将来回头看也会像是对待一本好书一样想要去珍藏吧。
● 周谷越:对的,原本只是一次比赛,在大家的辛苦备战下超预期完成任务后,团队的士气很高,确实是一个可以尝试共同创业的时机,但这条路注定不会一帆风顺。首先,参赛的『方仔照相馆』Demo要直接拿来面对创业,只谈技术层面,目前可能也仅仅完成了5%-10%的工作,后面还有很长的路要走。其次,因为大家都是在校生,都还没经历过创业,不是每个人都适合创业,但不否认这对大家是一次机会也是一次成长的经历,至于大家能一起向前走多远,和“创业”本身一样,充满未知。
『方仔照相馆』 创业导师
“ 我个人是人工智能和产品设计的交叉背景,追求的方向是将产品设计和制造过程自动化,也就是将可重复工作的部分,用AI的方式智造出来。
本次,作为『方仔照相馆』项目的指导老师,非常希望看到这个项目在实际市场中能落地,并不断迭代成熟。
而我个人一直在做智能制造相关的工作,在这方面可以给他们提供支持。”
5个在校生,2个月,创新工场DeeCamp总冠军。他们对未来抱持希望,好奇,也向未知探索着所有可能,并且目前正在大步走向从0到1的过程。而关于#定制化制造/智造#,姜孝吾在《全面大规模定制,只可能发生在从零开始的火星》里说:
大规模定制化的工作流是非常优雅的。
因为可以实现真正意义上的精益制造,每个人都能拿到自己个性化的产品,同时也节省大量的材料和能源。让设计响应个体诉求,这是非常美好的愿景。
但这存在两个方面的难度:一个是智能化的程式,另一个是与之相匹配的柔性供应链。要真正的落地这个工作流,困难重重,这涉及到打通整个供应链,让生产文件可以脱离人为的干预,完成生产行为的组织,这是能实现的基础条件。
『方仔照相馆』很清楚的了解这一点,并已找到属于他们团队能够切入,以及破局的方式。未来城市长什么样?100辆无人驾驶给你答案
PIX无人驾驶创始人 喻川
我想打造一个能装下全世界建筑设计DNA的超级大脑
澳洲Archistar研发负责人 王彦文
我一直在思考火星上的人类宜居城市
AIG人工智能研究组创立者 郑豪
我们得了一种不创造就会死的病
浪走科技CEO 陈达博
我们只有一个地球,但仍可以有无数个世界
AR空间设计师 陶柏帆
好奇
Curiosity
&
探索
Exploration