查看原文
其他

开局只有一条狗,如何做成AI无人购物系统?

造就Talk的编辑们 造就 2019-04-24






造就第395位讲者 程飞

西交利物浦大学(XJTLU)

    


大家好,我是程飞,我今年8月份毕业于西交利物浦大学,拿到了博士学位。


我是一个AI创业者,今天想跟大家聊的是,“怎么从一件垃圾,变成一个无人购物系统”。

我下面来讲我们这段故事。说到创业,大家心里肯定会表现出这样的画面。



好帅的黄轩,特别酷。然后大家看右边,这是我。我们在夜里一点半左右的时候,在那调代码,因为我们第二天要向公众展示我们的系统,我们直到那天三点才离开,非常苦,而且非常容易失败。


所以首先,我给大家讲一段我的前创业故事。我既然加了“前”,说明这段事情肯定不是那么的美好,就像我们想到“前女友”、“前老板”一样。


2016年底,我们做了一个智能硬件的项目,我们只花了半年,就把它基本上完成了,但是因为客户没有给我们明确的需求,导致我们出现了严重的问题。但是我们的团队非常努力,只花了几个月的时间,就把这个问题攻克了,而且是彻底攻克了,从理论上攻克了。


我在当时就想,这事成了,我程飞创业成功了。但我完全没有想到的是,我们的资方突然失去信心了,完全不知道为什么。我们成员离职,合伙人意见不一致,在6月份的时候,这段创业很不幸结束了。


另一件事情也发生在6月份,就是我拿到了博士学位,这件事情其实本来令我特别开心,但同时也把我推向了一个抉择,大家知道前几天有新闻,一个做AI的博士,年薪80万。


在此刻我该怎么办,我是去拿那80万?当然不一定能拿到这么高了,还是继续做?我选了后者,为什么我会选择后者?是因为我刚才说了,我们成员离职了,但并不是所有人都离开了我,我们还有人,只是很少。


除此之外,真的没有别的再多东西了,我给大家讲,离开学校的时候,有一种感觉,是你失去了很多东西。


因为在学校的时候,我有GPU服务器。可能大家稍微了解AI的人都会知道,GPU对于做AI有多重要,我离开以后我没有GPU了。我也没有办法通过VPN连上学校的服务器了。


我给大家看一张图,开局只有一条狗,设备全靠捡。



昨天这张图引起了我们团队一点误会,他们认为我把他们当成是狗,其实不是。


但是我们的开局连一条狗都没有,这条狗就是在做AI项目中的GPU。但是我们在那一刻,连条狗都没有。我们首先得有一条狗,不对,首先我们还是得有人。我们一开始真的只有三个人。


我们要做AI视觉项目,视觉得有摄像头,这台摄像头我甚至当时都舍不得花钱买。

我读研一的时候,买了一个一百多块钱的摄像头,为了能够训练我们的人工神经网络,我必须要有GPU,我们选择买了一台游戏本。


为什么不选择一个台式机,因为笔记本可以带出去向投资人吹牛,如果是一台台式机,真的连演示的机会都没了,事实上证明,这台游戏本给我们起到了非常大的作用。


然后做什么?这是一个非常大的问题。我们为什么会去做无人货架?这是一个巧合。因为有一天我们在公司门口,发现了一个别人扔掉的货架,就是这个货架。



为什么会扔掉?因为这是一个别人的创业项目,他们做无人零售,就是你自己去拿,然后自己在APP上输入你买了什么,然后他会帮你结算,你再支付,整个过程真的非常麻烦。


我们当时就想把这个玩意儿给颠覆了,但是一直没有找到点,或者我们一直没有想到,我们还能买个货架。


直到我们发现了别人扔了一个,那就拿回来用,在我们向我们孵化器的主管确认了这个真是他们扔掉的之后,我们就搬回了我们自己的办公室。


然后就放上了这么一些零食,我们就尝试拿摄像头,去识别这些零食。但是一开始我们做的是饮料,因为当时是夏天,我们穷的只能喝一些碳酸饮料,喝不起果汁。我们就买了很多雪碧和可乐,还有泡面。


所以我就说,我们可能是这个星球上,最穷的AI公司。说到AI公司大家都知道,什么科技公司融了几十几十个亿,我们别说几十个亿了,几十万我们也没有见过。但是我们的脑子里一直认为我们是一个能做成事的人,所以我们还是坚持做了。


事情就这么开始了,我们在8月底开始尝试,没过多久,我们的AI程序,就可以识别出可乐和雪碧了。虽然这真的很简单,但是我之前都是做研究的,我并没有把这些东西真正用到实处,当真的用到实处的时候,我甚至感觉我有了一个孩子,就是他开始懂事了,开始懂这个是饮料了。


在这个过程中,我们有点像一步一步在训练一个,或者说在培养一个孩子。然后雪碧和可乐是远不够的,我们很快就把它扩展到12类,12类以后,我们面临一个巨大的问题就是,我们怎么去标注这个数据,说到标注大家可能比较陌生。


我下面来做一些小的科普,我们这个时代说到AI,说到人工智能的时候,其实主要说的是监督式学习,什么叫监督式学习,就是你得教机器它是什么,它在哪?


另外一个领域是无监督式学习,这个太专业了,我就不说了。


然后又因为我们要在这个里面进行标注,我给大家看一下,什么一个场景。



这张图里面有一百多瓶饮料,然后每个橙色的框就是一瓶芬达,它标注了这个芬达在哪里。大家知道我们是怎么标注的吗?就是拿鼠标把它选中,如果你选不准,你就得微调。


我们面临一个问题是我们只有三个人,但有上千张图片,每张图片一百多个点、一百多个框要标注,最终会有十几万的这个框。没有钱,没有人怎么办。只能想办法!


这是一个我们在生活和学习中,经常遇到的问题。就是我们面临的问题很大,面临的任务很重,但是没有人做,没有资源去做,怎么办?


第一我们想到的是,让标注这件事情变快。第二,让标注的时候变得不这么累。第三,就是让标注不容易错。



怎么提高标注速度,我们既然想培养一个AI零售员,它也不是一口气吃成像我这样的胖子。


他需要循序渐进,所以我们一开始并不是把所有图片都标了,而是我们只让机器学习,这个东西的框在哪里,这一步对于机器来讲是学得又快又好的。


他学会了在哪里以后,我们只需要告诉它是什么,这个事情就变得快了很多。


我们光这一项上面的效率,我觉得提升至少20倍。


但是标注这件事情非常非常累,那怎么办。我刚才提到了我们用鼠标,玩游戏的同学都知道,你用鼠标玩一天游戏,是非常疲劳的,手腕会非常累。


而且在标注的时候,你要精确到像素级,脑子和手都特别特别紧张,我们当时标注的时候,三位成员都崩溃了,真的觉得这事做不下去,我们做不了AI,但是我想了一晚上,觉得这事我们能干。


然后我们就把鼠标操作给去掉了,全部用键盘。说到这个非常非常简单的一个改进,但是真的非常好用。小时候,我们有个游戏是叫劲舞团,还是什么的,用键盘啪啪啪在那打,非常爽。


我们那天晚上真的实现了,在干活的时候也这么爽,我们当时在做苏州中心这个项目之前需要标注大概几千张图。


有一个晚上,我们三位成员在办公室里标到凌晨一点。我们没有觉得它已经到一点了,我们放着摇滚乐,然后在那啪啪啪敲键盘。特别特别有自豪感,最后我们真的把这件事情做完了。


第三点,要防止错。因为我们作为老师,如果给了机器一个错误的答案,那它就会学错。那怎么办,我刚才看到那个图上面特别乱,芬达到处都是。


其实很简单,就是把所有的芬达都挑出来,最后再看一下,还剩下什么?是不是有没标的,特别简单,但是特别有用,通过这个办法,我们让我们的数据变得非常非常精确。


光有了可以精确识别到这个商品还不行,我们要的是一个系统,是一个流程。



所以下一步,我们完善了购物流程,就是我们怎么让一个人,从走进去我们的检测区域到出来,并且完成扫码这么一个过程。


然后我们又把种类,从饮料扩展到饮料和食品,总数扩展到20类。支付才是最终的一点,我们最后把支付宝接入了,然后真的可以拿了就走,然后去扫码就支付。我们这个系统真的经历过了真实的环境考验。它确实是可以用的!


有一句话,我们经常提到:贫穷限制了大家的想象力。


我觉得这句话绝对是错的,贫穷怎么会限制我们的想象力呢?我们一开始的时候,真的非常非常贫穷,没有资源,没有钱,没有人。


但是就因为我们没有那些东西,我们才想出了办法去解决,其实我们并不是因为穷才去解决,而是因为我们想要做的事情,永远都是只有一点小的资源,但我要用这个小的资源,以小博大。


我要把这个小的资源放大多少倍,以至于让将来我的投资人看到。我有这个能力在少的资源的情况下,也能干出别人用多资源才能干的事情。其实,贫穷不会限制我们的想象力,懒才会!

大家来看一下,我们的真实的场景视频。



这就是我们的产品,从一个垃圾,变成了一件真正可以用的AI产品。


但是它还有很长的路要走,事情绝对不会就此结束的,我们也在不断地增加分类,把它增加到一百类,这是我们正在做的事情。我们也去和真实环境合作。


我们已经和西浦礼品店达成了初步合作意向。我们会把礼品店的一个柜台,变成全中国第一个,也可能是全世界第一个无人购物的礼品店。


而且我们会在我们入驻的孵化器,真正地把这家无人智能的便利店开起来,而且我们给自己提了更高的要求,更快更准,并且要做到多人使用。


其实现在无人零售是特别火的一个话题。所有的大公司都在做,大家都在解决这些问题,我们就这么少的人,我们也想去做,我们试试看吧。


还有一点,我想重点提到的是,我们在这个过程中,虽然没有挣到钱,但是我们找到了一套方法,我们知道怎么去利用AI去解决实际的问题。我们把它形成了一套工具和方法之后,它已经可以给我们获利了。我特别欣慰,我们在这个月终于可以有收入了。


在这个过程中,我真的听到了很多同行和投资人告诉我的一句话,特别丧的一句话,“你们这个新零售项目做不成的”。



而且他们语重心长地告诉我们,“你们要选对跑道”。对,这句话真的特别对。我认可选对跑道这件事。


但是选对跑道,首先我要跑啊。我现在可能还不会跑,我是不是要先学会跑,再去选跑道。我觉得这个过程非常重要。


事实上我觉得,这几个月就是我们在练习跑的过程,而且很多人会告诉我,你可以去一家大公司去历练,去在大公司里学习怎么跑。那是一种家养的方式,我们团队是野生的。大家要保护野生动物,野生有野生的好处。


别人怎么说,我虚心接受,但我们希望我们能够在自己的路上走下去。


回到我的演讲主题,“开始造,就能改变”。


为什么我会这么急着要去做,我今年毕业的时候,我们校长在毕业致辞上说到,我们要以复杂的心智,面对这个复杂的社会。


因为我们这个社会,变得越来越复杂了,我们很难在开始做一件事情之前,就把它想通想透。与其这样,我不如只要有一个简单的想法,有一个方向,我就做,我就造。



造起来先,再看会发生什么,不要总是想。我们一开始就想做AI,就想做事情,没有别的想法。你看我们发现一个破货架,我们就做了,不要等到那么迟,不要等到试图去把所有事情都想明白,再去开始。那样太晚了!


我们在座也有很多大学生朋友们,他们可能会问,那学生们怎么办?其实我们回想一下,现在一个宿舍,你们起码有四个人,我们只有三个人,你们顺利的话,有四台游戏本,我们只有一台。是不是开局比我们还要好一点?你们有四条狗,我们只有一条狗。


还有在学校里,我才发现大学是最容易寻找资源和聚集资源的地方,而且大家都没有这么势利,没有这么追求利益,这时候你是最容易把事情做成的!


所以最后还是说一句,开始造吧,谢谢大家。


文字 | 张默;校对 | 其奇



互动话题:

你希望人工智能可以帮你做什么事情?

每周评论区,被zan最多的评论者,将获得造就送出的礼品一份


加入社群:

添加小编微信(zaojiu12),发送暗号“进群”,带你进入神秘的造就官方群。





  点击阅读原文,看「造就」更多演讲。

文章已于修改

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存