「我是为“数据”去的京东」对话京东供应链首席科学家申作军
2019年11月20日,京东零售集团智能供应链Y业务管理部供应链开放日,美国加州大学伯克利分校工业工程系主任,京东供应链首席科学家,申作军教授做了题为《大数据驱动的自动补货系统研究》的公开演讲。科技新媒体《亲爱的数据》主编,谭婧,就机器学习技术如何在京东供应链场景里的应用,现场请教了申教授几个问题。
《亲爱的数据》:演讲中您提到,机器学习技术在做端到端的预测时,把供应链管理中的几个步骤忽略掉了,比如销量预测,补货预测。这样做会不会更粗糙了?应该怎样理解?
申作军教授:这个问题问得非常好,其实不是忽略掉了。供应链上存在信息歪曲的情况,这个就跟日常生活中传话一样,比如A跟B说一句话,B跟C传话,C再跟D传话,这个过程中信息会发生扭曲,而机器学习技术不会,机器替人类把数据的特征提取出来。
以前智能供应链系统是「分步走」式的决策流程,现在京东使用的是「端到端」补货决策模型,关键是避免了预测误差在决策中的放大。端到端补货决策模型的实质是,销量预测+VLT预测+补货决策用一个模型做出来,最后做到了自动下单。
《亲爱的数据》:基于机器学习技术的端到端补货决策模型,看上去省略了“分步走”式的决策流程,做到了“端到端”,但是,供应链上每一层的数据依然很重要吧?
申作军教授:你说得很对,每层的数据都得采集,而不是忽略数据。在人为估计的情况下,最开始估计的时候有可能就估计错了,后面就越错越多。需要强调的是,我们的端到端是一步解决了预测和决策两步,并不是跨越多层供应链的端到端。
不是说忽略中间数据,这些数据我们都采集,而且京东有能力采集到这些数据。比如库存管理,估计今年双十一能卖多少,数据会符合一个分布。但是,有可能一开始估计的时候就错了,供应链各个阶段就会越错越离谱。最终,双十一库存管理环节的成本就会变高。
《亲爱的数据》:京东之前是“分步走”,现在是“端到端”,供应链过程里的“经验”,是让机器自己去学习、自己去提取特征?
申作军教授:对。你理解得非常快。
《亲爱的数据》:您认为机器学习技术如何赋能京东供应链管理?
申作军教授:这个问题非常好,也非常大。
机器学习在其他领域的应用进展很快,AI是一定要打进供应链的。机器学习对于复杂系统是一个非常好的工具,供应链就是一个复杂系统。今天,京东的管理,对机器学习技术的应用是刚需。拿京东自营的产品来说,商品数量已达540万,如果我们不用机器学习和人工智能的方法,仅仅凭采销人员的经验和Excel表格,管理的精度和效率永远做不上去。
下一步我们想做的工作有很多,其中一个是做一个傻瓜式的库存系统,京东可以帮助小店智能补货。比如你去街边的小店买东西,一进店就会问“老板,啥啥啥有没有?”店主可能直接回答你“没有”。因为这种店商品品类少,可能就只有300个SKU,库存管理做得还很差。你应该听到过,现在智能家居场景会提到的,一台智能冰箱可以自动帮一个三口之家智能补货,提醒主人该去买鸡蛋了。京东的技术帮助小店融进供应链系统里来,赋能他们,帮助他们做好生意。
《亲爱的数据》:这个库存管理工具是toB(企业级服务市场)的思维吗?
申作军教授:都有。对企业级(toB)、对消费端客户(to C),京东都可以做,只要有数据,京东的机器学习技术可以帮你智能化。
《亲爱的数据》:您刚才谈到的是线下实体商铺的例子,在线上如果将机器学习技术的产品应用于京东平台的所有商铺,有数万家,他们的管理能力上去了,相当于京东平台的管理能力极大的增长了。
申作军教授:对。亚马逊公司有一块业务叫FBA(Fulfillment By Amazon),就是利用先进的管理技术和手段,帮助小店提高管理水平。今天的京东一定要做赋能,在京东平台上,预测、配送、库存,都可以做智能化的管理,比如补货的工具,就可以用到我刚才提到的端到端的自动补货系统。
《亲爱的数据》:京东正在做,还是打算要做?
申作军教授:京东现在已经在做增强平台能力,但是目前仅停留在和大的品牌厂商合作的层次上,并不是厚此薄彼,而是因为现阶段人力和资源有限,这也是我们急需AI算法的另一个原因。
《亲爱的数据》:傻瓜型,也就是通用型的,工具给所有的商铺使用,要大家都满意的结果。
申作军教授:对,这就是我们AI算法想要达到的目标。
《亲爱的数据》:研发周期会有多长?
申作军教授:只要我们这个团队一直做,应该很快。一到两年内应该能研发出比较好效果。这也是个持续优化的过程。自研技术工具帮助商铺进行数据分析、产生判断。工具给出的决策和结论,店主可以参考,或者自己去调整。慢慢成熟了之后,精度会越来越高。
《亲爱的数据》:京东的零售供应链数据是全中国最全面的,其他友商在这块不具备。这个现象不能武断地定论谁好,谁坏,各家各有特色。按道理,京东在这么好的数据基础之上,再利用机器学习这个工具,能创造出更高的价值,京东就有了独特的竞争优势。可以这样理解吗?
申作军教授:你说得非常对,京东有零售供应链最全面的数据。很多友商没有全面的数据,也没有一体化的决策系统。如果只是一个平台,供应链的很多环节没法做到整体优化。但是,京东不一样,京东可以全链条的优化,为什么我要在京东推“端到端”,因为我推得动,所有数据都有,都可以打通,其他友商就比较困难。
《亲爱的数据》:能不能说您加入京东是为了「数据」?
申作军教授:是。我想做更有意义的事情,其它电商的局限性使我没法做供应链深度的优化。
《亲爱的数据》:掌握了全链数据之后,京东供应链还有哪些地方值得去做优化呢?
申作军教授:我也思考供应链优化的重点在哪里。在京东这个生态平台上,可以优化的空间非常大,物流、运输、库存等方面,信息的共享可以产生很多降低成本的地方。举个例子,我俩都卖同样的东西,我俩地理距离又很近,你有100件库存,这时候,我正好缺货。我付钱,买你的库存。但是如果信息不连通,我不知道缺的库存正好在你那里,还要再次从遥远的地方进货,时间成本,物流成本都增加。这只是一个很简单的例子,如果能设计好数据和库存共享机制,优化好,就可以从双赢到多赢。
《亲爱的数据》:听您的讲解,我理解供应链的链状结构,在向网状结构发展。我理解的对吗?
申作军教授:没错,供应链不应该叫供应链,该叫供应网络。最早学术界研究供应链的时候,从研究库存开始,那时候是点到点的关系,所以叫做“链”。现在的供应链其实都是一个网络的,但是如果没有足够的数据分享,这种网络结构的供应链的优势很难体现出来。
《亲爱的数据》:能不能说,今天当京东这种角色出现了,网络里的信息才能够更好的传递,这样效率才能高。可以这样理解吗?
申作军教授:对,有了信任,才可以更好的做这件事情。
《亲爱的数据》:当拥有了开放数据平台,京东就是一家大数据公司。之前有很多数据和信息是看不到的,拿到了数据,就能提高效率,可以这样理解吗?
申作军教授:对的,一旦建成了大平台,数据共享之后,降本增效的机会就出现了。但是,能否拿到数据?这是一个挑战。
《亲爱的数据》:作为技术驱动型的公司,和美国电商亚马逊比较,京东的技术优势如何?
申作军教授:2017年,京东喊出,未来12年,京东只有三样东西——技术、技术、技术,坚信所有业务必须建立在技术之上。京东推行ABC与XY(A就是AI,人工智能,B是bigdata大数据,C是cloud云计算),并且在美国硅谷建有一个200多人的办公室。我的同事都是特别优秀的人才,来自MIT、Stanford、UCBerkeley、Georgia Tech、Michigan等美国知名高校。他们愿意在京东这个平台上做一些非常前沿的事情。
竞争是难免的,我们内部也经常和亚马逊做对比。我今天讲的《大数据驱动的自动补货系统研究》只是硅谷办公室参与生产的众多成果中的一个。另外,我们还做了很多数据驱动供应链管理方面的研究,不少结果也是业界领先的。