浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
我在淘宝买到了“生活解药”
文 | 史中
炝锅的香气从厨房传来,而我趴在床上看《哆啦A梦》漫画,那是我人生最惬意的时刻之一。一声厉响陡然划破了宁静,我妈大喊:史中!快去买瓶酱油!5分钟之内回来!!气氛一下子燃起来了呀。七岁的我攥着一张“十元大钞”,昂首挺胸奔楼下走去。夏日的风又暖又甜,混杂着邻居家炒辣椒炖鲤鱼的味道,让人莫名心安。我走到几栋楼之间唯一的小卖部,踮着脚递钱进去,只跟老板说了一句话:“叔叔,买瓶酱油。”一瓶黑乎乎的东西随着几张零钱和钢镚塞满了我的左右手,我像得胜的拿破仑一样,骑着隐形的高头大马,在夕阳中凯旋。为啥想到了这些呢?因为此时此刻,女票正在为“双11”挑灯夜战,各种衣服裙子塞满了购物车,而她已经维持了同样的姿势4个多小时,以至于我想拿根棍子扒拉一下看看她还在不在喘气。眼看胜利在望,为了凑够一个满减,她考虑买一瓶酱油。但这件事并不容易,因为淘宝上的酱油恨不得有一万多种:原料勾兑的觉得不好,古法酿造的觉得太贵;有防腐剂担心不健康,没防腐剂担心齁得慌;刚看完酱油水,又刷到酱油膏。她在酱油的海洋里徜徉,而我的思绪飘向了奇怪的远方。以前买酱油,就是买 the 酱油,而不是 a 酱油——完全没有支线任务,简单到一个小屁孩也能完成。如今买酱油,居然能让一个全日制大学毕业生恨不得列方程组。。。过去的购物,是满足基础的生活需求。就像海尔兄弟唱得那样:打雷要下雨,雷欧,下雨要打伞,雷欧,天冷穿棉袄,雷欧雷雷欧~现在呢,购物成了一种人民群众喜闻乐见的“运动”。想买到*对*的东西,你需要过人的品味,非凡的阅历,成熟的心智、超人的体力——你需要从一杯阿根廷红酒中看到贝隆夫人倒映的眼眸;你需要望穿手机无辜的屏幕辨识硅片上栅极的翕动;你需要瞄一眼衣领造型就回忆起几周前米兰T台上洒落的光芒。当你决定去购物的瞬间,就如同进入了工体酒吧的舞池,就如同站在了自由滑雪的高台,你在征服别人,你在取悦自己,你在挑战人类智识的光荣与梦想。好吧,刚才的描述有点夸张,主要是想告诉你:现在买东西真的需要耗费很多大脑计算力。。。为了叙述方便,我们不妨把过去那种买东西的行为称为“购物”,把现在这种买东西的运动称为“消费”。显然,购物是“人”和“商品”之间的私事儿;
而消费不是这么简单,在“人”和“商品”之间多了一个第三者,叫做“生活方式”。
生活方式其实一直都存在,只不过1994年的你我共享同一种生活方式:你家楼下的小卖部和我家楼下的小卖部是同一个小卖部,小卖部里只卖一种酱油。想出街只有自行车,写作业只有田字格,庞麦郎买到一双滑板鞋真的会激动到大晚上去街上摩擦摩擦。但今天,原本不用操心的“生活方式”已经拦在面前成为所有人的必选题。ABCD必挑一样,哪怕你不选,也等于选了“E:以上都不是”。那么,每种生活方式都是平等的吗?Of Course,NOT!!!我们找一个大多数人都认同的靶子,煤老板。当年煤老板可以一掷千金买下一单元房子,决策依据是算命先生的罗盘;煤老板可以眼睛不眨投拍一部电影,选角标准是胸大。所以,你还不能躺平,选择一个好的生活方式去实践,是每个人不容推卸的历史责任。看到这儿,浅友们会自然分成两个阵营,一类是剁手达人,李佳琦的集美们,他们天生对消费感兴趣,玩儿一样地看直播,不觉得是什么负担;另一类是像我一样的消费“外行”,老子(老娘)每天上班已经累到全身不遂,为啥还要跟你们一起卷生活方式?不久前我去了一趟杭州,和淘宝各个部门的产品经理、技术大牛们聊了一下,发现他们正在焦虑的也是这个事情。当然,他们的焦虑的不是自己要如何消费,而是怎么帮几亿人更好地从“购物时代”迈向“消费时代”。让我惊讶的是,本着“不抛弃不放弃”的原则,他们想让中哥这样的“消费小白”也能跟上时代的小碎步,优雅简便地选择自己的生活方式。和他们聊完,我四舍五入有了一种被治愈的感觉,所以决定把故事讲给你听,让你也帮忙看看我想得对不对。逍见是个型男,看到他第一眼我就知道,他是那种能把今年法国时装周流行款式倒背如流的那种人。所以,作为淘宝“服装品类”的产品经理,他简直是再合适不过了。以我直男拙劣的眼光来看, 他可以把身上的T恤、夹克、长裤、鞋子还有高耸的发型舒服地结合在一起,让穿着小鸡帽衫顶着鸡窝头发的我相形见绌,而这也正是我俩聊的主题——穿搭风格。我随便搜了一款冲锋衣,点进去,在商品头图下面有一个“搭配”按钮,进去你会发现,出现了一身完整的穿搭:还记得刚才我们画的示意图么?“消费者”“商品”和“生活方式”。魔法来了:衣服、鞋、帽这样的东西是商品,而它们之间的组合穿搭,就形成了某种“生活方式”⇩⇩⇩你可能会说,这有啥了不起?店家都会把同一风格的衣服搭配售卖吧?打有狗那年就这么操作了。你说得没错。不过我想强调的是,这是在产品逻辑层面第一次给了穿搭“名分”:“A单品”+“B单品”=“C穿搭”,在淘宝的产品体系里,已经把“C穿搭”变成了和“A单品”“B单品”平等的主体。比如,很多人都喜欢一个功能:在淘宝首页下拉,会出现“猜你喜欢”,无穷无尽的商品像瀑布一样奔涌。在这些商品之中,就会混入“穿搭卡片”。也就是说,淘宝不仅可以猜你喜欢什么“商品”,也可以猜你喜欢什么“穿搭”。再比如,你直接搜索某个关键词,也可以点击“搭配”标签,专门进入穿搭页面。就像下图这样:这意味着,商品能出现的位置,穿搭四舍五入也都能出现。我觉得,“穿搭卡片”的普及,可以降低普通用户在生活方式层面的决策难度。以前,只有时尚达人、专业买手才能搭配出鸡尾酒一样和谐的服饰;
现在,普通人只要发现了一件他看上眼的衣服,就可以顺藤摸瓜,参考穿搭卡片把一整套装备搞齐全。他甚至不需要对这个风格有过多的理解。
你可能还有个技术上的小疑问:这么多穿搭卡片,都是从哪冒出来的呢?除了商家主动之外,逍见他们还做了一个“辅助引擎”,每时每刻都在商品库的海洋里打捞与相应风格匹配的商品图。1)找到一张合适的图(一般是模特的全身图),就会推荐给商家老板,说你这张图适合做成“穿搭卡片”。
2)系统自动在上面生成“锚点”,标记出“A上衣”对应的商品链接、“B裤子”对应的商品链接等等,
3)生成推荐的标题,商家只需要轻微修改,或者直接确认,就发布了一个穿搭。
这么简单,淘宝商家们自然何乐不为,很快就生成了成千上万的穿搭卡片。至于这个引擎怎么才能准确识别出哪张图是什么风格,先埋个伏笔,我们后面再说。在这里,逍见他们没有停下“胡思乱想”的脚步,他们发现好像“用户决策难度”还有进一步降低的空间。比如张三,不是时尚那一挂的,就在饭桌上听朋友说了一句:你挺适合穿 Cityboy 的风格。张三被种草了,但这个草种得太浅了呀,一共就听来七个字母,背后的意思一概不知,想象不出来是个啥样。第一、先去百度一下“Cityboy”,知道这是一种日式叠穿风格,可能要包括条纹衬衫、工装衬衫,宽松的裤子,颜色方面偏向卡其、军绿这样的沉稳色系;
第二、可能还得去小红书搜一下,看看大家都是怎么穿的,有啥注意事项,自己别露怯;
第三,学习了一圈,心里有了几个服装样式和牌子的关键词,然后到淘宝去挨个搜索。
逍见的意思是,不用那么麻烦,三步压成一步——直接上淘宝。
你可以跟我一起试一下,在淘宝上搜索“Cityboy”。注意,下拉列表里出现了一个特殊的选项,“Cityboy怎么穿”:
点进去,里面出现了一个“主题内容页”,直接包含你需要的一切:Cityboy 的视频解释、要素服装、几大代表款式,后面跟着无穷无尽的商品和店铺。你看,从只知道 Cityboy 七个字母,到选购衣服完成,都可以在这个页面做完,全流程像打了沐浴液一样顺滑。殊不知,在“滑”的过程中,你已经完成了对于主风格的确认,对于亚风格的选择,还完成了对品牌的挑选和衣服款式的挑选。想想这背后的逻辑也很有趣:“主题页”直接把多个“商品”从风格维度捏合在了一起,又形成了“生活方式”。而且,同样一个搜索框,以前你只能搜索“关键词”,但现在还可以搜索“问题”或“主题”。这背后还是那个趋势:“生活方式”正在和“商品”并肩出现,试图降低普通用户的决策难度。鹿晴是淘宝搜索的一位产品经理,她和小伙伴就在负责这些主题页的制作。说到这,还有个有趣的小故事。今年早些时候,鹿晴他们注意到,来自全国各地的淘宝搜索请求里,总会掺杂一些“问题”,像是“小孩长不高怎么办”,“脸大适合什么帽子”。这样的搜索每天雷打不动几万条,虽然比起淘宝搜索总量来说只占很少比例,但总觉得应该做点什么。列表很长,我随便截取了一点儿比较靠谱的,你感受一下于是,他们尝试把大家搜索最多的问题排排序,挑出几个,做成了主题页面,下次再有人问这个问题,就直接把这个“最佳答案”给他们。我把页面平铺了一下,你看,这里有指南、清单、趋势、玩法、店铺、经验。不过,这种主题页还挺难做的,因为鹿晴自己也不是每天睡帐篷的露营达人啊。幸好,在淘宝有一群神秘的老司机,叫做“行业小二”,他们负责运营特定品类的商品,自然是专家啦。鹿晴于是找到了户外品类的行业小二,跟他们一起推敲出了“露营主题页”。用同样的姿势,他们又做出了刚才提到的“Cityboy”、“甜酷风”、“胖mm”等等服饰主题,还做了“居家健身买什么”、“骑行买什么”、“宠物保暖买什么”等等生活类主题。作为一个爱学习的小姐姐,鹿晴很享受这个过程,每做一个主题,自己都像是学了一门专业课。。。她算了算,截止2022年双11淘宝已经上线了几百个主题页面。估计有的浅友逛淘宝时已经无意中搜到了这样的页面。其实,最初他们也没有想到,这个有关“生活方式”的主题内容如此切中大家的爽点,但事实给了所有人惊喜:在上线了主题页面之后两个月,这种问题类的搜索——我们叫“消费搜索”——翻了好几倍,也就是说,这很可能是一个大家期待已久,但过去淘宝没有解决好的问题。
好了,故事讲到这,我们总结一下。为了从购物时代走到消费时代,淘宝这群人正在使出吃奶的劲儿,帮用户降低“生活方式”方面的决策难度。淘宝是一个货架,商品往往有清晰的型号标注、尺寸、图片,系统可以自动分类摆在货架上任君挑选;可“生活方式”这么虚无缥缈的东西,能被系统自动分辨出来,放在货架上么?你想象一下“iPhone14”,然后你再想象一下“侘寂风沙发”。
锦里刚一见我,就像心理咨询师那样,给我安排了一个奇怪的思考题。在想象 iPhone14 的时候,我可以轻而易举地勾勒出手机的边框转角、磨砂玻璃后盖、屏幕上的灵动岛,那是一个清晰的画面;可是在想象“侘寂风沙发”的时候,我的想象力开始变得绵软,扶手可以支棱一点,也可以塌下去,沙发主体可以是单体也可以是拼装,总之就是一坨设计简约性冷淡的暗色沙发。。。他是淘宝家居品类的产品经理。相比数码3C,这个品类有一个天然的问题:那就是厂商一般不给家具编订型号,只有风格之分。回到我们之前的那张图里,“型号”对应的是商品,而“风格”就对应了生活方式。所以问题来了:在过去很长时间,由于家具没有型号,而对家具风格的认定又很模糊,导致用户很难找到他们心仪的商品。假如现在“侘寂风”正火,很多人都会去搜索。这样一来,有些“顽皮的”商家也会给自己的商品标题里加入“侘寂风”这样的关键词,尽量让自己的商品多一点曝光。
但这样的结果就是——我搜索“侘寂风沙发”,出来的商品有可能仅仅是标题里写着“侘寂风”,但实际不是侘寂风。我真正会喜欢的那款沙发可能排在搜索结果的第200位。。。
没错,但是要想剔除,首先得让搜索引擎明白什么是“侘寂风”不是么?所以,问题就变得清晰了:如何教会 AI 通过图片认出“侘寂风”。把沙发的靠背、扶手、支脚、转角弧度、表面材质、颜色等等特征全部拆开,总共选了几十个特征,然后用这些特征标注数据,对 AI 进行强化训练。“其实一开始我们也没想这么大动干戈。但训练出来的 AI 不够准啊!现在这一版特征,是我们改了好几轮才确定的。不瞒你说,有些特征脑洞很大,一般人不踩几个坑是很难想到的。。。”他笑。就这样,他们定义了“侘寂风”、“北欧风”、“意式风”、“轻奢风”、“简约风”、“奶油风”等等十几个种类。我们的 AI 现在对一种风格的识别准确度是95%-99%,这个水平,就连行业小二这样的“普通专家”都不一定比得过。因为我们测算了一下,人类识别风格的准确度大概是90%-95%。
熟悉家居的浅友,可以检验一下锦里他们的工作成果——去淘宝搜“侘寂风”或者“北欧风”,看看系统自动筛选的商品有没有错误。说到这儿,你还记得我们之前讲服装时埋的伏笔么——淘宝的搜索引擎是怎么知道某个服装穿搭是什么风格?没错,他们使用的技术也和家居类似。逍见他们和技术团队把时下流行的服装风格分成了十几大类几十个小类,然后把 AI “押送”课堂让它学习透彻,再用这些风格作为纲领,统领起淘宝商品库里亿万服饰。多说一句,其实对商品风格的分类不一定靠视觉,在今年“双11”的时候,淘宝的技术负责人若海还讲了另一个有趣的例子:在“香水”这个领域里,其实存在着风格混乱的情况。
但香水的香气是嗅觉信息,又没办法通过图像传达,所以淘宝这群人联合行业协会还拉上原料提供机构搞出了一个《嗅觉文化图谱》,直接定义了25种香调知识,还有712种香味,这样就能做到把香水的风格数字化。
拿来一瓶未知香水,就可以根据它的原料和调配方法,来定义它归属哪个风格了。
你可能已经看明白了,这些努力虽然姿势不同,但本质都是在对具体的“商品”和具体的“风格”做绑定。毫不夸张地说:准确的“商品”和“风格”的绑定关系,是一切高端操作的基础。举个例子吧,在淘宝的推荐算法里,有两个重要的机制:“标签推荐”和“推荐打散”。比如我爱买电子产品,可能就会有“电子产品标签”,我还喜欢买甜食,可能就会有“甜食标签”(这都是我随便编的,淘宝里具体的标签是不对外公布的)。不过,原来给一个人打标签,大多集中在“商品维度”;现在有了准确的风格识别能力,就可以给一个人加上“风格维度”的标签。比如一个女生爱买露脐装和收腰泡泡袖裙,那她可能是一个“甜酷风”少女——凡是具有“甜酷风”风格的东西,不一定是衣服,可能是耳环,甚至可能是音箱、奶糖,都可以推荐给她。当然,一个甜酷少女也不会在生活里处处都想甜酷,她也需要推荐系统偶尔给她惊喜,推荐一些不符合她标签的商品。给她推荐商品时,也许9个“甜酷风”商品会搭配一个“法式风”商品一起出现。但在过去,由于对商品风格判断不准,那个系统以为的“法式风”很可能不是法式风,是别的风,比如“中式风”。如此一来,姑娘不喜欢这个商品,其实是不喜欢“中式风”,而系统却以为这个姑娘不喜欢“法式风”。。。而有了“商品层”和“风格层”的准确对应关系之后,这些误解出现的概率就大大降低了。故事讲到这里,估计你也发现,除了“商品”和“生活方式”之外,我们已经涉及到了消费时代的第三个要素——消费者。接下来我们就更深一步讨论:除了被动推荐,消费者怎么才能主动找到某个“商品”或“生活方式”呢?你还记得吧,每个主题页面,其实背后都对应一个具体的问题,例如“露营买什么”、“胖mm怎么穿”。然而,这种“问题搜索”对于搜索引擎是巨大的技术挑战:过去人们主要搜索关键词,你搜索帐篷,搜索引擎就给你帐篷,没啥好说的。
但现在,你能输入句子了,问题反而复杂了。因为,同样的意思可用多种句式表达,比如“搭帐篷需要什么”、“野餐需要什么”、“我想去山里”、“野营必备清单”。。。
像这样的话我还能想出一万句,但它们四舍五入都是在问“露营买什么”。
怎么才能做到大家无论换什么花样表达,搜索框都能知道给出“露营买什么”这个主题页呢?只有一种办法——在搜索引擎旁边配备一个强大的“自然语言理解引擎”。很多浅友都知道,自然语言理解(NLP)是人工智能领域的经典命题。它的本质是:把“自然语言的描述”和“背后的逻辑意义”联系起来。表面看起来完全不同的自然语言描述,可能在意义空间里的位置很近,也就是说它们的意思相近。在阿里巴巴达摩院,有很多老师傅正在为提高自然语言理解的效果而奋战,之前我曾在《淘宝的秘密战争》里详细记录,这里就不赘述了。当你看到一个东西,别说用关键词了,就是让你说一句整话,都没办法描述清楚,肿么办?其实,人脑认识世界有两个主要通路,一个是语言文字(左脑),另一个是图像(右脑)。同理,你要在搜索引擎里找到某个东西,也可以用“文字搜索”或“图片搜索”。淘宝拍照也叫拍立淘,是淘宝里一个存在许久的功能。你看到一个“难以用语言描述”的东西,例如穿在别人身上的衣服、装在门上的锁、亲戚家小孩手里的玩具,就只能通过拍照来搜索。不过,这个功能好不好用,和图片搜索的准确度高度相关。具体来说,在2021年时,如果我们用淘宝拍照拍一个商品,能找到精准同款的概率也许不到30%,找到相似款式的概率不到70%。这个比例虽然不能说低,但是却难以让用户建立起“买东西可以拍张照”这样的稳固心智。黄伟林加入阿里,正是为了解决这个问题。他曾在牛津大学著名的“视觉几何实验室(VGG)”做研究,也曾是视觉AI创业公司码隆科技的首席科学家,可谓横跨学术和工业两界的老司机。这样闪光的背景,也让拍立淘算法团队愿意跟他一起冒险,把之前沿用很久的“识图 AI 算法”直接掀了个底朝天。在2021年之前,淘宝拍照核心算法采用的是业界流行的图像搜索训练方法——“对比学习”。所谓对比学习,举个不严谨的例子,就像是在每一个样本上装了一个小磁铁,然后通过磁力作用调整磁铁的位置,让不同类别的样本产生最大的互斥力,相同类别样本产生最大引力,这样就能把不同类的图像分开,相同类的图像聚合。把各个磁铁的排布参数拿下来,就形成了“识别模型”。但随着淘宝商品分类不断精细,种类从几十万类变成了几亿类,对比学习的弊端就显露出来。我们不妨想象一下,如果仅仅有两种分类,比如苹果和梨,那么训练时样本很好做到互斥——不是苹果就是梨嘛。但如果分类达到了几千万类,在训练的时候,每一类样本都要和几千万类样本“互斥”,就变得非常困难,一不小心两种分类逻辑就会交叉,导致最终模型不准。关键在于,这种“不准”还无法通过增加训练数据量来解决,反而是到了一个临界值之后,训练数据再多效果也不会提升了。。。所以,团队开始探索另一种多模态训练范式——基于 Margin 的超大规模分类学习算法。这种训练方法有点像一堆“细胞”。不同的样本会围绕在各自的“细胞核”周围,而不同“细胞”之间有明确的“细胞壁”做区隔。这种方法在分类较少的情况下并不太好使。比如它只认识苹果和梨两类,新来一张图片,它就会觉得既不是苹果也不是梨。。。但是,当种类多到几千万之后,这种“Margin 分类学习”的效果就明显优于“对比学习”,就像是无数细胞挤在一起,新来一张图片,就有极大概率会落在某个“细胞”范围内。这种训练方法还有一个好处,那就是如果加大训练数据量,效果还会明显提升。所以,有了新的算法思路,算法团队把原来百万量级的纯图像训练数据,逐渐提升到了五十亿量级以上的多模态数据。到了2022年双11左右,拍照搜索精准同款率已经超过了50%,相似同款率超过了90%,不得不说是跨了一大步。其实,“分类学习”并不是新方法,在图像算法里被认为是上一代算法,而“对比学习”才是当红炸子鸡。可实际上,黄伟林和他的团队在最近几年用完整的研究证明了(图搜领域)对比学习的弊端所在,相关论文还成为了 CVPR(国际计算机视觉与模式识别会议)的最佳论文候选——实力破除了对新算法的“迷信”,他才敢坚定地走“回头路”。黄伟林告诉我,他们的搜图不止是搜图,还能用 OCR 技术识别图里的文字。这样如果你拍一个药盒或者拍一本书,搜索系统就会直接给你相同名字的药或书,因为版本或厂家不同,可能外观和你拍的这款不同,但却很可能是你想找的东西。无论是自然语言理解加持的文字搜索,还是“Margin 分类算法”加持的图像搜索,本质上都在做一件事,那就是——把“商品”、“生活方式”和背后的“语义空间”做精准的连接,从而让消费者可以“想啥来啥”。搜索引擎像一个发动机(引擎本来就是发动机的意思),一个及格的发动机最多放在摩托车上,一个精良的发动机可以放在跑车上,而一个超级精密的发动机才能带动巨大的飞机展翼飞上天空。故事讲到这,你有没有发现,我们还没提到商业活动的最后一个重要参与者——商家。实际上,今天的商家早已经“卷”到了无以复加,他们的焦虑远超消费者,急需一些武器来开拓“消费时代”这片新大陆。我们还得请上锦里。没错,就是那个“卖家具”的锦里。“你相过亲吗?”他又是劈头盖脸抛来一个绝绝子问题。不等我回答,锦里就继续说下去:“在淘宝上,商家特别重视商品的头图,就像你相亲时发给对方的第一张照片。”锦里告诉我,在家居电商行业,你如果要卖一张床或一个沙发,先得给它拍一张美美哒“定妆照”。因为绝大部分家具在设计之初,设计师都会先做一个3D模型,把这个已有的3D模型放在一个3D场景里,就可以生成精美的图片。这种“3D图片”往往比实物家具在实景中拍摄的观感要好很多,商家很喜欢用。当然,做这样的图片价格也不菲,业内一般是2000块钱一套,每套大概包含不同角度和不同景别总共5张图。这里出现了一个问题:照片效果好不好,是无法预计的。(这里指的好,不是艺术性高,而是能实打实促进销售。)好不容易花钱搞了一套定妆照,结果发布之后,用户并不感冒。本来挺好的家具,销量很差,这不让商家窝火么?然鹅每次上新家具都像是买彩票——试验之后,发现头图促销效果不好,还得花钱重做,可重做之后,也不知道会不会好。。。就这样无尽痛苦轮回。。。他们找到业内最好的设计师,手动设计了不同种类总共几万个家居场景,然后把这些场景作为“种子”,用 AI 泛化出几千万个家居场景。然后,他们把这些家居场景免费提供给商家,商家只需要上传他们家具的 3D 模型,系统瞬间就能帮他们合成各个景别、各个角度上百张“智能3D头图”。如果愿意,商家还可以进一步授权淘宝帮他们测试哪个图片更受用户欢迎——淘宝会给不同的消费者展示不同的头图,从数据分析出消费者更吃哪张图的颜,于是就建议商家保留哪张图。这么一套“生成+测试”下来,图片肯定比商家自己拍的或者自己找人做的效果更好,而且省时省力,还不花钱,隔壁商家都馋哭了。这张图就显示了不同“机位”和“硬装”的情况下用户下单率的高低。你看看效果最好的图跟你做喜欢的图一样吗?“可这么多商家都用你们的系统做“头图”,他们做出来的图不会同质化,不会撞车吗?”我好奇。“我们考虑过这个问题。首先我们有几千万场景可选,这个数量是很大的;其次,我们会不断更新场景,某个场景用超过一定数量,即便再好,我们也会停止使用。就像人类精子库,同一个人的用了十次就不能再用了。”他笑。“但你们把商家作图的工作揽在自己身上,不就相当于商家的成本转嫁到淘宝了吗?”我问。“我们算了一下,用淘宝技术做一张图,平摊下来,成本至少下降了1000倍。所以不用为我们担心,本质上它的红利来自于技术。”他说。话说回来,商家们其实并不关心用了什么高大上的技术,他们的梦想很朴素,就是多多卖货,凡是有利于剁手党顺畅购物的设计,他们都举双手资瓷。这次探访淘宝,我还遇到了几位老师傅,他们做的事情恰恰就是帮助消费者更顺畅地下单,尤其是在“双11”这种分秒必争的场合。比如,购物车技术负责人行久就带着大伙儿把购物车容量上限从200件商品提升到了300件,还能分组管理,还能退出后保持勾选一段时间以便用户回来下单,让重度剁手党玩家可以在抢购的时候节省出那么一两秒的时间。就像这样⇩⇩⇩
比如,交易链路产品团队上线了“多地址下单”功能,可以让同一订单里的商品发往不同的地址。这是满减党的福音,他们可以无压力地把买给家人、朋友的东西全凑到一起,享受满减的同时还可以直接分散邮寄到家人和朋友的地址。虽然这些改进看上去只是功能调优,但背后却涉及很多“精密操作”。就拿多地址下单来说,淘宝自2003年诞生以来就是一个订单对应一个地址,历史上所有的系统都是围绕这个“一对一”模式开发的。所以,下单链路突然要改成“一对多”,就涉及到商家系统、供应链系统、物流仓库系统等等全面的改造。一旦某个环节出错,就可能大促的时候把下单链路搞崩。。。交易团队的雨疏告诉我,今年春天,他们几个小伙伴像八爪鱼一样,跟十几个团队对接,仅仅用了2个月就把这些事情搞定,不仅赶上了618大促,还没出任何问题,现在想来还是挺不可思议的。左至右:操刀购物车改革的行久,交易团队产品经理的雨疏和开发老师傅智静好,故事讲到这,我们有关消费时代的主角们就已经悉数登场:商家手中普通的商品正在被各种工具更高效地整合、抽象,形成生活方式;
这些商品和生活方式又通过更强壮的“推荐引擎”和“搜索引擎”和消费者相连。
它们共同组成了一个工程链条。
只有当这个工程链条成为一个稳固的技术地层,更新的、更华丽的、更朋克的消费场景才有可能涌现。在2022年春天,我曾经和几位淘宝的技术大牛聊天,写了《像素时代的黄昏和淘宝叛军》,说的正是电商这个有20多年悠久历史的行业正在冲破屏幕的二维“像素”限制,向三维的“体素”世界挺进。我把这些变化总结为“人的体素化”、“资产的体素化”和“场域的体素化”。你在淘宝买衣服的时候,会发现很多商品头图下面都有一个“尺码”标签页,点进去,就可以看到这个衣服的不同尺码和你身材尺寸的对照,自动给出尺码建议。当然,使用这个功能的前提是——你要先把自己身体的尺码手动输入进去。因为不是每个人都记得自己的三围,多数人也不是裁缝,很难有那个心肠去把自己从上到下量一遍。魔尺的工作方法是:根据你的购买记录,直接猜出你的三围。当然纯靠猜还是会有一些出入,你只要穿着紧身衣拍两张照片,身体三围的尺码就可以被精确计算出来了。“不对吧,魔尺又不知道我拍照的时候距离镜头多远,这样算出来准吗?”我问。“其实在拍照之前,你还需要把身高和体重这两个数值输入进去。自己的身高和体重是绝大多数人都能说准的,照片加上这两个数值,三围就很容易算准啦!”他说。如果测量身体数据的门槛大大降低,就会有越来越多的消费者就会愿意测量自己的数据,系统也就更容易根据大家的数据推荐更合适的尺码。比如,你之前在 ZARA 买过衣服,现在想去优衣库买衣服,可是各个品牌尺码的真实大小会有差异,你不知道优衣库的什么尺码合适,于是系统就可以根据大数据,看看其他和你身形类似,并且同时在 ZARA 和优衣库都买过东西的消费者,Ta 选择了优衣库的什么尺码,这个尺码就多半也适合你。反之,如果一家商铺的衣服尺码标注不准,系统也可以根据在这家店买过衣服的消费者的身材,反推出这个衣服尺码的具体大小,从而建议商家做出修改。你看,这件事表面上是方便人们买衣服,实际上是把一个个具体的人拉进“体素时代”,让每一个人都有一个三维空间里1:1大小的数字分身。如果往未来三五年看,你的数字分身不会仅有身高体重三围,而是变得更精确,像你在数字世界的倒模硅胶娃娃一样,这个时候,你就可以让它替你试衣服,从而做到先准确看到一件衣服上身之后的效果,再决定买不买。
说到这,你可能已经发现,要做到这一点,我们还需要把各种商品也变成“体素世界”的模型。
如果家具退货像衣服一样方便,你猜它的退货率有多少?
其实他想说的是,一件家具和家里装修风格和整体环境的搭配是很重要的。如果搭配不协调,人是会很恼火的,只不过大件退货太麻烦一般只能忍了。。。可偏偏人脑又不太灵光,无法凭空想象出家具摆在自家房间里究竟是个啥效果,特别是你要同时想象沙发、茶几、床、落地台灯,墙上还挂了几幅画的时候。锦里他们给出了一个简单到令人发指的解决办法——贴画。你给家里拍张照,然后淘宝把你要买的家具图片用AI“剪下来”,贴在你家的照片上。你还可以自动调节大小,位置,让不同的家具各就各位,这就是“放我家”的功能。锦里告诉我,他们过去走了不少弯路,一边构建用户家里的环境3D模型,一边构建商品的3D模型,但后来发现,这样的操作虽然能实现,但代价非常大,用户恨不得鼓捣半小时才能给自己家建模。目前最好的办法就是把几张纸贴在一起。。。因为人脑具备一种奇怪的脑补能力,只要把图片按照基础逻辑放在那,大脑就可以自动把它立体化,想象得八九不离十。“你可以试试,把沙发和茶几选在一起,沙发总会出现在茶几后面,而这些家具的位置也不能天马行空地挪动,无论前后怎么移动,它们的脚始终站在地板上。这背后,其实是我们用 AI 提取了用户家的三维结构,可不是简单的叠图。”锦里挑挑眉毛。锦里说,其实他们已经做好准备,唯一等待的就是更好的空间构建工具和模型构建工具。比如,也许一两年后,手机的空间建模能力就会大大增强。到时咱们只要站在屋子里用手机摄像头轻轻一转,这间屋子就自动生成了一个3D空间模型;同样道理,商家也可以拿着手机绕着沙发走一圈,就像脱壳一样把一个沙发的3D模型给构建出来了。用手机建模的技术已经在爆发前夜。在《像素时代的黄昏和淘宝叛军》里,算法大神友闻就介绍了一种叫做 NeRF 的模型算法,很有希望实现“扫一扫,出模型”的效果。感兴趣的浅友可以点击链接去复习。而且,这些“放我家”的图片我们会帮用户保存,用户随时可以来替换掉家里的环境,或者替换掉某个家具。将来他们也同样可以把一个2D物体换成3D物体。
由此,淘宝的野心闪现,他们其实在构建一个从2D世界到3D世界的“平滑演进路径”。梦想说得太多就会变得廉价,但构建一条从现实通往梦想的路径,才是真正有价值的事情。其实场域的体素化,还有一个更加耳熟能详的名字,那就是元宇宙。当然,不得不承认,元宇宙在今天还是一个概念大于实际的东西,但是这并不妨碍一些先锋小分队开始探索元宇宙和电商的结合。比如,天猫市场部的同学南杉告诉我,他们从2022年7月开始,就在“XR直播秀场”里搞了好几场时装发布会。所谓“XR直播秀场”,就是舞台上所有华丽的背景和现场装潢都是由代码构建的——就像电影《头号玩家》里那样。正因为虚拟构建,这样的发布会比真正的时装发布会成本要低很多。这使得原来没有计划搞发布会的新锐品牌也可以低门槛组织一场发布会,充分定义自己的品牌调性,吸引消费者和粉丝。甚至,原来一些不适合单独搞时装发布会的品类,例如珠宝首饰品牌,也可以搞专属发布会。2022年的“双11”,我特别去淘宝的 Web3.0 虚拟展区看了一下,里面有顶级手机 VERTU,有咖啡新贵 Blue bottle,还有老牌奢侈品 Burberry 的香水。在我看来,这些尝试像种子一样,试图定义一个由体素构成的场域。在这些场域里,人们可以更准确地 get 到商品和生活方式的关系,一些现在看来小众的商品,用户的喜爱也会被淘宝的 AI 感知,有机会在技术的庇佑下成为不久之后的爆款。当种子生根发芽,让某些场域慢慢固定下来,慢慢被人喜欢,有更多的消费者愿意控制自己的数字分身在这里逛街、体验,有更多的商家愿意把商品搬进来展示、推荐,那个人们心中的元宇宙才会缓缓降临。接受了一通淘宝老司机们的疯狂输出,在回来的路上,我点开淘宝,盯着屏幕发呆。我渐渐得出开头的那个结论——消费已经成为了一种人人都参与其中的运动。再仔细想,在这种运动背后,其实凝结着大量“人类思考”和“无差别的计算”。对于一个“消费达人”来说,几乎所有的知识、经验、思考都酿成“品味”,存在于ta的脑海中。但对于一个普通人来说,他们并没有在自己的大脑里为消费留下更多的计算空间,他们需要额外的力量帮助,才能迈上面前横亘的消费台阶。一个潮流穿搭,背后凝结着无数时装设计师和服装产业共同推动的流行趋势;
一个露营主题,背后是无数人露营达人用肉身和实践探索出的生活方式;
哪怕仅仅是一个准确的图搜引擎,也是从百亿“商品图片”和“商品标题”背后的人类普遍知识中抽取的结晶。
如此看来,淘宝在做的事情,可以抽象为把那些存在于少数个体中的品味和经验凝结到云端,然后低成本下发给更多普通的消费者。新新人类对消费主义趋之若鹜,“清教徒们”对消费主义恨之入骨。但他们都必须接受,现代世界是由消费主义文化支撑运转的。在这个前提下,技术让人们看到了一种可能,那就是“有关消费的思考”不再由个体完成,而是藉由计算力连接,让亿万人有机会作为一个整体去构建,从而向更理性、更高效的方向跋涉。
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing