查看原文
其他

教你掌握互联网的“流量密码”!2023年轻人新命题:建议专家不要再建议了!《追AI的人》第23期直播回放

直播回顾

《追AI的人》系列直播第23期邀请了中国广告协会法律与道德工作委员会常务委员杜东为老师分享《算法治理拉开帷幕,知识需不断碰撞融合》
以下为直播的文字回放,共计12733字。
直播简介回顾:主流电商平台内容推荐算法有何区别?算法治理拉开帷幕,知识需不断碰撞融合《追AI的人》第23期来咯!

杜 东 为

现任中国广告协会法律与道德工作委员会常务委员。同时受聘于国家市场监管总局发展研究中心新零售和直播电商专家委员会专家等;并且作为主笔人,起草了国家工商总局《网络商品和服务集中促销活动管理暂行规定》(国家工商总局77号令)。


分享大纲

🎈 算法在各行业的应用及发展
🎈2023年年轻人新命题:建议专家不要再建议了。算法是多方知识重新融合的过程,治理中追求专业融合,不存在专家。
🎈用户、网店、up主、骑手、监管部门如何看清算法怎么回事?
🎈大数据杀熟
🎈字节、快手、小红书等内容推荐算法与京东、淘宝、美团电商推荐算法有啥区别?




在算法治理领域,包括我们的算法AI,已经不是刚刚开始,但仍处于往上走的阶段。在算法治理中,涉及到不断重新融合和碰撞的各种知识,这是一个非常新的领域。如果回顾整个互联网发展历程,可以发现技术一直是推动发展的驱动力,商业结构的变化和矛盾冲突随之而来,法律和智力的变化则在此之后发生。

现在,技术的生产力正在快速增长,但这也带来了许多矛盾。但是,作为一个全新的知识领域,可能不存在真正的专家。这是一个重新创造的过程,因此应该是新领域无专家、新领域新专家。

在这个过程中,会产生更多的新专家,而不是基于传统知识结构的旧专家。与工业时代不同,现在的互联网趋于扁平化,AI的各方制度的融合性,这都将产生各种新的专家。因此,在这个时间点,我认为不存在真正的专家,而是大家通过不同的知识结构碰撞,产生新的火花并创造新知识的过程。

每个人都可以从自己的视角出发,将自己的知识和算法知识以及其他知识融合,阐述新的知识,这可能会引领或推动这个时代的新发展。这也是我们这一代人的使命和荣耀,因为我们正好赶上了技术浪潮的快速变化和快速发展,这种机会在历史上并不是每个人都能抓住的。



目前算法治理刚刚拉开帷幕,知识是一个不断碰撞的过程,算法在各行业都有很好的发展。举例来说,美国的杀人蜂可以人脸识别定位目标使其爆炸,是非常可怕的军事武器。而高德地图在缓解交通压力方面也发挥了很好的作用,它能预测路况,告诉司机还需等几个红灯才能通行,从而减轻司机的焦虑。


此外,人工智能在医疗领域也取得了许多成果,如通过眼底照片可以识别出糖尿病、高血压、动脉硬化等等。而大疆无人机则在农业领域取得了很大突破,它可以识别果树,并均匀地喷药,从而提高农业生产力,降低成本。


例子:渐冻人再次发生时,将屏幕上的文字转换成声音输出,从而解决了医疗方面的问题。



现如今,我们生活中最熟悉的APP,从PC时代的搜索算法到移动端的推荐算法和基于地理位置的服务,已经改变了我们的生活习惯。智能商业和智能出行等方面都得到了进一步发展。


在电商历史上,2015年是一个移动端的重要转换时期。那时候有一句话叫“All in 手淘”。因为PC用户们普遍开始使用智能手机,这就导致整个行为逻辑发生了变化。在过去,使用淘宝搜索框时可以轻松地一页一页地浏览几十个商品,不觉得累。但是在小屏幕上,只能展示6-8个商品,需要频繁滑动屏幕,会感到很累。


因此,小屏幕的逻辑就需要更加准确地推荐商品。电商有一个公式叫做PV(页面浏览量)乘以转化率乘以平均客单价,等于GMA(交易额)。如果在PC时代PV转移到移动端时,PV没有变化,但是转化率下降了,那么就会出现问题。这意味着推荐不够准确,会导致购买转化率降低。


实际上,小屏幕的逻辑和大屏幕的逻辑是不同的,因此推荐算法就变得非常重要。字节跳动、抖音和其他移动应用程序的推荐算法就是其中的一例。此外,打车软件也是算法的应用。这些算法可以解决许多商业变化带来的问题,包括满足个性化需求,以及帮助长尾消费者找到长尾商家。最后,推荐算法的覆盖率也需要足够大。


尾长尾商家不需要找到大众消费者,而是只需要找到对应的消费者,因此在整个社会的匹配效率和信息匹配效率除去搜索以外,用推荐可以大大提高匹配效率,如滴滴、美团等应用产生的推荐服务。



然而,推荐算法也出现了很多问题。其中,“信息茧房”这个词被说烂了,但实际上是存在的。另外,第二个问题是上图展示的“调度决策”的问题,困在系统里的人。第三张图是刷量控评控评论的问题,这个问题被称为“万词霸屏”,实际上是搜索算法中的一个问题。
我看了很多种算法论文,各方面的论文都看了很多,其中有技术派写的、通过数据角度分析的、通过法律角度分析的、通过传播领域分析的等等。然而,我发现有些知识在写文章的时候没有能够真正地融合,这恰恰是这个时代需要做的事情。不同领域的人需要一起来治理算法,而不是只懂一个领域而不懂另一个领域。比如,现在网信办在加强自媒体的治理,自媒体的治理是针对内容源的治理,而对于算法来说则是数据流的治理。


如果没有算法给这些自媒体流量,自媒体形成的商业模式也就不会有那么多假消息、谣言等,这也就不会引起中央网信办专门出台治理措施的事情。因此,商业惯例、算法和内容需要多方融合,而不是通过一个维度就能够解决算法的问题。对于数据而言,我们需要考虑什么数据可以使用、什么数据需要出参、什么数据在算法时需要设闸门不能使用等,因为在每个场景和每个环节都存在问题。因此,请专家不要建议, 请专家趴在地面上,把事情研究清楚后再来发言。


专家们在讨论视频指纹技术和音频指纹技术的技术原理。如果了解这些技术原理,就不会轻易发表意见。因为现在这项技术已经能够做到这件事,而且成本并不高。问题在于如何重新分配利益,即版权方和平台方各自承担多少责任,如何开放接口,以及如何确定我们花费多少时间。我们需要讨论如何识别二次创作、治理视频剪辑,以及如何将流量分配到人工审核和机器审核上。


因此,我们需要讨论这些问题,而不是听到一个专家说“我做不到”,就认为这件事不可能完成。如果对这项技术原理一无所知,那么再发表意见也没有任何意义。因为互联网有记忆,这些质疑和意见将被永久记录在历史的耻辱柱上。所以,我们不需要专家的建议,我们需要专心调研和解决问题。


中央政府和国务院都提倡大力进行调研,因为在办公室里只会遇到难题,到一线上才能找到真正的解决办法。贴在地面才能解决问题!所以回到前面提到的“新领域、无专家,新领域、新专家。


现在,算法治理已经正式开始了。在2021年,中央网信办和公安部开始进行检查评估,网信办也开始进行立法的调研会。中宣部和人大出台的《个人信息保护法》与算法有关。此外,还制定了《互联网信息服务算法推荐管理规定》,这是一个非常高水平的规定。它清晰地表述了算法应该如何定义、如何治理以及保护哪些权利。这对我们这个时代来说是非常不易的。


今年出台的《互联网信息服务深度合成管理规定》,包括打标识的规则和禁止作假等要求。这些规定出现在AIGC兴起前期,包括现在ChatGPT这么火的情况下。


在市监领域中,上海市出台了《上海市网络交易平台网络营销活动算法应用指引(试行)》和《关于落实网络餐饮平台责任切实维护外卖送餐员权益的指导意见》,这些算法都是为了保护相对弱势群体的权益,如消费者、劳动者和中小商家等。这些权益需要制度、机制、法律和治理来保护。


现在很多法律都提到了算法,但对于算法的内涵以及应该如何管控还不是特别清晰。这是因为知识融合不够,需要更多的讨论。在这个时代中,需要提出好问题和真问题,以了解问题的本质。例如,算法广告是通过算法推荐服务的一种形式,而这种服务是否属于广告,各方应该承担什么责任等问题需要进一步探讨。此外,像内容产出者这样的人在生产内容时,如果含有推荐某个商品或服务的内容,这是否也算广告吗?这是需要探讨的问题。



政府事务部门和交警都会与骑手互动,以缓解交通秩序问题。但是,在实际操作过程中,这些问题是表层问题还是底层问题需要更深入地思考。例如,运力提供者需要根据APP的要求尽快完成任务,但这是否考虑到了骑手的因素了吗?效率是重要的,但不应该忽视人的身体健康和安全。


在中国历史上,有句古话叫“大乱有大治”,这意味着当事情变得混乱无序时,就需要一个大的治理出现。这篇文章《外卖洗手困在系统里》探讨了外卖平台骑手的问题,希望能引起更多人的关注和反思。


《互联网信息服务算法推荐管理规定》中的第四条和第十二条都提到了公开透明和透明可解释性,但是这些词语的具体含义并不太清晰。去年我们备案算法时,公示的内容有些相对细致,而有些则比较粗略。全面透明显然也不现实。

今年的315报告中,看到了很多有关刷单、刷量、刷评论、等行为的报道,这些实际上是在与风控算法进行对抗。风控算法需要与这些行为进行对抗,这也是其中的一个典型案例。


现在有许多平台在进行BC端联合套现,例如滴滴有补贴时,司机和乘客虚拟单套现,电商补贴时也是如此。BC端联合套现还包括各种灰黑产的广告,这些广告通常声称可以获得高额回报。

这些广告往往会投入大量资金来换取高收入,因此只有骗子才会做出这样的投资。广告中也会出现一些虚假的产品,如减肥、丰胸、壮阳等。这些减肥糖果、减肥咖啡产品中含有西布曲明,但由于西布曲明有一些问题,现在已经被禁用了。然而,这种内容仍然大量存在于灰黑产业里。因为如果透明化这些问题,就会对整个互联网行业和金融互联网行业产生负面影响。


在这种情况下,规则肯定不能完全透明,因为透明的规则会引来疯狂的代理商和广告主试图绕开它们的文字、图片、音频和视频识别。如果规则都透明了,那么它们试探的成本就会降低,同时还会有一些人通过变体字、虚拟机器人等方式绕开规则来欺诈。例如流量作弊。

流量作弊指的是虚拟机器人来点击广告,以骗取广告主的广告费。难以界定人、机器人点击。搜索引擎算法、手机地理位置等也会受到这种情况的影响。如果算法透明了,那么就会有人通过各种方式绕开它来进行欺诈。


因此,算法的透明度不能过高,而应该有一个适当的保密度。然而,这并不意味着算法不应该进行改进和优化。例如,像饿了吗和美团等平台都在进行算法改进,进行“算法取中”。



企业需要提高信息匹配效率,但公平性也应该被考虑进来。社会角度看待算法的可靠、安全、能理解,并要求公平性。不同类型的用户对算法的理解程度和需求也不同,因此算法服务提供者应该提供不同的解释和选择,以满足各种需求。普通用户只需要了解基本原理,而商家想知道流量如何来,专家则希望能解析算法。监管部门需要可监督和了解算法的使用情况。



流量规则的透明化和公平性对于平台和内容产出者都很重要。监管部门需要深入了解这个行业,并希望行业更加透明和合法。知识和认知的融合是必要的,需要找到平衡算法治理的最佳方法。期待应该被分为合理理性和合法。

其次,透明度的合法性是有争议的,因为算法被认为是每个公司的核心商业机密。因此,揭示它们可能会损害他们的商业机密。如何平衡双方的利益?在我看来,这需要一些限制。


至于第三点,期望普通用户具备透明度是合理的吗?事实上,普通用户只需要知道算法背后的原则,而不一定需要知道所有细节。向他们展示代码可能是无用的,因为他们可能不理解。然而,如果有人需要了解许多算法细节,他们可能不是普通用户。他们可能是一些试图测试平台规则的灰色人物,这可能会增加控制非法活动的成本,并产生社会成本。


因此,要实现透明度,我们需要同时考虑多个目标,而不仅仅是单一的目标。这些目标包括:
1.学者、监管者、公众和B和C的理解和共识。

2.灰黑产活动治理难度和成本没有显著增加

3.公平正在提高,算法不确定性正在逐渐降低

4.商业机密保护没有受到影响


四个目标必须同时兼顾,才是好的透明度的推进方式,而不是单一目标。只关注一个目标可能会导致在其他目标上的失衡。


有句话说:“杀人易,救人难;进取易,平衡难。”摧毁一个算法很容易,但让它对每个人都公平却很难,因为很多都是面对亿级的群体。让算法透明很具有挑战性,因为不同的用户对透明度有不同的期望。我们的目标应该是找到一种推广透明度的方式,以满足不同用户的需求。



谈谈“大数据杀熟”问题。图片中的红色框显示了系统跟踪账户并向某些账户发送优惠券,但不发送给其他账户。



然而,让我们来看看法律方面。《上海市网络交易平台网络营销活动算法应用指引(试行)》指出,网络交易平台经营者应用算法时,应根据行业类型、业务场景等实际情况,科学、合理地设置相关参数条件和权重。网络交易平台经营者不应将浏览次数、支付意愿、支付能力、依赖程度、交易频次、交易时使用的终端设备品牌等作为与消费者进行交易的条件参数。



第九条《反垄断法》规定,在交易价格、交易机会等方面不得实行不合理的差别待遇,但排除了交易习惯和行业惯例。这就引发了人们的疑惑,什么是交易习惯和行业惯例呢?


另外,反垄断法还规定,不能因为没有正当理由等原因实施差别待遇。但是,什么是正当理由这个词很抽象,让人难以理解。



商业惯例情形一:因渠道、时间、促销活动、供需关系不同等导致的价格差异

首先是渠道不同导致的价格差异,比如在不同的网店购买同一品牌或型号的商品,价格不同;汽车4S店的价格也会因为补贴不同而不同。另外,直播间和商家之间的价格也有差异,可能是因为平台补贴、量大反向团购等商业情况。


其次,时间不同也会导致价格差异。这可以分为基于商家所掌握的时间带来的差异和因时间产生的成本不同。例如,培训课程通常会设置早鸟优惠,这是因为商家需要提前锁定开班人数,且前面报名的人享受优惠;而买菜早上的菜价会比傍晚的菜价贵,这是因为成本和物流等方面的原因导致的。



商业惯例情形二:特殊群体优待导致的价格差异

商业价格的不同源于多种因素,例如参与的促销活动、供需关系、特殊群体的优待和按照职业、性别和民族的划分。不同的促销活动,如满减、抽奖和限制打折等,会导致价格不同。

另外,供需关系也是影响价格的因素,供给不足会导致价格上升。特殊群体的优待也会导致价格不同,例如国家指引中针对残疾人、老年人、未成年人等弱势群体的优惠政策。此外,按照职业维度,如军人、教师、警察、医生、护士、学生;按性别性别和民族的划分,如女性和少数民族等群体可能会享受不同的优惠活动。包括烈士家属、军人家属、残疾军人等,这些商业惯例符合社会的道德期待。


商业惯例情形三:基于不同交易条件导致的价格差异


商业管理中有三个基本交易条件,它们导致了价格的差异。在购买云盘或视频会员等产品时,根据交易持续时间的不同,价格也会有所不同。此外,信用情况也会影响交易,例如在京东白条或百度借条等情况下,信用评级高的人可以获得更高的贷款额度和更低的利率。

商业惯例情形四:因拉新、促活导致的价格差异


拉新和促活是商业管理中的两个关键策略。拉新是指吸引新用户,包括平台、品牌、店铺、新产品等。线上拉新的成本很高,因为流量已经饱和,所以拼多多采用线下方式,通过发二维码等方式吸引新用户,降低广告成本。而促活是为了避免沉睡用户,例如在音乐APP中,如果用户七天内没有使用,则被视为沉睡用户,需要通过促销等方式重新吸引他们的注意力。


电商平台的淘宝和拼多多APP两个月没有被登录,这种情况并不正常,因此平台需要通过触达方式向用户提供一些优惠,以触达用户并再次引导他们在平台上交易。这个触达行为也同时给商家提供了一些机会,通过给予用户优惠,吸引他们进行交易,以达到拉新和促活的目的。

商业惯例情形五:在参与机会公平的前提下,某些激励活动可能导致的价格差异

在商业管理中,为了公平地参与活动,一些激励活动可能会导致价格差异,例如积分商城、金蛋等游戏可以给用户提供积分或金币,这些可以用于兑换红包、奖励等。这是参与互动过程的一种方式,购买会员等级也可能在运费和其他方面提供折扣和优惠,从而影响价格。在电商中,商家通过让用户成为粉丝,例如在抖音或直播间加入粉丝团等,长期构建商业关系,并通过此方式来订阅和触达用户,同时降低整个运营成本。


这种情况在线下也同样存在,例如超市会员等,可以获得积分返点、折扣等特权。此外,还有随机抽奖等活动,这背后实际上是对公平的要求。


公平性在算法中经常被提及,但是公平性有很多种,如过程公平、结果公平。过程公平”,意即算法平等对待所有参与者,各方享有平等的机会、条件和权利;“结果公平”,意即算法应当从参与者所拥有份额的相对关系出发,确保有价值事物得到平等分配。我认为,过程公平大于结果公平。群体公平大于个体公平。对于每个人来说,对公平的理解可能会有所不同,法学家、物理学家、体育老师和消费者等了解和理解公平性的部分也不尽相同。因此,在商业中讲述公平性,需要同时考虑不同的因素和角度。


例子:在日常生活中,打车时是否给老年人让座会引起矛盾和冲突,这时我们需要将场景细分,考虑公平的问题,群体公平大于个体公平。



在算法中,商业惯例是考虑公平的一种视角,但要注意可能出现的大数据杀熟或算法歧视问题,其中数据因子包括前购中的行为习惯、售后行为习惯和质量要求中的差评比率等。在购前,我们可以通过优惠方式鼓励团购和减少风险,如给团购者优惠等。在购中,我们需要注意行为习惯是否一致。



在售后,退换货的次数、频率和质量要求中的差评比率等也是可能影响公平性的因素。同时,需要避免用不恰当的词汇来描述职业,如职业打假人,应该使用职业索赔人更为恰当,例子中的这个人其实不是为了打假而来,他是为了索赔而来的。他让全国市场监管机构和司法机构的行政资源和司法资源都浪费了,但是我们不能仅仅因为这个标签就歧视他或拒绝与他交易。

消费位置也会影响消费习惯


例如,一线城市和五线城市的消费者拿到同样的化妆品可能会有差异。区分常驻城市与差旅城市,如果我在北京经常打车,我会对距离有一个大致的概念,但是如果我到南京出差,我就可能不太清楚距离,但是这个价格是否和当地的价格相同就需要考虑了。不同的场所特征也会影响消费习惯。如果我要给市场监管局寄快递,我肯定不敢寄假货。

商业消费习惯可能会成为歧视因子


它包括消费能力、对消费的敏感程度、对特定产品的偏好程度以及消费习惯所反映的消费能力。举个例子,如果我每年在京东和淘宝上花费10万元,相对来说,我是一个大户,价格承受能力可能会更高,我的机票价格可能会更贵。假如我敏感程度不高,那么我对打折优惠就并不敏感。

假如我的特殊偏好是对茶和酒非常感兴趣,这意味着我对茶和酒的价格非常敏感,而对其他商品的价格可能就不太敏感了。这些都影响了算法决策。消费意愿可以通过点击、浏览、加购、完播观看和转发等数据来判断,如果我连续在点一个商品,那么我可能会加入购物车,我的购买意愿就会更强,消费意愿对于平台和商家来说很重要。



在促活跃状态方面,商家和平台可以给用户一些优惠,从而避免拉新成本。如果不给用户优惠,用户可能会流失,商家再通过广告花费来拉回用户的成本非常高,因此商家可以给用户优惠券,让用户在商家处消费并继续活跃。


活跃状态的两个重要指标是休眠期和流失期。休眠期是指用户在一段时间内没有使用平台,电商可能休眠期较长,而音乐平台可能只需七天。流失期是指用户即将从平台卸载或流失,为了挽回用户,商家应该付出一些代价,避免拉新成本过高,比如通过推送热门歌曲或向用户推荐尖货、福利和权益等方式唤醒用户。



每个平台都有会员体系,比如滴滴的v5和v8,不同等级的会员享受的服务也不同。会员等级的提升与用户的活跃度、消费和累计等指标有关。商家可以通过给用户优惠券等方式鼓励用户在平台上继续活跃并升级。在活跃度方面,平台也在算账,所以用户看到的可能只是一个局部,并不是大数据杀熟问题。


拉新和促活是商业场景中非常重要的概念,不需要促活的行业如搬家、修锁、修空调从来没有促活过。这是因为这些行业都是一锤子买卖,不需要长久关系。然而,这些行业广告中常常有欺骗消费者的情况,如乱收费等。因此,这些行业只有拉新场景,没有促活场景。


在商业场景中,顶级商业都在追逐拜物教。拜物教是指消费者对某个品牌的盲目崇拜,类似于宗教信仰。星巴克的标志“塞壬”就是一个拜物教的标志,它能让消费者联想到星巴克的味道。顶级商业如苹果为了追求拜物教,会使用一些仪式、标识等手段,吸引消费者进入店铺。


在广告中,品牌广告和效果广告是两种不同的广告形式。品牌广告的本质是让消费者爱上品牌,从而增加复购率和下次成本。效果广告则是为了实现特定的目标,如点击率和购买率。这两种广告形式在商业场景中可能融合也可能独立存在,它们构成了商业活跃度的要素。



平台选择的活跃度要素包括登录指标、互动指标、停留指标和交易指标等,每个平台根据自己的商业策略和激励设计选择不同的要素。


大家都知道,各种平台都会发布各种徽章,这些徽章其实是一种社交货币,可以激励用户更加积极地使用平台。比如QQ体系的徽章就可以激励用户使用该平台,徽章的数量也代表了用户的活跃度。徽章不仅是一种正向激励,还包括了物质激励和精神激励等方面,商家可以利用徽章激励顾客进行消费,促进活跃度的提高。


有很多商业误解需要澄清。例如,一些商家要求消费者支付开瓶费和包间费,让一些人觉得这是黑心商家的行为,但实际上这些费用是由有消费能力的人支付的。在充分竞争的饭店行业中,每家饭店的平均利润率差不多,而富人支付更多的开瓶费可以降低整体菜价,让进该饭店只吃菜品非商务宴请支付意愿或能力低的人,也可以享受到美食。如果取消这些费用,饭店仍需要维持其利润率,那么就只能提高整体菜价。


例子:我是一位穷人,从来不喝酒,只点鱼香肉丝和宫保鸡丁,因为我是穷人,如果没有开瓶费,我的账单会变成35或者41元,对吧?与此不同的是,富人没有开瓶费,他会很开心,因为他的消费会降低。原来,在有开瓶费的情况下,这是一种富人反向补贴穷人的机制,但现在被打破了。如果通过规定强制要求开瓶费,谁会受到损失呢?像我这种穷人会受到损失,因为我的消费会更高。这是一个非常巧妙的市场机制,如果通过行政指令打破它,没有意义。


从大数据的角度出发,我作为穷人,精打细算,特别喜欢寻找各种优惠券的组合。在这个平台上,我可以充分地找到各种各样的优惠券。这个平台的利润不会超过市场的回报。这和那些不愿意寻找优惠券的富人不同,他们只是买了就走,他们也是在反向补贴穷人。这和开瓶费是一样的。


因此,在研究大数据杀熟的时候,我们需要从经济学的视角来看待问题。如果只从法律和治理的角度出发,可能会忽略经济学的暗线,导致整个社会的混乱。免费加广告也是同样的问题。虽然我们使用互联网平台都是免费的,但是广告实际上是由支付能力更强的人来消费的,平台补贴了这些免费的内容,提供了流量和基础设施。这是一个普遍的模式,而不是特例。


最后,如果平台有所谓的“杀熟”失去了消费者的信任,最终会得不偿失。




之前提到了拉新用户需要花费数百元,并因此失去了用户的信任。这引发了一个有趣的话题:推荐算法看起来好像都很相似,例如字节、快手、拼多多、京东和淘宝的推荐算法,但实际上它们是非常不同的。


首先,我们来谈一下推荐算法的原理。在推荐算法中,推荐逻辑与订阅逻辑完全不同。对于订阅逻辑,例如订阅的微信公众号,只需要发布好的内容即可,而不需要去适应算法的规则。然而,在推荐算法中,必须迎合其流量规则才能获得更高的流量。这是两个完全不同的逻辑。



在内容场景中,基本逻辑是协同过滤。协同过滤有两种大的逻辑:一种是基于人的协同过滤,另一种是基于物品的协同过滤。


算法的基本逻辑包括召回、粗排、精排和重排过程。其中,召回是根据用户的特征,从物品库中召回潜在商品。举个例子,当你搜索鱼肉或者想要推荐相关内容时,算法会与池子里的内容进行关联,提供相似的东西。这其中还包括排序过程,即粗排和精排。对于大量的数据,可能需要分成两个环节来完成粗排和精排。


我认为《互联网信息服务算法推荐管理规定》写得非常好。此外,在法律规定中提到的“去重”,这个词非常准确,尽管它是一个技术词汇,但在法律规定中出现,我认为非常合适。


举个例子,现在我们一直在讨论正能量的问题,包括如何控制正能量的比例,如何识别正能量等。我认为,还可以进行“量控”,未来还有提升的空间。



通用算法和推荐指标包括信息维度、交易维度、体验维度和其他维度。这些维度包括点击率、下单率、购买量、bad case比例、不喜欢率、用户数、停留时间、GMV等。综合考虑这些指标可以提升我们的工程师或平台关心的指标。


内容推荐算法的评价不仅仅是商业利益的评价,它还应该考虑其对社会的影响力。因为内容推荐算法还承担着整个社会风气、社会风向和意识形态等更多社会责任。这里考核的是推荐算法,如果经常推荐低俗、庸俗的东西,那么就会影响人的思想。这里有两个非常关键的指标,一个是新颖性和惊喜度,这些指标可以打破惯有的套路。新颖性指的是令人感到新奇,惊喜度指的是在期待之外的惊喜。


例如,如果你听了一首周杰伦的歌,然后推荐给你另一首周杰伦的歌,可能是因为它们的歌手、风格类似。但如果推荐给你一首陶喆的歌,那就是因为它与周杰伦的风格相同,预料之中。如果接下来推荐给你一首《孤城》,结合前面歌曲里含有的中国风推荐了这首歌,它让你感到惊喜,因为它不在你的预期之内。



如果我们的推荐算法中惊喜度越高,信息茧房的可能性越低。排序综合考虑了许多因素,其中包括B的质量、物的质量。对于作者和商家的质量分,主要考虑了从推荐角度和内容的创作阶段,同时也考虑了他们的商家质量分。后面会提到,百年老店和新开一年的店铺肯定不一样,信用值也不同。



平台需要维护商家和用户之间的稳定关系,这些关系需要产生持续的内容。对于内容作者的质量因素,主要分为两类。第一是内容原创性,越原创的内容,质量分就越高。因此,我们鼓励原创。第二是账号的活跃度,如果你的账号发布的文章点击率、点赞数、评论数、弹幕数、收藏转发数等都更高,那么你的账号活跃度也会更高。因此,许多头条作者会在评论中回复留言,以增加互动。


内容垂直度指的是假如我是一个电影二创作者和音乐评论家。我的作品都是关于电影和音乐的,因为我认为只有专注于特定领域并垂直深入才能更专业。这种垂直深入是产生更多专业价值和专业能量的因素之一,也就是所谓的“内容垂直度”。


第四个因素是粉丝互动性。当我们的内容被粉丝转发和评论后,即我们的内容质量很高。当然,这也可以从数据上证明,但是如果我们的平台过于追求打开率,那么标题党就会出现。标题党可以吸引点击,但不能保证内容质量。



第五个因素是内容传播度,即内容的影响力。这也与平台定位有关。每个平台都有不同的用户群体和调性。我们需要选择符合平台调性的内容。举个例子,如果一个和平台用户不太搭的人在平台上出现,他可能无法获得更多的流量。


最后,我想分享一个有趣的广告案例。小红书投放了一则针对男性用户的广告,但是使用女性吸引男性。这是因为互联网社区需要符合“三近一反才能火”的原则即近距离、近兴趣、近年龄和反性别,才能获得更高的火爆程度。所以,小红书想吸引更多男性用户,因此投放了这样的广告。


刚才已经提到了,这个平台需要推广适合自己和平台定位的内容。其次,它应该支持内容的原创者和贡献者。第三,更好地连接作者(内容)和粉丝。因为作者会绑架平台,因为作者可能会通过私域粉丝影响平台收益,因此在某些内容平台中,作者不会出现在推荐流中,但是平台会推荐类似的账号。


平台在建立连接时更注重的是内容和粉丝之间的关系,而不是账号和粉丝之间的关系。这是因为大号可能会绑架平台的商业机制。这也涉及到竞争关系。在推荐流或订阅流中,给出的量是否得到相应的流量?


1、店铺自身信用:电商平台信用分越高,流量可能越高。

2、店铺服务能力:服务质量、商品运营能力和消费者互动程度这些因素将直接影响流量。

2、商品运营能力:包括销量定价是否合理,爆款尾货销售能力。

4、消费者互动程度:店铺收藏,更多加入购物车。如果平台给出的信息不准确,消费者可能会感到混乱,这将导致他们离开平台。因此,对于电商平台而言,卖的不仅仅是图片和视频,还有交互体验。如果平台不能提供准确的信息,消费者会离开。


这些因素会影响我们平台和消费者之间的生态环境。重复的关键词会降低算法的质量评分,如在标题中使用单人床、双人床、充气床、99厘米、单立柱和包邮等词汇。同样的,品牌的过度使用,如小米、三星、苹果、OPPO等,也会占据流量,但无法提高评分。


同样的,将商品分类放错也是不好的做法。使用牛皮癣图片也会影响消费者的购买欲望。这些因素会导致平台和消费者之间的生态环境变得不良。



然而,也有一些因素能够提高算法的评分,例如:图片质量好、商品信用高、商品类别清晰等。算法的本质是帮助外商发展,建立一个良好的循环,而不是越来越差。内容和商品也是不同的,内容有保鲜期,如一些热门新闻。


而且,内容还有地域属性,例如推送本地新闻会更加受欢迎。但是,电商更喜欢跨地域销售,所以电商算法和内容算法还是有所不同。


对于重复的内容,消费者的接受度会降低,因为他们不想看到相同的内容。商品是不同的,因为消费者希望能够货比三家。



接下来讨论电商平台选择的算法方向。平台的目标是:
1、吸引更多高质量商家入驻
2、提供更优质的商品
3、专业细分长尾价值
4、降低渠道成本。

以游戏机为例,小时候我们喜欢的游戏机叫做Game Boy,早在游戏机出现的时候就有一种服务,将你的老游戏机改装成带背光的版本。如果这种服务在实体店里开,很难生存下来,因为受众太小,无法维持店铺或者员工的日常开销。


但现在,如果我们在淘宝或者闲鱼上搜索,就能发现有这种服务,为什么呢?因为平台可以通过推荐算法找到与之对应的长尾消费者,从而获得足够的利润。通过长尾找到长尾的服务,长尾商品找到长尾消费者,推荐算法在这里发挥了重要作用。现在这种服务可以成为职业,而且生存得不错,为社会提供了很好的价值。当然,如果有一些稀缺商品,比如茅台或者苹果等,也可以获得更多的流量和更优质的商品。


在电商平台中,算法的作用是不断“破圈”来获得新客户。你可能以前从未购买过某件商品,但当你在淘宝看到它时,你可能会被推荐算法吸引,从而获得了一个新的购买选择。你喜欢的东西和你知道你自己所喜欢的东西,这是两个圈层,算法电商天然要击穿这个圈层。



在内容算法和电商算法之间天然存在差异。内容算法希望你在其中沉迷,更多地消耗时间并进行点击、播放和互动,以此来获得更好的商业指标。而电商算法则需要打破信息茧房来吸引消费者的注意。淘宝最近换了一个slogan叫“太好逛了吧”,希望消费者能够在其中发现新的购买选择并打破旧有的购买习惯。



往期精彩推荐点击标题查看文章● 两大看点大揭秘!《人工智能治理与可持续发展实践白皮书》

● AAIG成立一周年!砥砺前行,谱写新时代的科技之歌~请查收这份最新的自我介绍


● 月刊|AI治理必修第26刊|GPT-4震撼发布:多模态大模型,直接升级ChatGPT、必应,开放API,游戏终结了?


 听委员说|AAIG薛晖出席杭州市"两会",提出加快建立人工智能产业的多元协同治理机制


 不是超能力,而是科技力!安全稳健的神经调控疗法帮助瘫痪患者实现自由站立!《追AI的人》第22期直播回放


 “算法偏见”是概念炒作吗?「这个AI不太冷」第3期带你揭秘现实AI!

更多人工智能治理和可持续发展好文
点击下方名片关注和星标【阿里巴巴人工智能治理与可持续发展研究中心】

👇AAIG课代表,获取最新动态就找她 关注公众号发现更多干货❤️


有启发点在看喔👇
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存