《“大数据杀熟” 的背后:歧视的例外情形以及涉嫌歧视的因子》什么是商业惯例?
阿里巴巴人工智能治理与可持续发展研究中心(AAIG)浓墨参与编写了工商出版社出品的《算法治理制度》系列丛书,分别是《算法治理制度之竞争规制》和《算法治理制度之算法透明度》。
详情点击👉AAIG参编的新书发布!《算法治理制度》揭秘数字时代的法治机制!
现分享第二章《“大数据杀熟” 的背后:歧视的例外情形以及涉嫌歧视的因子》这几年,“大数据杀熟”成为媒体和立法中热议的词汇,媒体词“大数据杀熟”主要是认为有定价权的商家通过算法决策针对不同人群实施不同销售价格,对于“熟客”展示更高的价格,从而实现“杀熟”。这里的“熟”属于媒体给予的“定义”,主要指向算法决策中的差别待遇情形。
“熟”与“不熟”、新客与老客等,实际是商家或平台在不同场景下对用户的人群划分,类似还有会员与非会员、粉丝与非粉丝等,在商业场景中很常见,而要判断平台或商家在提供商品或者服务的过程中是否进行了“大数据杀熟”式的差别定价,从而构成“人群歧视”,笔者认为需要对人群歧视的例外情形和构成歧视的因子进行拆解,进一步讨论。
一、现有法律、指南等对差别待遇的例外情形
《电子商务法》、《互联网信息服务算法推荐管理规定》、《在线旅游经营服务管理暂行规定》等也对个性化定价行为都进行了回应和规制,而算法与竞争《反垄断法》、《国务院反垄断委员会关于平台经济领域的反垄断指南》、《上海市网络交易平台网络营销活动算法应用指引(试行)》等法律和指南,对“大数据杀熟”相关的人群歧视或差别待遇问题做了进一步明确,规定符合正当理由、行业惯例、正当交易习惯等因素的情形需要排除在外。
《反垄断法》第二十二条规定,“具有市场支配地位的经营者不得利用数据和算法、技术以及平台规则等从事前款规定的滥用市场支配地位的行为”,其中明确将正当理由排除在了滥用市场支配地位行为之外,但是何为正当理由,法条内并没有列举说明。
但在《国务院反垄断委员会关于平台经济领域的反垄断指南》第十七条中,列举了正当理由范围,将交易习惯、商业惯例、新用户、公平合理无歧视随机等正当理由排除在差别待遇认定之外。
2021年 11月,上海市出台了《上海市网络交易平台网络营销活动算法应用指引(试行)》,其中第九条对于算法中差别待遇提示了合规风险,也提出了符合交易管理和行业管理、新用户、公平合理无歧视随机性交易、保障弱势群体等属于合理理由,其中将保护弱势群体利益和安全做出的限制和差异性对待,列入了可以差别待遇的合理理由,进一步将合理理作了细化和完善,是一次非常有意义的探索和尝试。
由于现实情形比较复杂,仅通过法律文件中的原则性表述,行业从业者还难以准确把握监管、执法、合规等的边界,还需要将商业惯例、行业习惯等进行细致拆解,才能更加清晰地分辨合理的差别待遇,以及避免不良商家将不合理的差别待遇行为“包装”成商业惯例或行业习惯,从而对消费者或交易对象进行不合理的差别待遇。
二、构成商业惯例、行业习惯等的例外情形
分析“大数据杀熟”背后是否存在人群歧视,首先需要将商业惯例等合理情形区分出来,并找出可能构成人群歧视的数据因子、权益因素等,才能制定预防规制措施。以下将从行业视角,具体分析属于商业惯例等的例外情形。
(一)因渠道、时间、参与活动、供需关系不同等导致的价格差异
2. 时间不同
包括两种情形:一是基于商家锁客时间不同带来的价格差异,如临飞的机票价格可能低于早购买的;某些培训课程设置的“早鸟价”低于正常价;二是因时间差异影响成本,从而导致的价格差异,如早中晚、四季差异带来的价格区别等。3. 促销活动不同
由于商家或平台设立的促销活动,导致商品售价会发生变化。常见的促销活动包括:满减、抽奖、限时打折、限量低价、优惠券等。只要促销活动设置的参与资格、活动过程是公平的,类似情形可以认为属于商业惯例。这里的公平指向为过程公平而非结果公平。4. 供需关系不同
因供需关系变化导致价格变动,在传统商业中经常遇到,如:白天租用剧院价格更低,年夜饭包间更贵,峰电谷电价格不同,景区淡旺季门票价不同等等。供需关系变化对价格带来的影响,在互联网行业中表现更为直观,如在下雨等特殊情形下,消费者通过加价等方式更易网上叫到车;用餐高峰期外卖配送费用比低谷时略高等。(二)特殊群体优待导致的价格差异
依照我国社会主义核心价值观、社会良好风尚及历史善良习俗等因素,很多特殊群体应当得到优待,包括价格。
包括以下群体:按照年龄、经济状况、身体条件等维度,包括老人、儿童、残疾人、弱势群体、经济困难群体等;按照职业的维度,包括军人、教师、警察、医生、护士、学生等;按照性别、民族等维度,女性、少数民族在某些领域属于优待群体;按照优抚对象的维度,包括烈士家属、军人家属、残废军人等。
如果用户通过自主反馈或者认证等方式确认身份属于优待群体,互联网平台或商家在对应的商业场景中给予一定优待及倾斜,应属于商业惯例,在互联网自动化决策中通过算法进行设计,也是算法向善的一种表现,是值得鼓励的。
(三)基于不同交易条件导致的价格差异
由于不同交易相对人,在交易安全、交易成本、信用状况、所处交易环节、交易持续时间等方面的情况不同,可能会实质性影响到交易的结果,因此基于以上因素导致的价格差异,可以考虑属于商业惯例情形。
交易环节不同的情形包括:一是所处交易环节不同,如清仓与正常售卖不同、期市与现市价格不同等;二是交易信用不同,如信用状况评分好则贷款额度高;三是交易持续时间不同,如购买单月服务、季度服务、全年服务的价格不同。因这些因素导致在交易中出现差别条件,应考虑属于商业惯例。
(四)因拉新、促活导致的价格差异
拉新,即获取新用户。新用户细分可以定为平台新客、品牌新客、店铺新客、行业新客、品类新客等等,每个平台或商家都会计算自身拉新成本,这是商业中非常重要的成本计算。
通过广告、活动、转介绍等形式给予新用户一定幅度优惠的情形,可认为属于商业惯例。促活,即唤醒用户。通过优惠券、登录奖励等方式“唤醒”“沉睡用户”,避免老用户因长期不“光顾”平台或者商家而流失,也避免重复高的成本拉新。
这里可能会出现非活跃用户在某个条件下优惠幅度比活跃用户更大的情形,这是商家或者平台通过用低成本来维系老客户、增加自身市场竞争力的的行为,本质上是一种商业行为,可以考虑归为商业惯例。
(五)在参与机会公平的前提下,某些激励活动可能导致的价格差异
在公平、合理、无歧视的规则下,实施参与平台互动活动、成为会员或粉丝、随机性抽取,可能会导致价格差异。只要这里参与机会对每个用户是公平的,过程是公平的,那么在结果上出现个别价格差异、权益差异的情形,可认为属于商业惯例。常见情形包括:
一是互动激励。如连续签到领金币、购买商品,完成转发分享等互动任务,在累积到一定程度兑换了购买商品的折扣或优惠,获得优惠或更低价格。
二是成为会员。成为商家或平台会员后,一定期限内享受到优惠折扣。
三是成为粉丝:这种情形在图文、短视频、直播等场景较为常见,加入粉丝后,可能会享受到一定优惠或者权益,也属于一种互动任务。
随机性抽取:参与某些抽取类或者偶得性活动,获得奖品、权益或优惠额度不同。对人群歧视的公平性分析,要充分考虑公平的具体内涵,在商业惯例中,有很多是过程公平大于结果公平、群体公平大于个体绝对公平。因此,在保证不被灰黑产利用和保护商业秘密的前提下,应向用户充分告知和解释算法规则,以满足用户知情权以及公平权。
三、算法歧视中涉嫌构成歧视的因子及滥用方式
在算法决策过程中,也可能存在滥用某些人群数据因子,在不属于商业惯例、行业习惯等情形下,进行算法歧视的行为。目前,互联网企业对数据的分析加工,主要是根据用户数据特征进行分析,然后对每类人群“打包”赋予“标签”。因此,媒体中经常提到的“千人千面”,更准确说是“千群千面”。
在人群特征分析的过程中,可能出现针对某类人群的歧视行为,比如针对熟客的“大数据杀熟”。对此行为的分析,首先需要刨除商业惯例的因素,其次应该厘清哪些因素可能会被利用来进行歧视行为,以及这些因素被滥用的方式,才能有针对性地找到解决问题的核心节点。以下将可能被用以进行歧视行为的因素称为“歧视因子”,并尝试对这些因子及其可能被滥用的方式进行梳理。
(一)可能被用以进行歧视的因子
1. 活跃程度
活跃程度主要指用户在商家或平台的活跃程度,包括:登录次数或频率、交易次数或频率、平均消费金额、会员等级、商家依赖程度等单一或综合测算的数据。
这些数据可以反映用户与商家或者平台的互动情况,如果用户活跃程度越高,推荐给他的商品或者服务价格就比同条件下其他用户的要高,就可能涉及针对活跃用户的歧视或大数据杀熟。
这里应考虑排除商家为唤醒不活跃用户“促活”的情形。如对于 180天未登陆平台的用户给予登陆后 1.5倍积分等活动,这是商家或者平台为避免用户流失付出更高重新拉新成本的一种方式,笔者认为属于商业惯例。
对于“促活”,业界对于未登陆天数、未有消费行为等不活跃因素的构成和周期尚未达成共识,还需进一步讨论。同时也应明确,“促活”中的优惠行为,应该是只针对非活跃用户某个周期重新转为活跃用户后的一次性发放行为,避免滥用“促活”概念。
2. 历史消费习惯
主要包括两类:一是购前、购中的行为习惯。包括经常购买的商品或服务类型,如经常购买的品牌或商品、经常打车的路线等;经常选购的渠道及商家类型,包括线上店铺或线下店铺,目前很多线下店铺与线上店铺的交易数据已经融合。如果对用户经常打车的路线采用正常价格,而对其不熟悉的路线略微提升价格,可能就涉嫌滥用用户数据进行歧视的情形。
二是售后的行为习惯。指消费者在消费实践中形成的较为固定的一些售后行为习惯,如退换货次数、频率,投诉历史,服务质量要求,中差评频率比例等。商家或平台通过对这些数据的分析,可以判断消费者接受服务或商品质量的敏感度。如果商家选择将不想沾惹的“高危”人群,如职业索赔人群体,排除在优惠活动之外,或不与其进行交易;给与对服务或商品质量更敏感的消费者更多优惠,而对那些对商品或服务质量要求不高或退换货次数较少的消费者不给予优惠,就可能涉嫌歧视性的差别待遇,破坏了消费公平。二是区分常驻城市与差旅城市。
3. 消费位置
一是不同的收货城市。如对一线大城市与五线县城等的城市等级划分。在数据应用中,某些商家会结合历史消费记录和收货城市的级别,给不同用户发真假不同的商品,如给没有某品牌经销商的城市的消费者发假货,而给设有该品牌城市的消费者发真货。
二是区分常驻城市与差旅城市。通过地理位置区分出用户的常驻城市和差旅城市,当其进入相对陌生城市时,在本地消费、打车等场景中设置各种差别待遇。
三是具有不同特征的场所。如对位于监管机关、媒体机构等地址的消费者进行优待,而对学生等群体集中地址的消费者进行歧视等。
4. 消费水平
一是总体消费能力。如在某商家、品牌或平台的总体交易额度,可以反映出总体消费能力。二是消费敏感程度。如用户是否经常参与商家或者平台打折、优惠等活动,经常参加的可能属于价格敏感程度高的人群;开具发票时为对公消费的,就可能属于价格敏感程度弱一些的消费者。
三是特殊偏好品消费水平。如对于奢侈品、茶、酒等某一细分品类商品拥有特殊偏好的人群,消费能力较强。
四是消费习惯显示出的消费能力。如打车时选用豪华专车、普通专车、快车、拼车的消费比例;手机终端型号价格水平;汽车品牌型号价值;高端餐厅就餐频次;支付方式为开通小额免密、极速支付,扣款顺序优先白条等信用购方式;用户经常出现的商圈的平均消费水平等。这些数据都属于间接数据指标证明消费水平。
上述数据主要会反映出消费者对于价格的敏感度和消费能力,对于消费能力越强的用户,大概率价格敏感度会越低。如果滥用数据,对不同消费能力、消费敏感程度、消费水平的用户打标签,并应用于定价相关的行为中,如直接差别定价、动态定价、优惠券差别发放等行为,都可能涉嫌人群歧视。
5. 消费意愿
通过对用户的商品及相关内容浏览记录,推断其消费意愿。如对某类商品的点击、搜索、浏览、加入收藏夹及购物车、专项优惠券领取的记录(次数、间隔频率、停留浏览时间等数据),提问、对商品进行评论的记录(次数、表达意愿程度等数据),视频观看记录(完播、完看、转发等数据),加入兴趣社群记录等。
上述数据主要反映消费意愿,指向消费需求度,如果滥用数据分析结果,利用用户对商品或服务需求的紧迫程度进行差别待遇,可能造成大数据杀熟,比如对短期内多次搜索浏览某路线机票的用户,提升机票价格就属于此类情形。
6. 人群的基础属性
针对人群的基础数据,如个人性别、学历、年龄、职业、婚育等,也可能存在滥用数据实施歧视的情形,如针对职位较高的用户定价高或者不发放优惠券。
(二)人群歧视行为的外在表现形式
一是价格折扣存在歧视。如活跃程度越高,对于同一商品或服务在同一时间的价格越高,造成对于活跃度高用户人群在售卖价格上存在差别,有些是通过直接价格不同表现出来,有些是发放红包、优惠券不同表现出来。
二是展示形式存在歧视。使用可能被用以进行歧视的因子,在页面展示中故意采用不同设置,例如,针对不活跃用户有特惠快车选项,其他群体需要通过搜索或者其他设置方式才能找到该选项。
三是真伪质量存在歧视。针对不同人群所交付的产品质量等级、产品真伪存在差别的情形。
四是以变相拒绝等方式形成歧视。如针对有多次消费投诉的用户或监管地址等,以各种理由拒绝发货。
五是信息误导带来歧视。如用户多次浏览某商品页面后,向其显示优惠活动即将停止;多次浏览订房页面后,显示房价已自动上涨,诱导用户尽快订房。
六是其他针对熟客的歧视方式。例如自动续费取消功能隐藏较深,误导熟客提高对平台的粘性。有些人群数据的标签本身是中性的,关键在于规制对其的使用节点,而有些人群数据的标签本身就是高危的,就需要重点关注其在人群数据标注的生产环节。
未来治理中,还需要进一步从数据分析、运用规制、商业惯例分析等多个维度进行梳理,研究在人群标签加工及使用限制上探索规范方式,在问题关键环节找到符合大数据及算法时代的治理方法,保护好消费者合法权益,精准打击商家恶意滥用数据攫取不当商业利益的行为。
我们将持续更新精彩的内容,敬请期待😚~
更多人工智能治理新技术、新风向、新观点,请关注【阿里巴巴人工智能治理与可持续发展研究中心AAIG】公众号👇
📹直播预告
精华大图集锦版 | 如何维护电商平台信息真实和竞争公平...👉点击查收白皮书全书连载
教你掌握互联网的“流量密码” | 如何避免ChatGPT被滥用...👉点击查收过往23期直播的全部文字回放
📚《AI治理必修》月刊
为什么现在的LLM都是Decoder-only的架构? | 大脑视觉信号被Stable Diffusion复现成图像!"AI读脑术"来了...👉点击阅读往期27刊月刊全文
👇AAIG课代表,获取最新动态就找她