搜索引擎引导使用算法的合规要点分析
编者按
2021年,全球范围内对于人工智能的监管已经开始从理论探讨走向实际的立法和执法阶段,标志性的事件就是欧盟提出了《欧洲议会和理事会关于制定人工智能统一规则(《人工智能法》)和修正某些欧盟立法的条例》的提案,以及我国国家互联网信息办公室发布的《互联网信息服务算法推荐管理规定》。
关于人工智能安全和监管,本公号发布过以下文章:
今天和大家分享的是中国广告协会法律与道德工作委员会常务委员杜东为的文章。
搜索引擎引导使用算法的合规要点分析
搜索引擎是互联网中重要的工具,在用户主动发起信息查询中使用。从搜索链路来说,有搜索引导、搜索理解、搜索排序展示等常见搜索算法环节。为了满足用户搜索过程中“意中有、语中无”的常见情形,搜索引擎通过在搜索栏中加入底纹词、搜索框输入某个字后加入补充词,建立搜索热搜榜,以及通过引导型图文导流至搜索引擎等相关算法,帮助用户进入搜索引擎查询内容,这个环节就属于搜索引导环节,可以称为搜索引擎引导使用算法,其本质上是推荐算法与搜索功能相结合的一种应用场景。本文就搜索引擎引导使用算法使用如何合规进行初步分析。
一、搜索引擎引导使用算法的四种常见类型
(一)搜索底纹词算法。
搜索引擎不仅有百度、360、搜狗、UC等传统搜索引擎,还包括淘宝、京东、美团、拼多多等平台。用户在进入这些带有搜索功能的网站的搜索栏中,根据用户画像,搜索引擎算法自动加入底纹词,帮助用户找到想搜索的引导词作用,该算法属于个性化推荐算法的一种类型。搜索底纹词算法主要是对于用户想随便逛逛不知道搜什么好,随大流不会错或想知道大家都搜了些什么这种情形进行辅助引导。平台在搜索栏中加入一些“底纹词”引导满足用户,也能结合用户自身兴趣或者探索兴趣之外的内容满足个性化需求。
(二)搜索下拉补充词算法。
搜索下拉词主要是指在搜索框中输入某词后,搜索自动推荐后缀联想词,下拉提示是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选查询词,提高用户输入效率,帮助用户尽快找到想要的内容。例如:在搜索引擎中输入李,因最近李宗盛演唱会热度非常高,搜索引擎自动关联十几个下拉补充词,李宗盛、李宗盛演唱会、李铁等等。当一个搜索词在某个时间段内的搜索量超过一定阈值的时候,就会出现在下拉补充词内。搜索下拉补充词算法与搜索热度、相关地域、个人兴趣等等因素有关。与此同时,如果网站或者网店在网页内容写作时把这些词汇覆盖至内容里,不仅大幅提升收录率,满足用户的好奇心,解决用户心中问题,且因内容与核心词相关度极高,描述内容具有时下热度,此时,该内容自然流量也会增加。
(三)热搜精选推荐算法。
热搜榜精选推荐算法是在用户没有明确搜索需求,通过推荐一些当下比较热门的词,这些词排行榜形式有总排行榜,也有分类排行榜,主要是引导用户在搜索中直接使用起来的一种模式。热搜榜在很多产品中都有成熟的应用,如百度热搜、头条热榜、微博热搜榜、淘宝全网热榜等。
(四)图文导流搜索算法。
搜索引擎公司自有网站(如导航网站)或者合作网站有流量余量或者利用外部合作方媒体流量,使用图片和搜索引导词进行合成图文内容(如下图一,图片+个人二手车文字),引导用户点击后至搜索引擎结果列表页(如下图二,个人二手车关键词搜索结果),此时,搜索栏种就是该引导词。此类算法属于生成合成类算法和个性化推送类算法综合体,图片和引导词合成图文内容部分是算法进行合成,选择在流量位置进行对用户进行个性化推送,属于通过图文内容向用户引导至搜索引擎服务的行为。
(图一)
(图二)
二、合规要点分析
(一)热搜榜、底纹词、下拉补充词人工干预部分,如涉及广告交易的人工干预构成商业广告行为应显著标明“广告”。
在各类平台中的热搜榜、搜索栏底纹词、下拉补充词等类型中,如果平台运营干预展示部分,承接广告主要求,对该流量进行商业广告运营,属于商业广告行为,按照商业广告进行管理。平台应该将热搜榜、搜索栏底纹词、下拉补充词等区分,显著标明“广告”,使消费者能够辨明其为广告,这里不仅是要搜索结果上标注,而是需要在热搜榜、底纹词、下拉补充词上标注,进行显著区分,避免消费者误认为是自然结果而点击。
(二)图文导流搜索算法中引导词不属于搜索结果列表中所推荐商品或者服务的广告内容。
图文导流搜索算法中,算法自身生成的引导词+图片。这些引导词+图片本质是通过猜测用户搜索意图,引导用户使用该主体的搜索引擎功能,用户点击后,进入搜索引擎该关键词搜索结果列表页面,可以认为该搜索引擎的“引导员”,引导至搜索结果的“指路牌”,但不是具体直接指向搜索引擎所链接的商品或者服务内容,该引导词并不属于对于搜索结果列表中所推荐商品或者服务的广告内容。这些带有引导功能的图文是在推荐搜索引擎服务,可以看成是搜索引擎服务的“广告”。消费者在搜索引擎结果列表页中继续点击才能进入具体商品和服务的网站或者内容页面,这时就属于了搜索引擎推荐商家广告的行为,按照《广告法》《互联网广告管理办法》相关要求,应该显著标明“广告”标识。
(三)热搜榜、底纹词、下拉补充词等被第三方“刷量”涉嫌构成不正当竞争。
某些公司通过违规方式进行SEO(Search Engine Optimization即:搜索引擎优化),利用搜索排序算法中用户点击等行为占有一定算法权重的规则,通过制造虚假点击、浏览等数据,扰乱原有的客观排序结果及算法生成的热搜、底纹词、下拉词等结果等,将客户的网站或者网店“刷量”至高排位、上热搜、加入底纹词、进入下拉补充词等算法产出内容中。这类SEO行为本质是通过掺入虚假数据,扰乱搜索引擎中算法规则,造成市场信息传递错误,干扰搜索引擎引导部分和搜索排序展示部分的算法和逻辑,该行为就构成了不正当竞争。
(四)搜索下拉词、底纹词、热搜榜等可能造成侵权信息、商业不实信息、商业诋毁等信息中搜索引擎应该承担什么责任。
搜索下拉词、底纹词、热搜榜由于是搜索算法自动生成引导词,如上述内容中存在企业负面信息、侵犯知识产权等等侵权行为,搜索引擎经营者按照《民法典》相关规定,履行义务。搜索下拉词、底纹词、热搜榜等如没有任何人工干预,搜索引擎算法本质上还是在引导用户搜索,而并不是内容直接产出,责任界定应承担事前明知应知,事后通知-删除对应的责任。
(五)搜索引擎引导算法中的运营干预
搜索引擎引导中的运营干预,主要是指搜索引擎工作人员对于算法产出结果继续进行删除、修改、增加等运营动作。一是对于不良导向性问题应进行直接干预,并禁止露出,例如:淫秽、色情、赌博、迷信、恐怖、暴力,对民族、种族、宗教、残疾、疾病歧视等等,平台需要不断扩大算法中“黑词”及其“变体词”的特征识别能力。二是主动弘扬正能力、社会公益的平台运营干预,如结合教师节、重阳节等为了弘扬正向的主流价值、社会公益,或者当下社会热点进行的人工干预,在自然算法结果当中添加几个人工的引导词,没有商业目的或者直接的商业意图。三是对于搜索引擎引导算法中某些词未改变原意的情况下,进行优化,例如:用户搜索“四川火锅”特别多,运营将“四川火锅”调整为“四川火锅热翻天”,未改变搜索意图原意,只是将描述更加“用户化”,搜索引擎作为互联网工具进行了人工优化并未改变其他,此时搜索引擎依旧是互联网信息服务提供者的中立角色,并不属于广告经营者或者发布者。四是搜索引擎引导算法中,运营加入了其他商家的商业意图进行引流,此时,搜索引擎就成为了广告经营者,经营行为是为商家提供官方“seo”服务,同时也是广告发布者,在搜索引擎结果中为该商家的商品或者服务提供了付费搜索结果展示服务。(完)
美国电信行业涉及外国参与的安全审查(一):基本制度介绍
美国电信行业涉及外国参与的安全审查(二):国际性的第214节授权
美国电信行业涉及外国参与的安全审查(三):建立外国参与安全审查的行政令
美国电信行业涉及外国参与的安全审查(四):FCC对中国企业的陈述理由令
关于健康医疗数据方面的文章有:
关于数据的安全、个人信息保护、不正当竞争等方面的重大案例:
因隐私政策不合规,西班牙对Facebook开出巨额罚单 英法两国对 AdTech和广告类SDK的监管案例分析 Facebook事件多层次影响 及中美欧三地监管展望 FTC vs Facebook:50亿美元和解令的来龙去脉 FTC与Facebook“2019和解令”全文翻译 案件摘要:德国反垄断监管机构对Facebook数据收集融合行为裁决 德国联邦反垄断局审查Facebook数据收集融合行为的背景情况 德国联邦反垄断局对Facebook数据收集和融合行为提出严格限制 GDPR与相关数据保护法律处罚案例调研 他山之石:美国20年间33个儿童信息保护违法案例分析 重大案件 | 分析WhatsApp的2.25亿欧元罚款决定:合法利益事项 “脸书文件” | 爆料人的美国会听证会开场白、欧盟“数字服务法”推动人的表态 重大案件 | WhatsApp被罚2.25亿欧元一案核心事实与争点述评 重大案件 | CNIL对脸书、谷歌的Cookies实践的处罚:官方公告译文
供应链安全 | 白宫发布关于降低依赖外国对手的重要矿产的行政令 供应链安全 | 美国从科技供应链中剔除中国行动的内幕(外媒编译) 供应链安全 | 英国政府推进《电信(安全)法案》以确保供应链安全 《关于推进生物技术和生物制造创新以实现可持续、安全和可靠的美国生物经济的行政命令》(全文翻译)