1. “Should I follow the crowd? A probabilistic analysis of the effectiveness of popularity in recommender systems.” The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. 2018.
2. “Controlling fairness and bias in dynamic learning-to-rank.” Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. 2020.
一般来说这里直接性的疑问,就是为什么不全部合并起来一起训练。如果全部合并打散训练,极大可能导致负采样样本信息在全量样本中淹没;此外,多阶段训练最大的优势就是可以将初次训练的模型对齐 base 的效果,然后通过控制后阶段不同样本的强度,拓宽其感受野。具体实践中,在保证基础指标的前提下,联合控制多阶段中多样本参与训练的强度。相比粗排,精排阶段仅强化对部分负样本的感知,理论上利好生态,特别是对精排阶段难曝光的私域流量有较大改善。
point-wise 的训练可以通过历史 I-I 共现,实现样本穿越(跨样本 item),学习特征交互后稳定的 item 向量空间;(参考:特征交互建模:从笛卡尔积到 CAN 网络 [11])
list-wise 模型评估的是各个 item 组合后的结果,因此不同 list 的组合数超高,与高热 corpus 的量级有关。虽然 list 共现频率很低,但 list-wise 模型主要建模 session 内的连续语义信息,使最终选择的序列有较好的画风,消费中保持兴趣的连贯性和兴趣的自然泛化。
[6]《Revisit Recommender System in the Permutation Prospective》https://arxiv.org/abs/2102.12057[7] 渠江涛:重排序在快手短视频推荐系统中的演进:https://mp.weixin.qq.com/s/OTyEbPCBh1NHogPM7bBtvA[8] (PDF) PAL: a position-bias aware learning framework for CTR prediction in live recommender systems:https://www.researchgate.net/publication/335771749_PAL_a_position-bias_aware_learning_framework_for_CTR_prediction_in_live_recommender_systems[9] SIGIR 2021 | 广告系统位置偏差的CTR模型优化方案:https://tech.meituan.com/2021/06/10/deep-position-wise-interaction-network-for-ctr-prediction.html[10] 推荐系统中的多任务学习与多目标排序工程实践https://zhuanlan.zhihu.com/p/422925553[11] 特征交互建模:从笛卡尔积到 CAN 网络https://zhuanlan.zhihu.com/p/458588237[12] 推荐系统 Bias 大全https://mp.weixin.qq.com/s/2HGmzAo1kDrwfsVTYIFJDQ