查看原文
其他

【文献与探索】大数据方法:网络推荐系统研究

孙丹辉 治理学术 2022-05-11


公众号升级更名(治理学术)提醒!

尊敬的各位朋友,首先非常感谢您的支持,我们公众号顺利完成四年的初级阶段发展!为了更好地为朋友同仁们服务,本公众号近日即将进行系统升级与更名,请您留意:一是本公众号已经启动小程序,并将与新的同名小程序关联,这样今后各位可以更加便利、快速地使用本公众号推送的所有材料。二是本公众号即日起将使用新的名称“治理学术”,内容会更加聚焦于治理理论与实践领域,主要分为以下九大类别:治理理论、城市治理、网络治理、公共政策、非营利组织、社会治理、政府治理、公共服务和全球治理。您可根据相应类别进行检索与整理需要的文献,在每期文章下面可直接点击“近期推送的相关文献”下附文献名的链接获取该此前推送的文献,可进入该文献页面。文章标签保持不变,仍然分为三大板块,但调整为:1、治理理论 文献与探索,2、管理实践 治理与反思,3、公共治理 教学与交流。

请您继续关注本公众号,关注治理理论与实践领域的最新权威动态与发展,共同为创造美好的公共生活与优质的治理水平携手并进!再次感谢!


                 上理公共管理 微信公众号团队

                    2017年5月15日

                


类别:网络治理


大数据不仅是一种技术更是一种广泛运用的计算社会科学之方法,其中网络推荐系统已经走进我们的日常生活,比如淘宝商品推荐、百度搜索、当当图书推荐、微信好友推荐等等,那么我们如何运用网络推荐系统来优化城市治理,实现真正的精准与智能服务,比如精准医疗、智慧教育、共享单车的系统等等呢?首先我们需要对网络推荐系统的运行原理与方法有个大致了解。三位西班牙学者J. Bobadilla, F. Ortega, A. Hernando, A. Gutiérrez就在知识管理研究类权威期刊《Knowledge-Based Systems》(SSCI 2区)上共同发表了学术论文,对网络推荐系统研究这一前沿领域进行了深入探讨。Recommender systems survey,Knowledge-Based Systems,Vol. 46: 109–132, July 2013, DOI: 10.1016/j.knosys.2013.03.012)这篇文章引用了253篇海量文献,为想了解与进入本领域研究的学人真是大福利啊。


文章简介了网络推荐系统的定义、推荐方法(协同过滤)、应用领域及其最新发展,指出混合技术的重要性及该领域目前的核心问题。本文的创新之处在于,提出推荐系统(RS)发展的三阶段(传统网络、社交网络、物联网),介绍了RS的传统话题(基本知识、算法、冷启动问题、相似性度量、发展),提出了新的话题(基于社交信息的概念、分类、方法,基于内容过滤,社交标签和分类,对一组用户的推荐和解释),新趋势在于位置感知和仿生方法,同时指出存在的一些问题(隐私,安全,P2P信息,物联网应用)。


传统推荐系统(RS)基础知识

数据:评级,用户注册信息,特征,内容,社交关系,位置信息。

算法:人口统计学,基于内容,协同,基于社交,上下文感知,混合。

模型:基于记忆(直接使用数据),基于模型

技术:概率,贝叶斯网络,最近邻算法,生物启发算法(神经网络,遗传算法),模糊模型,奇异值分解。

数据集:稀疏性水平和可扩展性。

系统:时间和内存占用。

目标:预测,前n个推荐。

结果:质量(新颖性,覆盖性,精度)。

冷启动问题:新团体、新项目、新用户(最重要),常通过混合方法解决。

KNN推荐算法:

               优点:简单,结果合理准确。

               缺点:可扩展性差,易受数据集稀疏性影响。

               分类:用户到用户,项目到项目。后者可扩展性影响较小,

          两者混合使用可提高推荐效率。

相似性度量:传统指标,新指标。


社交信息的推荐系统(RS)

网络2.0时代社交信息被纳入RS中,改善稀疏性问题。主要有两类:一是社交过滤,收集明确或隐含的社交信息,用来改善预测和推荐的质量、提出新的RS算法、阐明社交信息和协同过程的重要关系。二是基于内容过滤(CBF),提供给活跃用户与过去评价过的项目类似的项目推荐。存在两个问题,有限的内容分析和过度专门化。CBF要求提取项目的属性,关键在于确定用户是否喜欢推荐的项目。CBF与CF相结合,可以取长补短。CBF的趋势:在项目属性中加入社交信息(标签推荐系统,在推荐过程中使用标签)。对群组用户的推荐:将CF过程分为四个层次(相似性度量、建立邻居、预测阶段、推荐项目),分别在这四个层面进行合并。


推荐系统趋势

推荐系统(RS)明显的发展趋势是收集和整合更多不同类型的数据,与网络发展平行(三阶段)。介绍了物联网、隐私保护、托攻击、新框架的概念,根据数据类型对RS进行创新型分类。位置感知RS是基于Web3.0的第一步,移动设备使用越多应用越广。类型:RS,RS+G(GI在RS中不起作用),GRS(以传统方式进行评级,根据用户地理位置做出建议),GRS+(通过衡量用户与项目之间的距离对项目评级,1型为一个项目一个评级,2型为一个项目多个评级)。理论上2型GRS+最好,优点是接受更广泛的评级,根据距离给予相对重要性,缺点是难以引入复杂和苛刻的评级过程。生物启发方法主要用于基于模型的RS,主要运用遗产算法,神经网络和人造免疫网络。

Fig. 11. Recommender systems taxonomy.


结论

推荐系统(RS)的演变随着网络技术的发展则发展:第一代使用传统网络,收集基于内容的购买数据、人口统计数据和基于记忆的用户偏好数据,重点是通过过滤提高准确性,混合方法较优;第二代基于Web2.0时代,加入社交信息;第三代基于物联网信息的Web3.0时代,目前结合了位置信息。将来的研究应推进现有方法和算法,提高RS预测和建议的质量,主要有7个方向。(1)将不同变量属性结合的多种算法模型同时使用 ,(2) 通过传感器等最大化地挖掘使用个体用户的潜在信息, (3)将个体用户的使用习惯、偏好等整合到推荐系统程序中 , (4) 为非推荐用户从推荐系统数据库中进行数据挖掘, (5)保障安全与隐私, (6) 为非标准化测量 更新评估、测量标准, (7)为数据的自主机器学习设计更加优化的框架。


总之,虽然文章发表时的2013年物联网技术在今天已经比较普遍,但是本文预见力与对推荐系统算法发展趋势的判断,在今天仍然非常有前瞻性。



如果您喜欢此文,请转发和分享给朋友们。谢谢!


附参考文献:

P. Antunes, V. Herskovic, S.F. Ochoa, J.A. Pino, Structuring dimensions for

collaborative systems evaluation, ACM Computing Surveys 44 (2) (2012).

Article 8. 


J. Bobadilla, F. Ortega, A. Hernando, A collaborative filtering similarity

measure based on singularities, Information Processing and Management

48 (2) (2012) 204–217.

I. Garcı ´ a, L. Sebastia, E. Onaindia, On the design of individual and group

recommender systems for tourism, Expert Systems with Applications 38

(2011) 7683–7692.


R. González-Crespo, O. Sanjuán-Martı´nez, J. Manuel-Cueva, B. Cristina-Pelayo,

J.E. Labra-Gayo, P. Ordoñez, Recommendation system based on user

interaction data applied to intelligent electronic books, Computers in

Human Behavior 27 (4) (2011) 1445–1449.


L. Lü, M. Medo, Ch.H. Yeung, Y.Ch. Zhang, Z.K. Zhang, T. Zhou, Recommender

systems, Physics Reports 519 (2012) 1–49.



近期推送的相关文献:(直接点击链接即可进入该页面)


【治理与反思】管理协同:齐美尔链接如何提升公共部门网络

【文献与探索】社会化媒体和网络:研究人员如何利用大数据分析

【治理与反思】使用网络提升能力和网上娱乐对公民民主需求的特定影响

【文献与探索】社交媒体:“网域”和社会资本积累

【文献与探索】全球视野下的智慧城市

【ASPA美国公共行政学会年会专题2】后信任时代数据趋动的证据与决策


此处也可以下载全文:

http://www.sciencedirect.com/science/article/pii/S0950705113001044


原文链接阅读原文 点击左下角):


迎您提出与本文内容、主题或翻译有关的各种问题与建议!



迎关注、订阅微信公众号【治理学术】。本公众号是由公共管理与政治学学科的老师和学生志愿者开发的学术和交流平台,重点是治理理论与实践领域的热点问题,我们每日整理、翻译并推荐一篇最新权威英文文献。核心内容分为三大板块:1、治理理论 文献与探索,2、管理实践 治理与反思,3、公共治理 教学与交流。


欢迎推荐或自荐研究成果,来稿请致邮箱:usstgggl@163.com


PS:如何加入微信公众号:


您可以扫描下面的二维码,或者搜索公众号:“治理学术”,或者加原始ID: 
  gh_dd2c06e61722 然后点击加入即可。



PS:如何查看以前推送的精彩文章:


只要点标题下方的“治理学术”,并选择“查看历史消息”即可,精彩就会尽现。谢谢!


  


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存