查看原文
其他

微博、微信、大众点评、Twitter等数据集( 复旦大学NLP)

小猿猴GISer 小猿猴GISer 2021-09-19

1

数据简介


复旦大学自然语言与信息检索实验室,致力于社会媒体海量多媒体信息处理的前沿技术研究。数据下载地址:
http://sma.fudan.edu.cn/dataset.html

微博数据

    共有15亿的推文数据和200多万的用户数据。

微信数据

    包含二千万条微信公众号信息。

大众点评用户数据

    大众点评截止到2014年9月底1200万的用户信息,以及4000万条用户点评内容。

大众点评商户数据

    大众点评商户数据,包括地址、电话、营业时间、停车信息、总评论条数、 人均消费、口味评价、环境评价、服务评价、营业资质、餐厅简介、推荐菜、顾客总体印象、所有评论信息。

Twitter数据
    抓取时间从 2015年10月-2016年3月,共抓取用户推文271,183,773条。
百度百科数据
    百度百科名人数据。4W电影数据。4W的电视剧数据。
豆瓣电影数据
    豆瓣电影数据。

2

实际下载


实际测试能够下载的数据,点击蓝色按钮查看

进入数据详情页,点击下载

填写姓名和所在单位

提交后进入下载页面,分别查看数据,发现微博数据为空。。。

实际存在的数据有1.8G的大众点评数据

68G的Tiwtter数据

20G的知乎数据

3

往期数据推荐


我在之前的文章汇总推荐过不少城市数据集
出租车数据
全国主要城市出租车轨迹数据下载汇总
手机信令数据
数据福利|深圳市手机信令数据下载与处理(包括ETC/公交卡/出租车轨迹等)
微博和推特数据集
数据福利|有关COVID-19的全国新浪微博与全球Twitter数据集
北京出租车等数据集
数据福利|微软城市计算、AI for Earth

欢迎关注 小猿猴GISer 公众号

          

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存