史上最大规模1.4亿中文知识图谱开源下载
知识就是力量,知识图谱是人工智能新时代的产物,简单地说知识图谱就是通过关联关系将知识组成网状的结构,然后我们的人工智能可以通过这个图谱来认识其代表的这一个现实事件,这个事件可以是现实,也可以是虚构的。
本次ownthink开源了史上最大规模的中文知识图谱,数据是以
实体、属性、值
实体、关系、实体
混合的形式组织,采用csv数据格式,ownthink_v2.csv下载链接见文末。
ownthink_v2.csv文件8.57G,直接读取肯定会很慢很卡。
先读取前5条数据看看样子
下面的代码是可迭代读取方式
import pandas as pd
chunks = pd.read_csv('ownthink_v2.csv', iterator=True)
chunk = chunks.get_chunk(5)
print(type(chunk))
chunk
<class 'pandas.core.frame.DataFrame'>
分块读取
import pandas as pd
max_times = 10
readers = pd.read_csv('ownthink_v2.csv', chunksize=5)
for reader in readers:
reader
#做一些查询
到现在我也不知道有多少行,实在是太大了。
如果想获取某个实体的属性和值,可以使用pd.read_csv的chunksize分批读取,这里我每批次读取5条数据,总共就显示50行就结束程序
import pandas as pd
max_times = 10
readers = pd.read_csv('ownthink_v2.csv', chunksize=5)
for reader in readers:
if max_times>0:
print(reader)
max_times-=1
else:
break
Run
实体 属性 值
0 胶饴 描述 别名: 饴糖、畅糖、畅、软糖。
1 词条 描述 词条(拼音:cí tiáo)也叫词目,是辞书学用语,指收列的词语及其释文。
2 词条 标签 文化
3 红色食品 描述 红色食品是指食品为红色、橙红色或棕红色的食品。
4 红色食品 中文名 红色食品
实体 属性 值
5 红色食品 是否含防腐剂 否
6 红色食品 主要食用功效 预防感冒,缓解疲劳
7 红色食品 适宜人群 全部人群
8 红色食品 用途 增强表皮细胞再生和防止皮肤衰老
9 红色食品 标签 非科学
实体 属性 值
10 红色食品 标签 生活
11 大龙湫 描述 雁荡山景区分散,东起羊角洞,西至锯板岭;南起筋竹溪,北至六坪山。
12 大龙湫 中文名称 大龙湫
13 大龙湫 外文名称 big dragon autrum
14 大龙湫 地理位置 浙江省温州市雁荡山景区
实体 属性 值
15 大龙湫 开放时间 08:00~18:00
16 大龙湫 门票价格 50元
17 大龙湫 著名景点 芙蓉峰
18 大龙湫 著名景点 剪刀峰
19 大龙湫 著名景点 连云嶂
实体 属性 值
20 大龙湫 著名景点 经行峡
21 大龙湫 所属国家 中国
22 大龙湫 所属城市 浙江省温州市
23 大龙湫 建议游玩时长 2小时
24 大龙湫 适宜游玩季节 6月-8月
实体 属性 值
25 大龙湫 标签 景观景点
26 大龙湫 标签 旅游
27 大龙湫 标签 地理
28 大龙湫 标签 地形地貌
29 五大夫松 描述 五大夫松位于云步桥北侧的五松亭旁。
实体 属性 值
30 五大夫松 中文名称 五大夫松
31 五大夫松 地理位置 云步桥北侧的五松亭旁
32 五大夫松 门票价格 无需门票,包含在泰山景区门票内。
33 五大夫松 建议游玩时长 建议1小时
34 五大夫松 所属国家 中国
实体 属性 值
35 五大夫松 所属城市 山东省泰安市
36 五大夫松 标签 旅游
37 五大夫松 标签 地理
38 五大夫松 标签 地点
39 五大夫松 标签 历史
实体 属性 值
40 灵峰 描述 灵峰为雁荡山的东大门景区,总面积约46平方公里。
41 灵峰 中文名称 灵峰
42 灵峰 别名 东大门景区
43 灵峰 行政区类别 景区
44 灵峰 所属地区 雁荡山
实体 属性 值
45 灵峰 政府驻地 乐清市
46 灵峰 电话区号 0577
47 灵峰 邮政区码 325600
48 灵峰 地理位置 浙江省温州乐清境内
49 灵峰 面积 46平方公里
数据下载方式:
关注思知机器人回复【数据下载】获取下载链接
百度网盘 https://pan.baidu.com/s/1LZjs9Dsta0yD9NH-1y0sAw 提取码: 3hpp 解压密码是:https://www.ownthink.com/
阿里云下载https://nebula-graph.oss-accelerate.aliyuncs.com/ownthink/kg_v2.tar.gz