查看原文
其他

【新开源推荐】这波开源满分!清华大学开源网络嵌入的工具包 —— OpenNE

2017-10-30 开源最前线
开源最前线(ID:OpenSourceTop) 猿妹整编

综合自:开源中国、GitHub等


为了方便大家对网络表示学习(NE/NRL)开展相关的实验或研究,清华大学计算机科学与技术系的研究人员在 GitHub 上发布了 NE/NRL 训练和测试框架 OpenNE。


用于网络嵌入的开元包 OpenNE

授权协议:MIT

开发语言:Python

操作系统:跨平台

开发厂商:Apache

Github:https://github.com/thunlp/OpenNE



OpenNE 简介

OpenNE 是清华大学开源的 NE/NRL 训练和测试框架,统一了不同 NE 模型输入和输出接口,并为每个模型提供可扩展选项。此外,还用 TensorFlow 实现了经典 NE 模型,使这些模型可以用 GPU 训练。


OpenNE 实现和修改的模型包括 DeepWalk、LINE、node2vec、GraRep、TADW 和 GCN,后续还将根据已公布的 NRL 论文持续实现更多有代表性的 NE 模型。



与其他实现对比


运行环境:CPU:Intel(R)Xeon(R)CPU E5-2620 v3 @ 2.40GHz


下面是在不同数据集上对不同方法的节点分类结果。将表征维度设置为 128,GraRep 中的 kstep=4,node2vec 中 p=1,q=1。


BlogCatalog:10312 nodes, 333983 edges, 39 labels, 非定向:

● data/blogCatalog/bc_adjlist.txt

● data/blogCatalog/bc_edgelist.txt

● data/blogCatalog/bc_labels.txt



Wiki:2405 nodes, 17981 edges, 19 labels, 定向:

● data/wiki/Wiki_edgelist.txt

● data/wiki/Wiki_category.txt



cora:2708 nodes, 5429 edges, 7 labels, 定向:

  • data/cora/cora_edgelist.txt

  • data/cora/cora.features

  • data/cora/cora_labels.txt




配置需求


OpenNE 的配置需求如下:

● numpy==1.13.1

● networkx==2.0

● scipy==0.19.1

● tensorflow==1.3.0

● gensim==3.0.1

● scikit-learn==0.19.0


该项目还在持续开发中,此后还将根据已公布的 NRL 论文发表持续实现更多有代表性的 NE 模型。同时也欢迎其他研究者在该框架中构建 NE 模型到这个工具包中,也会公布项目中的贡献内容。


附:新开源报道汇总

《【新开源报道 16】AI开发者福音!微软亚马逊联合发布深度学习库 Gloun》

《【新开源报道 15】谷歌发布量子开源软件,量子计算机对科学家免费开放 》

《【新开元报道 14】微软开源用于Spark的深度学习库MMLSpark》

《【新开源报道 13】Facebook 开源帮助开发者消灭最顽固的软件 bug 的工具》

《【新开源报道 12】不只是阿里巴巴的操作系统,AliOS 宣布开源》

《【新开源报道 11】重磅!阿里巴巴正式开源全球化OpenMessaging和ApsaraCache项目》

《【新开源报道 10】IBM 和谷歌等巨头联手为开发者推出开源容器安全工具Grafeas》

《【新开源报道 9】Google开源Abseil,为C++和Python开发提供支持》

《【新开源报道 8】serverless 领域的福音!Oracle 宣布开源 Fn project》

《【新开源报道 7】苹果在 GitHub 上公布 macOS 和 iOS 内核源码》

《【新开源报道 6】百度开源移动端深度学习框架mobile-deep-learning(MDL)》

《【新开源报道 5】百度正式开源其 RPC 框架 brpc》

《【新开源报道 4】IBM 开源动态的应用服务器运行时环境 Open Liberty》

《【新开源报道 3】微信后台团队最近开源力作:PhxQueue分布式队列》

《【新开源报道 2】喜大普奔!阿里即将开源 ApsaraCache,云数据库 Redis 版分支》

【新开源报道 1】腾讯 Web UI 解决方案 QMUI Web 正式回迁开源》



●本文编号67,以后想阅读这篇文章直接输入67即可

●输入m获取文章目录

↓↓↓ 点击"阅读原文" 进入GitHub详情页  

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存