大规模网络表示学习库GraphVite安装

GraphVite重新实现了DeepWalk,LINE,Node2vec等方法,速度提高了几十倍,的确牛,不知道啥时候也能把我们等方法也实现上去,哈哈。

这个Tangjian实验室提出了LINE,面向大规模的网络表示学习方法,同一时期,Tangjie也提出了另一个NetSMF,也是很不错。但是相比之下,还是GraphVite速度更快,支持方法也更广泛。实际上这三种方法DeepWalk,LINE,Node2vec实在差不了多少。

安装这玩意真够折腾的,首先检查gcc版本,gcc -v,gcc版本在4.9以下估计要危险,编译可能会出错。

conda安装,否则慢成狗,记得配镜像。

conda安装需要:

1. conda config --add channels conda-forge

2. conda install -c milagraph -c conda-forge graphvite

但是楼主在安装graphvite的时候,它还没有及时更新到镜像里。相对其它的包,只有它慢成狗。

graphvite-0.2.0      | 51.6 MB   | ######################4                                     |  38% 

一开始尝试编译安装,在编译的过程需要安装:pybind11, log4xx, flag等等一大堆,最终不行。所以只能用conda来安装。

安装完毕,试试

graphvite baseline quick start

尝试使用LINE在Blogcatalog数据集上,得到的结果还是不错的

ipython

>>> import pickle
>>> with open("line_blogcatalog.pkl", "rb") as fin:
>>>     blogcatalog = pickle.load(fin)
>>> names = blogcatalog.id2name
>>> embeddings = blogcatalog.vertex_embeddings
>>> print(names[1024], embeddings[1024])
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章