Scikit-network
scikit-network是用于大型图的Python包,与scikit-learn类似。具有以下性质:
- scipy格式的稀疏矩阵表示
- 快速的相关算法
- 简单的API
- 免费: BSD license
项目和文档地址:
-
Documentation: https://scikit-network.readthedocs.io
安装
-
pip安装
pip install scikit-network
-
源码安装
wget https://github.com/sknetwork-team/scikit-network
cd <scikit-network folder>
python setup.py develop
载图
图由其邻接矩阵(adjacency ,平方矩阵)表示。当该图是双方时,它可以用双向邻接矩阵表示(biadjacency ,矩形矩阵)表示。
- adjacency: 正方形矩阵的条目表示图的节点之间的边缘,通常由A表示。
- biadjacency: 矩形矩阵的条目表示二分图的节点之间的边缘,通常用B表示。
载图支持的方式多种多样,有以下几种:
- 边集
- cvs文件
- numpy array
- 邻接矩阵
- dataframe
- GraphML
- NetworkX
- 其它
这里以边集为例:
from IPython.display import SVG
import numpy as np
from scipy import sparse
import pandas as pd
from sknetwork.data import from_edge_list, from_adjacency_list, from_graphml, from_csv
from sknetwork.visualization import svg_graph, svg_bigraph
edge_list = [(0, 1), (1, 2), (2, 3), (3, 0), (0, 2)]
adjacency = from_edge_list(edge_list)
image = svg_graph(adjacency)
SVG(image)
图分析
每种算法都表示为具有拟合方法(fit
)的对象。
这里将空手道俱乐部图数据与Louvain算法进行聚类展示:
from sknetwork.data import karate_club
from sknetwork.clustering import Louvain
adjacency = karate_club()
image = svg_graph(adjacency)
SVG(image)
algo = Louvain()
algo.fit(adjacency)
labels = algo.labels_
array([0, 0, 0, 0, 3, 3, 3, 0, 1, 0, 3, 0, 0, 0, 1, 1, 3, 0, 1, 0, 1, 0,
1, 2, 2, 2, 1, 2, 2, 1, 1, 2, 1, 1])
可以看到,将其聚类为4类。