淘先锋技术网

首页 1 2 3 4 5 6 7

Scikit-network

scikit-network是用于大型图的Python包,与scikit-learn类似。具有以下性质:

  • scipy格式的稀疏矩阵表示
  • 快速的相关算法
  • 简单的API
  • 免费: BSD license

项目和文档地址:

安装

  • pip安装

    pip install scikit-network
    
  • 源码安装

  wget https://github.com/sknetwork-team/scikit-network
  cd <scikit-network folder>
  python setup.py develop

载图

图由其邻接矩阵(adjacency ,平方矩阵)表示。当该图是双方时,它可以用双向邻接矩阵表示(biadjacency ,矩形矩阵)表示。

  • adjacency: 正方形矩阵的条目表示图的节点之间的边缘,通常由A表示。
  • biadjacency: 矩形矩阵的条目表示二分图的节点之间的边缘,通常用B表示。

载图支持的方式多种多样,有以下几种:

  • 边集
  • cvs文件
  • numpy array
  • 邻接矩阵
  • dataframe
  • GraphML
  • NetworkX
  • 其它

这里以边集为例:

from IPython.display import SVG

import numpy as np
from scipy import sparse
import pandas as pd

from sknetwork.data import from_edge_list, from_adjacency_list, from_graphml, from_csv
from sknetwork.visualization import svg_graph, svg_bigraph

edge_list = [(0, 1), (1, 2), (2, 3), (3, 0), (0, 2)]
adjacency = from_edge_list(edge_list)

image = svg_graph(adjacency)
SVG(image)

在这里插入图片描述

图分析

每种算法都表示为具有拟合方法(fit)的对象。

这里将空手道俱乐部图数据与Louvain算法进行聚类展示:

from sknetwork.data import karate_club
from sknetwork.clustering import Louvain

adjacency = karate_club()
image = svg_graph(adjacency)
SVG(image)

algo = Louvain()
algo.fit(adjacency)
labels = algo.labels_

在这里插入图片描述

array([0, 0, 0, 0, 3, 3, 3, 0, 1, 0, 3, 0, 0, 0, 1, 1, 3, 0, 1, 0, 1, 0,
       1, 2, 2, 2, 1, 2, 2, 1, 1, 2, 1, 1])

可以看到,将其聚类为4类。

参考