仓库源文站点原文


layout: default

title: 社区发现算法概览

背景

计算机能处理的大部分是结构化数据,拥有规范的行和列,但世界上有大量的数据以关系的方式存在,比如社交网络中的朋友关系、交通中各个路口的关系、推荐系统中人和物品的关系。

这就需要图数据结构来描述这种关系,用来进行数据分析。

社区算法举例

Louvain

louvain 是最常用的社团发现算法,它以优化模块度为目标对群体进行划分。

page rank:https://zh.m.wikipedia.org/zh-hans/PageRank

Lpa

通过将有标数据的标签传播给邻居节点,从而给无标数据打上标签。

https://www.cnblogs.com/LittleHann/p/10699988.html

DBSCAN

通过核心点+扩散的思路划分社区

fraudar

二部图中,寻找最优的待删除的行或列,剩余的子图组成社区

Page rank

Page rank 是 Google 网页排名最早、最著名的算法,以 Google 两位创始人之一 Larry Page 的名字命名。

Page rank 根据网页之间的超链接关系,能计算出网页的重要性排名,原则是有越多的高质量网页能链接到当前网页,那这个网页的质量就更高。

参考

知乎综述:https://zhuanlan.zhihu.com/p/141401358

csdn综述:https://eason.blog.csdn.net/article/details/91352358

CS224W:http://web.stanford.edu/class/cs224w/

杂谈

不涉及深度学习的社团算法,都比较好解释和应用。当融入了神经网络之后,解释性就会成为效果提升的壁垒,这么看的话还是得先搞明白解释性的问题。