您当前的位置:首页 > 电脑百科 > 程序开发 > 算法

什么是“并查集”?

时间:2020-08-31 12:56:31  来源:  作者:

并查集是什么

并查集,是一种判断“远房亲戚”的算法。

打个比方:你身边的某个“朋友”,很有可能就是你父亲的母亲的姑妈的大姨的哥哥的表妹的孙子的女儿的父亲的孙子。如果给定这么一张“家谱”(无向图),如何判断两个顶点是不是“亲戚”呢?用人话说,就是判断一个图中两个点是否联通(两个顶点相互联通则为亲戚)。

并查集是专门用来解决这样的问题的,和搜索不同,并查集在构建图的时候同时就标记出了哪个“人”属于哪个“团伙”(一团伙中的点两两联通)。

什么是“并查集”?

 

 

并查集的操作

1. 初始化

并查集的思想是通过标记确定该顶点所在的组

所以对于一个n个点,m条边的图,我们需要新建一个长度为n的数组f(可以理解为father),f[n]代表点n的团伙“代表人”,当两个点所在团伙“代表人”相同,则这两个点所在团伙相同。

而在最开始,每个顶点间都是互相不连通的,所以每个顶点单独属于一个团伙,每个顶点理所应当成为自己团伙的“代表人”,所以我们把f[n]的初始值赋为n。

什么是“并查集”?

 

2. 合并团伙

我们以连接3和1这两个点做例子:

在连接点3和点1时,3和1形成了一个团伙,而3和1的团伙代表人f[3]和f[1]就应该统一,具体是让3做代表人还是让1做代表人随便,我们让1做代表人。f[3] = 1,这条语句可以理解为让1所在团伙的代表人同时成为3所在团伙的代表人。

什么是“并查集”?

 

 

什么是“并查集”?

 

 

(箭头只是体现了f数组中“团伙成员”和“代表人”的关系,其实这个图是无向图)

可是,像f[a] = b这样合并真的对吗?请读者考虑这样一种情况。

刚刚我们合并了3和1,现在我们需要合并3和2。如果按照f[a] = b这样合并,那么,f[3]就被赋值为了2。这样,f[3]原本的值1就被覆盖了,也就是说,1和3的团伙就被硬生生地“拆散”了。

什么是“并查集”?

 

所以我们不应该令f[3] =4,应该让f[3的团伙代表人] = (4的团伙代表人),如下图。

什么是“并查集”?

 

这样,合并两个团伙的工作就完成了。总结起来就一句话:f[a的团伙代表人] = (b的团伙代表人)。

3. 查找团伙代表人

紧接着,又一个问题浮出水面:根据上面的公式f[a的团伙代表人] = (b的团伙代表人),可是a、b的团伙代表人怎么求?是f[a]吗?不不不,这里的情况变得复杂了。大家再次考虑一种特殊情况。

什么是“并查集”?

 

 

在这种情况下,3的团伙代表人是谁?1还是4?正确答案是4。因为,一个团伙中每一个点都直接或间接地“指向”这个团伙的代表人。(1,3,4)这个团伙中,1直接地指向4,3间接地指向4,所以4才是这个团伙里的代表人。

那么,点x的团伙代表人怎么求呢?我们会发现另一个特征,任何一个团伙的代表人a,都有f[a] = a。很好理解,团伙代表人也是团伙的一个成员,团伙代表人所在团伙的代表人就是它自己。

而对于其他点a,f[a]均不等于a。并且如果一个顶点a有f[a] ≠ a,那么这个点一定不是团伙的代表人,因为f[a]不会间接地或直接地指向a(并查集保证不会存在环)。

根据这一特性,我们可以判断点a是否为某个团伙的代表人。

在例子中,我们想要知道1是否为团伙代表人,就可以看f[1]是否等于1,很明显,f[1] = 4,所以1不是该团伙的代表人,我们要继续“追本溯源”,对5进行判断。这个过程就是一种递归的寻找过程。

知道了这个特性,我们就可以写出相应的C++代码(这里还给出了循环版的代码,根据情况使用):

int getFather(int x) {
    return f[x] == x ? x : getFather(f[x]);
}
int getFather(int x) {
    while (f[x] != x)
        x = f[x];    return x;
}

这是一个递归函数,如果f[x] = x,说明这个点已经是该团伙的代表人,直接返回就好了,如果它不是该团伙的代表人,那么就返回自己指向的点的团伙代表人。

在求getFather(3)时,f[3] != 3,返回getFather(f[3])也就是getFather(1);

在求getFather(1)时,f[1] != 1,返回getFather(f[1])也就是getFather(4);

在求getFather(4)时,f[4] == 4,返回4。递归结束。最后计算出3的团伙代表人是4。

4. 查询顶点是否在同一团伙

并查集的最后一种操作叫做查询,就是查询两个点是否连通(在同一团伙)。

前面已经讲了,当两个点所在团伙“代表人”相同,则这两个点所在团伙相同。判断两个点a、b在同一团伙的方法就是:

getFather(a) == getFather(b)

5. 完整代码

const int N = 100; // 节点数量
int f[N];
int init() {
    // 初始化
    for (int i=0; i<N; i++)
        f[i] == i;}int getFather(int x) {
    // 查询所在团伙代表人
    return f[x]==x ? x : getFather(f[x]);
}int merge(int a, int b) {
    // 合并操作
    f[getFather(a)] = getFather(b);}bool query(int a, int b) {
    // 查询操作
    return getFather(a) == getFather(b);
}int main() {
    init();    merge(3, 1); // 3和1是亲戚
    merge(1, 4); // 1和4是亲戚
    cout << getFather(3) << endl; // 输出3的团伙代表人+换行
    cout << query(3, 1) << endl; // 输出3和1是否是亲戚+换行
}

并查集巧妙吧!我们既没有构建图,也没有构建边,自始至终只用到了f数组,又优化了时间。

不要小瞧并查集代码短,在很多时候并查集都会派上用场,比如著名的克鲁斯卡尔算法,就是通过并查集判断两个顶点是否相连的。更重要的是体会并查集的思想,用这种思想来优化代码。



Tags:并查集   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
并查集是什么并查集,是一种判断“远房亲戚”的算法。打个比方:你身边的某个“朋友”,很有可能就是你父亲的母亲的姑妈的大姨的哥哥的表妹的孙子的女儿的父亲的孙子。如果给定这...【详细内容】
2020-08-31  Tags: 并查集  点击:(61)  评论:(0)  加入收藏
▌简易百科推荐
前言Kafka 中有很多延时操作,比如对于耗时的网络请求(比如 Produce 是等待 ISR 副本复制成功)会被封装成 DelayOperation 进行延迟处理操作,防止阻塞 Kafka请求处理线程。Kafka...【详细内容】
2021-12-27  Java技术那些事    Tags:时间轮   点击:(1)  评论:(0)  加入收藏
博雯 发自 凹非寺量子位 报道 | 公众号 QbitAI在炼丹过程中,为了减少训练所需资源,MLer有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。这就...【详细内容】
2021-12-24  量子位    Tags:蒸馏法   点击:(9)  评论:(0)  加入收藏
分稀疏重建和稠密重建两类:稀疏重建:使用RGB相机SLAMOrb-slam,Orb-slam2,orb-slam3:工程地址在: http://webdiis.unizar.es/~raulmur/orbslam/ DSO(Direct Sparse Odometry)因为...【详细内容】
2021-12-23  老师明明可以靠颜值    Tags:算法   点击:(7)  评论:(0)  加入收藏
1. 基本概念希尔排序又叫递减增量排序算法,它是在直接插入排序算法的基础上进行改进而来的,综合来说它的效率肯定是要高于直接插入排序算法的;希尔排序是一种不稳定的排序算法...【详细内容】
2021-12-22  青石野草    Tags:希尔排序   点击:(6)  评论:(0)  加入收藏
ROP是一种技巧,我们对execve函数进行拼凑来进行system /bin/sh。栈迁移的特征是溢出0x10个字符,在本次getshell中,还碰到了如何利用printf函数来进行canary的泄露。ROP+栈迁移...【详细内容】
2021-12-15  星云博创    Tags:栈迁移   点击:(19)  评论:(0)  加入收藏
一、什么是冒泡排序1.1、文字描述冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地...【详细内容】
2021-12-15    晓掌柜丶韶华  Tags:排序算法   点击:(16)  评论:(0)  加入收藏
在了解golang的map之前,我们需要了解哈希这个概念。哈希表,又称散列表(Hash table),是根据键(key)而直接访问在内存储存位置的数据结构。也就是说,它通过计算出一个键值的函数,将...【详细内容】
2021-12-07  一棵梧桐木    Tags:哈希表   点击:(13)  评论:(0)  加入收藏
前面文章在谈论分布式唯一ID生成的时候,有提到雪花算法,这一次,我们详细点讲解,只讲它。SnowFlake算法据国家大气研究中心的查尔斯&middot;奈特称,一般的雪花大约由10^19个水分子...【详细内容】
2021-11-17  小心程序猿QAQ    Tags:雪花算法   点击:(24)  评论:(0)  加入收藏
导读:在大数据时代,对复杂数据结构中的各数据项进行有效的排序和查找的能力非常重要,因为很多现代算法都需要用到它。在为数据恰当选择排序和查找策略时,需要根据数据的规模和类型进行判断。尽管不同策略最终得到的结果完...【详细内容】
2021-11-04  华章科技    Tags:排序算法   点击:(37)  评论:(0)  加入收藏
这是我在网上找的资源的一个总结,会先给出一个我看了觉得还行的关于算法的讲解,再配上实现的代码: Original author: Bill_Hoo Original Address: http://blog.sina.com.cn/s/bl...【详细内容】
2021-11-04  有AI野心的电工和码农    Tags: KMP算法   点击:(36)  评论:(0)  加入收藏
相关文章
    无相关信息
最新更新
栏目热门
栏目头条