# 图论总结篇 从深搜广搜 到并查集,从最小生成树到拓扑排序, 最后是最短路算法系列。 至此算上本篇,一共30篇文章,图论之旅就在此收官了。 在[0098.所有可达路径](./0098.所有可达路径.md) ,我们接触了两种图的存储方式,邻接表和邻接矩阵,掌握两种图的存储方式很重要。 图的存储方式也是大家习惯在核心代码模式下刷题 经常忽略的 知识点。因为在力扣上刷题不需要掌握图的存储方式。 ## 深搜与广搜 在二叉树章节中,其实我们讲过了 深搜和广搜在二叉树上的搜索过程。 在图论章节中,深搜与广搜就是在图这个数据结构上的搜索过程。 深搜与广搜是图论里基本的搜索方法,大家需要掌握三点: * 搜索方式:深搜是可一个方向搜,不到黄河不回头。 广搜是围绕这起点一圈一圈的去搜。 * 代码模板:需要熟练掌握深搜和广搜的基本写法。 * 应用场景:图论题目基本上可以即用深搜也可用广搜,无疑是用哪个方便而已 ### 注意事项 需要注意的是,同样是深搜模板题,会有两种写法。 在[0099.岛屿的数量深搜.md](./0099.岛屿的数量深搜.md) 和 [0105.有向图的完全可达性](./0105.有向图的完全可达性.md),涉及到dfs的两种写法。 **我们对dfs函数的定义是 是处理当前节点 还是处理下一个节点 很重要**,决定了两种dfs的写法。 这也是为什么很多录友看到不同的dfs写法,结果发现提交都能过的原因。 而深搜还有细节,有的深搜题目需要用到回溯的过程,有的就不用回溯的过程, 一般是需要计算路径的问题 需要回溯,如果只是染色问题(岛屿问题系列) 就不需要回溯。 例如: [0105.有向图的完全可达性](./0105.有向图的完全可达性.md) 深搜就不需要回溯,而 [0098.所有可达路径](./0098.所有可达路径.md) 中的递归就需要回溯,文章中都有详细讲解 注意:以上说的是不需要回溯,不是没有回溯,只要有递归就会有回溯,只是我们是否需要用到回溯这个过程,这是需要考虑的。 很多录友写出来的广搜可能超时了, 例如题目:[0099.岛屿的数量广搜](./0099.岛屿的数量广搜.md) 根本原因是**只要 加入队列就代表 走过,就需要标记,而不是从队列拿出来的时候再去标记走过**。 具体原因,我在[0099.岛屿的数量广搜](./0099.岛屿的数量广搜.md) 中详细讲了。 在深搜与广搜的讲解中,为了防止惯性思维,我特别加入了题目 [0106.岛屿的周长](./0106.岛屿的周长.md),提醒大家,看到类似的题目,也不要上来就想着深搜和广搜。 还有一些图的问题,在题目描述中,是没有图的,需要我们自己构建一个图,例如 [0110.字符串接龙](./0110.字符串接龙.md),题目中连线都没有,需要我们自己去思考 什么样的两个字符串可以连成线。 ## 并查集 并查集相对来说是比较复杂的数据结构,其实他的代码不长,但想彻底学透并查集,需要从多个维度入手, 我在理论基础篇的时候 讲解如下重点: * 为什么要用并查集,怎么不用个二维数据,或者set、map之类的。 * 并查集能解决那些问题,哪些场景会用到并查集 * 并查集原理以及代码实现 * 并查集写法的常见误区 * 带大家去模拟一遍并查集的过程 * 路径压缩的过程 * 时间复杂度分析 上面这几个维度 大家都去思考了,并查集基本就学明白了。 其实理论基础篇就算是给大家出了一道裸的并查集题目了,所以在后面的题目安排中,会稍稍的拔高一些,重点在于并查集的应用上。 例如 并查集可以判断这个图是否是树,因为树的话,只有一个根,符合并查集判断集合的逻辑,题目:[0108.冗余连接](./0108.冗余连接.md)。 在[0109.冗余连接II](./0109.冗余连接II.md) 中 对有向树的判断难度更大一些,需要考虑的情况比较多。 ## 最小生成树 最小生成树是所有节点的最小连通子图, 即:以最小的成本(边的权值)将图中所有节点链接到一起。 最小生成树算法,有prim 和 kruskal。 **prim 算法是维护节点的集合,而 Kruskal 是维护边的集合**。 在 稀疏图中,用Kruskal更优。 在稠密图中,用prim算法更优。 > 边数量较少为稀疏图,接近或等于完全图(所有节点皆相连)为稠密图 Prim 算法 时间复杂度为 O(n^2),其中 n 为节点数量,它的运行效率和图中边树无关,适用稠密图。 Kruskal算法 时间复杂度 为 O(nlogn),其中n 为边的数量,适用稀疏图。 关于 prim算法,我自创了三部曲,来帮助大家理解: 1. 第一步,选距离生成树最近节点 2. 第二步,最近节点加入生成树 3. 第三步,更新非生成树节点到生成树的距离(即更新minDist数组) 大家只要理解这三部曲, prim算法 至少是可以写出一个框架出来,然后在慢慢补充细节,这样不至于 自己在写prim的时候 两眼一抹黑 完全凭感觉去写。 **minDist数组 是prim算法的灵魂,它帮助 prim算法完成最重要的一步,就是如何找到 距离最小生成树最近的点**。 kruscal的主要思路: * 边的权值排序,因为要优先选最小的边加入到生成树里 * 遍历排序后的边 * 如果边首尾的两个节点在同一个集合,说明如果连上这条边图中会出现环 * 如果边首尾的两个节点不在同一个集合,加入到最小生成树,并把两个节点加入同一个集合 而判断节点是否在一个集合 以及将两个节点放入同一个集合,正是并查集的擅长所在。 所以 Kruskal 是需要用到并查集的。 这也是我在代码随想录图论编排上 为什么要先 讲解 并查集 在讲解 最小生成树。 ## 拓扑排序 拓扑排序 是在图上的一种排序。 概括来说,**给出一个 有向图,把这个有向图转成线性的排序 就叫拓扑排序**。 同样,拓扑排序也可以检测这个有向图 是否有环,即存在循环依赖的情况。 拓扑排序的一些应用场景,例如:大学排课,文件下载依赖 等等。 只要记住如下两步拓扑排序的过程,代码就容易写了: 1. 找到入度为0 的节点,加入结果集 2. 将该节点从图中移除 ## 最短路算法 最短路算法是图论中,比较复杂的算法,而且不同的最短路算法都有不同的应用场景。 我在 [最短路算法总结篇](./最短路问题总结篇.md) 里已经做了一个高度的概括。 大家要时常温故而知新,才能透彻理解各个最短路算法。 ## 总结 到最后,图论终于剧终了,相信这是市面上大家能看到最全最细致的图论讲解教程。 图论也是我 《代码随想录》所有章节里 所费精力最大的一个章节。 只为了不负录友们的期待。 大家加油💪🏻