likes
comments
collection
share

数据结构与算法(十一)图的进阶

作者站长头像
站长
· 阅读数 11

有向图

在实际生活中,很多应用相关的图都是有方向性的,最直观的就是网络,可以从A页面通过链接跳转到B页面,那么a和b连接的方向是a -> b,但不能说是b -> a,此时我们就需要使用有向图来解决这一类问题,它和我们之前学习的无向图,最大的区别就在于连接是具有方向的,在代码的处理上也会有很大的不同。

数据结构与算法(十一)图的进阶

有向图的定义及相关术语

定义:有向图是一幅具有方向性的图,是由一组顶点和一组有方向的边组成的,每条方向的边都连着一对有序的顶点。

出度:由某个顶点指出的边的个数称为该顶点的出度。

入度:指向某个顶点的边的个数称为该顶点的入度。

有向路径:由一系列顶点组成,对于其中的每个顶点都存在一条有向边,从它指向序列中的下一个顶点。

有向环:一条至少含有一条边,且起点和终点相同的有向路径。

数据结构与算法(十一)图的进阶

一幅有向图中两个顶点v和w可能存在以下四种关系:

  1. 没有边相连;
  2. 存在从v到w的边v -> w
  3. 存在从w到v的边w -> v
  4. 既存在w到v的边,也存在v到w的边,即双向连接;

理解有向图是一件比较简单的,但如果要通过眼睛看出复杂有向图中的路径就不是那么容易了。

数据结构与算法(十一)图的进阶

有向图API设计

类名Digraph
构造方法Digraph(int v):创建一个包含V个顶点但不包含边的有向图
成员方法public int v():获取图中顶点的数量public int e():获取图中边的数量public void addEdge(int v, int w):向有向图中添加一条边v->wpublic Queue<Integer> adj(int v):获取由v指出的边所连接的所有顶点private Digraph reverse():该图的反向图
成员变量private final int v: 记录顶点数量private int e:记录边数量private Queue[] adj:邻接表

在API中设计了一个反向图,其因为有向图的实现中,用adj方法获取出来的是由当前顶点v指向的其他顶点,如果能得到其反向图,就可以很容易得到指向v的其他顶点。

代码实现

public class Digraph {

    /**
     * 记录顶点数量
     */
    private final int v;

    /**
     * 记录边数量
     */
    private int e;

    /**
     * 邻接表
     */
    private Queue<Integer>[] adj;

    /**
     * 创建一个包含V个顶点但不包含边的有向图
     */
    public Digraph(int v) {
        // 初始化顶点数量
        this.v = v;
        // 初始化边的数量
        this.e = 0;
        this.adj = new Queue[v];
        // 初始化邻接表中的空队列
        for (int i = 0; i < adj.length; i++) {
            adj[i] = new Queue<>();
        }
    }

    /**
     * 获取图中顶点的数量
     */
    public int v() {
        return v;
    }

    /**
     * 获取图中边的数量
     */
    public int e() {
        return e;
    }

    /**
     * 向有向图中添加一条边 v->w
     */
    public void addEdge(int v, int w) {
        // 由于有向图中边是有向的,v->w 边,只需要让w出现在v的邻接表中,而不需要让v出现在w的邻接表中
        adj[v].push(w);
        e++;
    }

    /**
     * 获取由v指出的边所连接的所有顶点
     */
    public Queue<Integer> adj(int v) {
        return adj[v];
    }

    /**
     * 该图的反向图
     */
    private Digraph reverse() {
        // 创建新的有向图对象
        var reverse = new Digraph(v);
        // 遍历0~V-1所有顶点,拿到每一个顶点v
        for (int i = 0; i < v; i++) {
            // 得到原图中的v顶点对应的邻接表,原图中的边为 v->w,则反向图中边为w->v;
            for (var w : adj[v]) {
                // 重新添加边,方向为原图的反方向
                reverse.addEdge(w, v);
            }
        }
        return reverse;
    }
}

拓扑排序

在现实生活中,我们经常会同一时间接到很多任务去完成,但是这些任务的完成是有先后次序的。以我们学习Java学科为例,我们需要学习很多知识,但是这些知识在学习的过程中是需要按照先后次序来完成的。从Java基础,到JSP/Servlet,到SSM,到SpringBoot等是个循序渐进且有依赖的过程。在学习JSP前要首先掌握Java基础和HTML基础,学习SSM框架前要掌握JSP/Servlet之类才行。

数据结构与算法(十一)图的进阶

为了简化问题,我们使用整数为顶点编号的标准模型来表示这个案例:

数据结构与算法(十一)图的进阶

此时如果某个同学要学习这些课程,就需要指定出一个学习的方案,我们只需要对图中的顶点进行排序,让它转换为一个线性序列,就可以解决问题,这时就需要用到一种叫拓扑排序的算法。

拓扑排序:给定一幅有向图,将所有的顶点排序,使得所有的有向边均从排在前面的元素指向排在后面的元素,此时就可以明确的表示出每个顶点的优先级。

下列是一幅拓扑排序后的示意图:

数据结构与算法(十一)图的进阶

检测有向图中的环

如果学习x课程前必须先学习y课程,学习y课程前必须先学习z课程,学习z课程前必须先学习x课程,那么一定是有问题了,我们就没有办法学习了,因为这三个条件没有办法同时满足。其实这三门课程x、y、z的条件组成了一个环:

数据结构与算法(十一)图的进阶

因此,如果我们要使用拓扑排序解决优先级问题,首先得保证图中没有环的存在,如果有环,那就无法进行拓扑排序

检测有向环的API设计

类名DirectedCycle
构造方法DirectedCycle(Digraph g):创建一个检测环对象,检测图G中是否有环
成员方法private void dfs(Digraph g, int v):基于深度优先搜索,检测图G中是否有环public boolean hasCycle():判断图中是否有环
成员变量private boolean[] marked:索引代表顶点,值表示当前顶点是否已经被搜索private boolean hasCycle:记录图中是否有环private boolean[] onStack:索引代表顶点,使用栈的思想,记录当前顶点有没有已经处于正在搜索的有向路径上

检测有向环的代码实现

在API中添加了onStack[]布尔数组,索引为图的顶点,当我们深度搜索时:

  1. 在如果当前顶点正在搜索,则把对应的onStack数组中的值改为true,标识进栈;
  2. 如果当前顶点搜索完毕,则把对应的onStack数组中的值改为false,标识出栈;
  3. 如果即将要搜索某个顶点,但该顶点已经在栈中,则图中有环;

数据结构与算法(十一)图的进阶

public class DirectedCycle {

    /**
     * 索引代表顶点,值表示当前顶点是否已经被搜索
     */
    private boolean[] marked;

    /**
     * 记录图中是否有环
     */
    private boolean hasCycle;

    /**
     * 索引代表顶点,使用栈的思想,记录当前顶点有没有已经处于正在搜索的有向路径上
     */
    private boolean[] onStack;

    /**
     * 创建一个检测环对象,检测图G中是否有环
     */
    public DirectedCycle(Digraph g) {
        // 初始化marked数组
        this.marked = new boolean[g.v()];
        // 初始化hasCycle
        this.hasCycle = false;
        // 初始化onStack
        this.onStack = new boolean[g.v()];
        // 找到图中每一个顶点,让每一个顶点作为入口,调用一次dfs进行搜索
        for (var v = 0; v < g.v(); v++) {
            // 如果当前顶点还没有被搜索过,那么调用dfs搜索
            if (!marked[v]) {
                dfs(g, v);
            }
        }
    }

    /**
     * 基于深度优先搜索,检测图G中是否有环
     */
    private void dfs(Digraph g, int v) {
        // 标识当前顶点已被搜索
        marked[v] = true;
        // 把当前顶点进栈
        onStack[v] = true;

        // 进行深度搜索
        for (var w : g.adj(v)) {
            // 如果当前顶点w没有被搜索过,递归调用dfs搜索
            if (!marked[w]) {
                dfs(g, w);
            }
            // 如果当前顶点已经在栈中,表示有环
            if (onStack[w]) {
                hasCycle = true;
                return;
            }
        }

        // 把当前顶点出栈
        onStack[v] = false;
    }

    /**
     * 判断图中是否有环
     */
    public boolean hasCycle() {
        return hasCycle;
    }
    
}

基于深度优先的顶点排序

如果要把图中的顶点生成线性序列其实是一件非常简单的事,之前我们学习并使用了多次深度优先搜索,我们会发现其实深度优先搜索有一个特点,那就是在一个连通子图上,每个顶点只会被搜索一次,如果我们能在深度优先搜索的基础上,添加一行代码,只需要将搜索的顶点放入到线性序列的数据结构中,我们就能完成这件事。

顶点排序API设计

类名DepthFirstOrder
构造方法DepthFirstOrder(Digraph g):创建一个顶点排序对象,生成顶点线性序列
成员方法private void dfs(Digraph g, int v):基于深度优先搜索,生成顶点线性序列public Stack<Integer> reversePost():获取顶点线性序列
成员变量private boolean[] marked:索引代表顶点,值表示当前顶点是否已经被搜索private Stack<Integer> reversePost:使用栈,存储顶点序列

顶点排序实现

在API的设计中,我们添加了一个栈reversePost用来存储顶点,当我们深度搜索图时,每搜索完毕一个顶点,把该顶点放入到reversePost中,这样就可以实现顶点排序。

步骤如下:

  1. 以0顶点为入口,开始搜索,递归搜索一直找到顶点5,顶点5邻接表中没有数据,所以顶点5搜索完毕,顶点5入栈。
  2. 返回到顶点4,邻接表中没有其他顶点,顶点4搜索结束,顶点4入栈。
  3. 返回到顶点2,邻接表中没有其他顶点,顶点2搜索结束,顶点2入栈。
  4. 返回到顶点1,继续找邻接表中的顶点3搜索,顶点3邻接表中的顶点4已经搜索完毕,所以顶点3搜索完毕,顶点3入栈。

数据结构与算法(十一)图的进阶

public class DepthFirstOrder {

    /**
     * 索引代表顶点,值表示当前顶点是否已经被搜索
     */
    private final boolean[] marked;

    /**
     * 使用栈,存储顶点序列
     */
    private final Stack<Integer> reversePost;

    /**
     * 创建一个顶点排序对象,生成顶点线性序列
     */
    public DepthFirstOrder(Digraph g) {
        this.marked = new boolean[g.v()];
        this.reversePost = new Stack<>();

        // 遍历图中的每一个顶点,让每个顶点作为入口,深度优先搜索
        for (var v = 0; v < g.v(); v++) {
            if (!marked[v]) {
                dfs(g, v);
            }
        }
    }

    /**
     * 获取顶点线性序列
     */
    public Stack<Integer> reversePost() {
        return reversePost;
    }

    /**
     * 基于深度优先搜索,生成顶点线性序列
     */
    private void dfs(Digraph g, int v) {
        // 标记当前v已经被搜索
        marked[v] = true;
        // 通过循环深度搜索顶点v
        for (var w : g.adj(v)) {
            if (!marked[w]) {
                dfs(g, w);
            }
        }
        // 顶点v进站
        reversePost.push(v);
    }

}

拓扑排序实现

前面已经实现了环的检测以及顶点排序,那么拓扑排序就很简单了,基于一幅图,先检测有没有环,如果没有环,则调用顶点排序即可。

API设计

类名TopoLogical
构造方法TopoLogical(Digraph g):构造拓扑排序对象
成员方法public boolean isCycle():判断图G是否有环public Stack<Integer> order():获取拓扑排序的所有顶点
成员变量private Stack<Integer> order:顶点的拓扑排序

代码实现

public class TopoLogical {

    /**
     * 顶点的拓扑排序
     */
    private Stack<Integer> order;

    /**
     * 构造拓扑排序对象
     */
    public TopoLogical(Digraph g) {
        // 创建一个检测有向环对象
        var directedCycle = new DirectedCycle(g);
        // 判断G图中有没有环,如果没有环,则进行顶点排序,创建一个顶点排序对象
        if (!directedCycle.hasCycle()) {
            var depthFirstOrder = new DepthFirstOrder(g);
            order = depthFirstOrder.reversePost();
        }
    }

    /**
     * 判断图G是否有环
     */
    public boolean isCycle() {
        return order == null;
    }

    /**
     * 获取拓扑排序的所有顶点
     */
    public Stack<Integer> order() {
        return order;
    }
    
}

测试代码

@Slf4j
class TopoLogicalTest {

    @Test
    void test() {
        // 准备有向图
        var digraph = new Digraph(6);
        digraph.addEdge(0, 2);
        digraph.addEdge(0, 3);
        digraph.addEdge(2, 4);
        digraph.addEdge(3, 4);
        digraph.addEdge(4, 5);
        digraph.addEdge(1, 3);
        // 构造拓扑排序对象
        var topoLogical = new TopoLogical(digraph);
        // 打印拓扑序列
        var order = topoLogical.order();
        var sb = new StringBuilder();
        for (var o : order) {
            sb.append(o).append(" -> ");
        }

        var orderStr = sb.toString();
        orderStr = orderStr.substring(0, orderStr.lastIndexOf(" -> "));

        // 拓扑排序:1 -> 0 -> 3 -> 2 -> 4 -> 5
        LOGGER.info("拓扑排序:{}", orderStr);
    }

}

加权无向图

加权无向图是一种为每条边关联一个权重值或是成本的图模型,这种图能够自然地表示许多应用。

在一幅航空图中,边表示航线,权值则可以表示距离或是费用。在一幅电路图中,边表示导线,权值则可能表示导线的长度即成本,或是信号通过这条先所需的时间。此时我们很容易就能想到,最小成本的问题;例如,从西安飞纽约,怎样飞才能使时间成本最低或者是金钱成本最低?

在下图中,从顶点0到顶点4有三条路径,分别为0-2-3-40-2-40-5-3-4,那我们如果要通过那条路径到达4顶点最好呢?此时就要考虑,那条路径的成本最低。

数据结构与算法(十一)图的进阶

加权无向图边的表示

加权无向图中的边我们就不能简单的使用v-w两个顶点表示了,而必须要给边关联一个权重值,因此我们可以使用对象来描述一条边。

API设计

类名Edge implements Comparable
构造方法Edge(int v, int w, double weight):通过顶点v和w,以及权重weight值构造一个边对象
成员方法public double weight():获取边的权重值public int either():获取边上的一个点public int other(int vertex):获取边上除了顶点vertex外的另外一个顶点public int compareTo(Edge that):比较当前边和参数that边的权重,如果当前边权重大,返回1,如果一样大,返回0,如果当前权重小,返回-1
成员变量private final int v:顶点一private final int w:顶点二private final double weight:当前边的权重

代码实现

@RequiredArgsConstructor
public class Edge implements Comparable<Edge> {

    /**
     * 顶点一
     */
    private final int v;

    /**
     * 顶点二
     */
    private final int w;

    /**
     * 当前边的权重
     */
    private final double weight;

    /**
     * 获取边的权重值
     */
    public double weight() {
        return this.weight;
    }

    /**
     * 获取边上的一个点
     */
    public int either() {
        return v;
    }

    /**
     * 获取边上除了顶点vertex外的另外一个顶点
     */
    public int other(int vertex) {
        return vertex == v ? w : v;
    }

    /**
     * 比较当前边和参数that边的权重,如果当前边权重大,返回1,如果一样大,返回0,如果当前权重小,返回-1
     */
    @Override
    public int compareTo(Edge o) {
        return Double.compare(this.weight, o.weight);
    }
}

加权无向图的实现

之前我们已经完成了无向图,在无向图的基础上,我们只需要把边的表示切换成Edge对象即可。

API设计

类名EdgeWeightedGraph
构造方法EdgeWeightedGraph(int v):创建一个含有V个顶点的空加权无向图
成员方法public int v():获取图中顶点的数量public int e():获取图中边的数量public void addEdge(Edge e):向加权无向图中添加一条边epublic Queue<Edge> adj(int v):获取和顶点v关联的所有边public Queue<Edge> edges():获取加权无向图的所有边
成员变量private final int v:记录顶点数量private int e:记录边数量private Queue<Edge>[] adj:邻接表

代码实现

public class EdgeWeightedGraph {

    /**
     * 记录顶点数量
     */
    private final int v;

    /**
     * 记录边数量
     */
    private int e;

    /**
     * 邻接表
     */
    private final Queue<Edge>[] adj;

    public EdgeWeightedGraph(int v) {
        this.v = v;
        this.e = 0;
        this.adj = new Queue[v];
        for (int i = 0; i < adj.length; i++) {
            adj[i] = new Queue<>();
        }
    }

    /**
     * 获取图中顶点的数量
     */
    public int v() {
        return v;
    }

    /**
     * 获取图中边的数量
     */
    public int e() {
        return e;
    }

    /**
     * 向加权无向图中添加一条边e
     */
    public void addEdge(Edge edge) {
        // 需要让边e同时出现在e这个边的两个顶点的邻接表中
        var v = edge.either();
        var w = edge.other(v);

        adj[v].push(edge);
        adj[w].push(edge);

        // 边的数量 + 1
        e++;
    }

    /**
     * 获取和顶点v关联的所有边
     */
    public Queue<Edge> adj(int v) {
        return adj[v];
    }

    /**
     * 获取加权无向图的所有边
     */
    public Queue<Edge> edges() {
        // 创建一个队列对象,存储所有的边
        var edges = new Queue<Edge>();
        // 遍历图中的每一个顶点,找到该顶点的邻接表,邻接表中存储了该顶点关联的每一条边
        // 因为这是无向图,所以同一条边同时出现在了它关联的两个顶点的邻接表中,需要让每一条边只记录一次
        for (var i = 0; i < v; i++) {
            // 遍历i的邻接表,找到每一条和i关联的边
            for (var edge : adj[i]) {
                if (edge.other(i) < i) {
                    edges.push(edge);
                }
            }
        }
        return edges;
    }

}

最小生成树

之前学习的加权图,我们发现它的边关联了一个权重,那么我们就可以根据这个权重解决最小成本问题,但如何才能找到最小成本对应的顶点和边呢?

最小生成树相关算法可以解决。

数据结构与算法(十一)图的进阶

最小生成树定义及相关约定

定义:图的生成树是它的一棵含有其所有顶点无环连通子图,一幅加权无向图的最小生成树它的一棵权值(树中所有边的权重之和)最小的生成树。

数据结构与算法(十一)图的进阶

约定:只考虑连通图。最小生成树的定义说明它只能存在于连通图中,如果图不是连通的,那么分别计算每个连通图子图的最小生成树,合并到一起称为最小生成森林

数据结构与算法(十一)图的进阶

所有边的权重都各不相同。如果不同的边权重可以相同,那么一幅图的最小生成树就可能不唯一了

虽然我们的算法可以处理这种情况,但为了好理解,我们约定所有边的权重都各不相同

最小生成树原理

树的性质

  1. 用一条边接树中的任意两个顶点都会产生一个新的环;

数据结构与算法(十一)图的进阶

  1. 从树中删除任意一条边,将会得到两棵独立的树;

数据结构与算法(十一)图的进阶

切分定理

要从一幅连通图中找出该图的最小生成树,需要通过切分定理完成。

切分:将图的所有顶点按照某些规则分为两个非空且没有交集的集合。

横切边连接两个属于不同集合的顶点的边称之为横切边。

例如我们将图中的顶点切分为两个集合,灰色顶点属于一个集合,白色顶点属于另外一个集合,那么效果如下:

数据结构与算法(十一)图的进阶

切分定理:在一幅加权图中,给定任意的切分,它的横切边中的权重最小者必然属于图中的最小生成树。

数据结构与算法(十一)图的进阶

注意:一次切分产生的多个横切边中,权重最小的边不一定是所有横切边中唯一属于图的最小生成树的边。

数据结构与算法(十一)图的进阶

贪心算法

贪心算法是计算图的最小生成树的基础算法,它的基本原理就是切分定理,使用切分定理找到最小生成树的一条边,不断的重复直到找到最小生成树的所有边。

如果图有V个顶点,那么需要找到V-1条边,就可以表示该图的最小生成树。

数据结构与算法(十一)图的进阶

计算图的最小生成树的算法有很多种,但这些算法都可以看做是贪心算法的一种特殊情况,这些算法的不同之处在于保存切分和判定权重最小的横切边的方式。

Prim算法

我们学习第一种计算最小生成树的方法叫Prim算法,它的每一步都会为一棵生成中的树添加一条边。一开始这棵树只有一个顶点,然后会向它添加V-1条边,每次总是将下一条连接树中的顶点与不在树中的顶点且权重最小的边加入到树中。

Prim算法的切分规则:把最小生成树中的顶点看做是一个集合,把不在最小生成树中的顶点看做是另外一个集合。

数据结构与算法(十一)图的进阶

Prim算法的API设计

类名PrimMST
构造方法PrimMST(EdgeWeightedGraph g):根据一幅加权无向图,创建最小生成树计算对象
成员方法private void visit(EdgeWeightedGraph g, int v):将顶点v添加到最小生成树中,并且更新数据public Queue<Edge> edges():获取最小生成树的所有边
成员变量private Edge[] edgeTo:索引代表顶点,值表示当前顶点和最小生成树之间的最短边private double[] distTo:索引代表顶点,值表示当前顶点和最小生成树之间的最短边的权重private boolean[] marked:索引代表顶点,如果当前顶点已经在树中,则值为true,否则为falseprivate IndexMinPriorityQueue<Edge> pq:存放树中顶点与非树中顶点之间的有效横切边

Prim算法的实现原理

Prim算法始终将图中的顶点切分成两个集合,最小生成树顶点和非最小生成树顶点,通过不断的重复做某些操作,可以逐渐将非最小生成树中的顶点加入到最小生成树中,直到所有的顶点都加入到最小生成树中。

我们在设计API的时候,使用最小索引优先队列存放树中顶点与非树中顶点的有效横切边,那么它是如何表示的呢?

我们可以让最小索引优先队列的索引值表示图的顶点,让最小索引优先队列中的值表示从其他某个顶点到当前顶点的边权重。

数据结构与算法(十一)图的进阶

初始化状态,先默认0是最小生成树中的唯一顶点,其他的顶点都不在最小生成树中,此时横切边就是顶点0的邻接表中0-20-40-60-7这四条边,我们只需要将索引优先队列的2、4、6、7索引处分别存储这些边的权重值就可以表示了。

现在只需要从这四条横切边中找出权重最小的边,然后把对应的顶点加进来即可。

所以找到0-7这条横切边的权重最小,因此把0-7这条边添加进来,此时0和7属于最小生成树的顶点,其他的不属于,现在顶点7的邻接表中的边也成为了横切边,这时需要做两个操作:

  1. 0-7这条边已经不是横切边了,需要让它失效:只需要调用最小索引优先队列的delMin()方法即可完成;
  2. 2和4顶点各有两条连接指向最小生成树,需要只保留一条:

4-7的权重小于0-4的权重,所以保留4-7,调用索引优先队列的change(4, 0.37)即可,

0-2的权重小于2-7的权重,所以保留0-2,不需要做额外操作。

数据结构与算法(十一)图的进阶

我们不断重复上面的动作,就可以把所有的顶点添加到最小生成树中。

代码实现

@Slf4j
public class PrimMST {

    /**
     * 索引代表顶点,值表示当前顶点和最小生成树之间的最短边
     */
    private final Edge[] edgeTo;

    /**
     * 索引代表顶点,值表示当前顶点和最小生成树之间的最短边的权重
     */
    private final double[] distTo;

    /**
     * 索引代表顶点,如果当前顶点已经在树中,则值为true,否则为false
     */
    private final boolean[] marked;

    /**
     * 存放树中顶点与非树中顶点之间的有效横切边
     */
    private final IndexMinPriorityQueue<Double> pq;

    /**
     * 根据一幅加权无向图,创建最小生成树计算对象
     */
    public PrimMST(EdgeWeightedGraph g) {
        this.edgeTo = new Edge[g.v()];
        this.distTo = new double[g.v()];
        // 初始化为无穷大
        Arrays.fill(distTo, Double.POSITIVE_INFINITY);

        this.marked = new boolean[g.v()];
        // 初始化pq
        this.pq = new IndexMinPriorityQueue<>(g.v());

        // 默认让顶点0进入到树中,但是树中只有一个顶点0,因此,顶点0默认没有和其他顶点相连,所以让distTo对应位置处的值存储0.0
        distTo[0] = 0.0;
        pq.add(0, 0.0);
        // 遍历索引最小优先队列,拿到最小和N切边对应的顶点,把该顶点加入到最小生成树
        while (!pq.isEmpty()) {
            visit(g, pq.pop());
        }
    }

    /**
     * 获取最小生成树的所有边
     */
    public Queue<Edge> edges() {
        var edges = new Queue<Edge>();
        // 遍历edgeTo数组,拿到每一条边,如果不为NULL,添加到队列
        for (var i = 0; i < marked.length; i++) {
            if (edgeTo[i] != null) {
                edges.push(edgeTo[i]);
            }
        }
        return edges;
    }

    /**
     * 将顶点v添加到最小生成树中,并且更新数据
     */
    private void visit(EdgeWeightedGraph g, int v) {
        // 把顶点v加入最小生成树
        marked[v] = true;
        for (var edge : g.adj(v)) {
            // 获取e边的另外一个顶点
            var other = edge.other(v);
            // 判断另一个顶点是不是已经在树中,如果在树中,则不处理;不在树中,那么更新数据
            if (marked[other]) {
                continue;
            }
            // 判断边e的权重是否小于从other顶点到树中已经存在的最小边的权重
//            LOGGER.info("edge.weight() < distTo[other]: {}, {},{}", edge.weight(), distTo[other], edge.weight() < distTo[other]);
            if (edge.weight() < distTo[other]) {
                // 更新数据
                edgeTo[other] = edge;
                distTo[other] = edge.weight();
                if (pq.contains(other)) {
                    pq.changeItem(other, edge.weight());
                } else {
                    pq.add(other, edge.weight());
                }
            }
        }
    }
}

测试代码

@Slf4j
class PrimMSTTest {

    @Test
    void test() throws IOException {
        // 准备加权无向图
        var br = new BufferedReader(new InputStreamReader(PrimMSTTest.class.getClassLoader().getResourceAsStream("min_create_tree_test.txt")));

        var total = Integer.parseInt(br.readLine());
        var graph = new EdgeWeightedGraph(total);

        var edgeNumber = Integer.parseInt(br.readLine());
        for (var i = 0; i < edgeNumber; i++) {
            var arr = br.readLine().split(" ");
            var v = Integer.parseInt(arr[0]);
            var w = Integer.parseInt(arr[1]);
            var weight = Double.parseDouble(arr[2]);
//            LOGGER.info("添加加权无向图:{}, {}, {}", v, w, weight);
            graph.addEdge(new Edge(v, w, weight));
        }

        // 创建PrimMST,计算加权无向图的最小生成树
        var primMST = new PrimMST(graph);
        var edges = primMST.edges();

        /*
          1 -> 7 :: 0.19
          0 -> 2 :: 0.26
          2 -> 3 :: 0.17
          4 -> 5 :: 0.35
          5 -> 7 :: 0.28
          6 -> 2 :: 0.4
          0 -> 7 :: 0.16
         */
        for (var edge : edges) {
            var e = edge.either();
            var other = edge.other(e);
            var weight = edge.weight();

            LOGGER.info("{} -> {} :: {}", e, other, weight);
        }
    }

}

运行结果是:

1 -> 7 :: 0.19
0 -> 2 :: 0.26
2 -> 3 :: 0.17
4 -> 5 :: 0.35
5 -> 7 :: 0.28
6 -> 2 :: 0.4
0 -> 7 :: 0.16

用线连起来就是下图

数据结构与算法(十一)图的进阶

kruskal算法

kruskal算法是计算一幅加权无向图的最小生成树的另外一种算法,它的主要思想是按照边的权重(从小到大)处理它们,将边加入最小生成树中,加入的边不会与已经加入最小生成树的边构成环,直到树中含有V-1条边为止。

kruskal算法和Prim算法的区别

Prim算法是一条边一条边的构造最小生成树,每一步都为一棵树添加一条边。

kruskal算法构造最小生成树的时候也是一条边一条边地构造,但它的切分规则是不一样的。它每一次寻找的边会连接一片森林中的两棵树。如果一幅加权无向图由V个顶点组成,初始化情况下每个顶点都构成一棵独立的树,则V个顶点对应V棵树,组成一片森林,kruskal算法每一次处理都会将两棵树合并为一棵树,直到整个森林中只剩一棵树为止。

数据结构与算法(十一)图的进阶

kruskal算法API设计

类名KruskalMST
构造方法KruskalMST(EdgeWeightedGraph g):根据一幅加权无向图,创建最小生成树计算对象
成员方法public Queue<Edge> edges():获取最小生成树的所有边
成员变量private Queue<Edge> mst:保存最小生成树的所有边private UnionFindTreeWeighted uf:索引代表顶点,使用uf.connect(v, w)可以判断顶点v和顶点w是否在同一颗树中,使用uf.union(v, w)可以把顶点v所在的树和顶点w所在的树合并private MinPriorityQueue<Edge> pq:存储图中所有的边,使用最小优先队列,对边按照权重进行排序

kruskal算法的实现原理

在设计API的时候,使用了一个MinPriorityQueue pq存储图中所有的边,每次使用pq.pop()取出权重最小的边,并得到该边关联的两个顶点v和w,通过uf.connect(v, w)判断v和w是否已经连通,如果连通,则证明这两个顶点在同一棵树中,那么就不能再把这条边添加到最小生成树中,因为在一棵树的任意两个顶点上添加一条边,都会形成环,而最小生成树不能有环的存在;如果不连通,则通过uf.connect(v, w)把顶点v所在的树和顶点w所在的树合并成一棵树,并把这条边加入到mst队列中。

这样如果把所有的边处理完,最终mst中存储的就是最小生树的所有边。

数据结构与算法(十一)图的进阶

代码实现

public class KruskalMST {

    /**
     * 保存最小生成树的所有边
     */
    private final Queue<Edge> mst;

    /**
     * 索引代表顶点,使用uf.connect(v, w)可以判断顶点v和顶点w是否在同一颗树中,使用uf.union(v, w)可以把顶点v所在的树和顶点w所在的树合并
     */
    private final UnionFindTreeWeighted uf;

    /**
     * 存储图中所有的边,使用最小优先队列,对边按照权重进行排序
     */
    private final MinPriorityQueue<Edge> pq;

    /**
     * 根据一幅加权无向图,创建最小生成树计算对象
     */
    public KruskalMST(EdgeWeightedGraph g) {
        this.mst = new Queue<>();
        this.uf = new UnionFindTreeWeighted(g.v());
        this.pq = new MinPriorityQueue<>(g.e() + 1);

        // 把图中所有的边存储到pq
        for (var edge : g.edges()) {
            pq.add(edge);
        }

        // 遍历pq,拿到最小权重的边
        while (!pq.isEmpty() && mst.size() < g.v() - 1) { // 小于顶点数量 - 1,证明已经找全了最小生成树的所有边
            // 找到权重最小的边
            var edge = pq.pop();
            // 找到该边的两个顶点
            var v = edge.either();
            var w = edge.other(v);
            // 判断两个顶点是否已经在同一棵树中,如果是,则不处理;否则,合并两个顶点所在的树
            if (uf.connected(v, w)) {
                continue;
            }

            uf.union(v, w);

            // 让边e进入mst队列
            mst.push(edge);
        }
    }

    /**
     * 获取最小生成树的所有边
     */
    public Queue<Edge> edges() {
        return mst;
    }

}

测试代码

@Slf4j
class KruskalMSTTest {

    @Test
    void test() throws IOException {
        // 准备加权无向图
        var br = new BufferedReader(new InputStreamReader(KruskalMSTTest.class.getClassLoader().getResourceAsStream("min_create_tree_test.txt")));

        var total = Integer.parseInt(br.readLine());
        var graph = new EdgeWeightedGraph(total);

        var edgeNumber = Integer.parseInt(br.readLine());
        for (var i = 0; i < edgeNumber; i++) {
            var arr = br.readLine().split(" ");
            var v = Integer.parseInt(arr[0]);
            var w = Integer.parseInt(arr[1]);
            var weight = Double.parseDouble(arr[2]);
//            LOGGER.info("添加加权无向图:{}, {}, {}", v, w, weight);
            graph.addEdge(new Edge(v, w, weight));
        }

        // 创建PrimMST,计算加权无向图的最小生成树
        var kruskalMST = new KruskalMST(graph);
        var edges = kruskalMST.edges();

        /*
            0 -> 7 :: 0.16
            2 -> 3 :: 0.17
            1 -> 7 :: 0.19
            0 -> 2 :: 0.26
            5 -> 7 :: 0.28
            4 -> 5 :: 0.35
            6 -> 2 :: 0.4
         */
        for (var edge : edges) {
            var e = edge.either();
            var other = edge.other(e);
            var weight = edge.weight();

            LOGGER.info("{} -> {} :: {}", e, other, weight);
        }
    }

}

加权有向图

之前学习的加权无向图中,边是没有方向的,并且同一条边会同时出现在该边的两个顶点的邻接表中,为了能够处理含有方向性的图的问题,我们需要实现以下加权有向图。

加权有向图边的表示

API设计

类名DirectedEdge
构造方法DirectedEdge(int v, int w, double weight):通过顶点v和w,以及权重weight值构造一个边对象
成员方法public double weight():获取边的权重值public int from():获取有向边的起点public int to():获取有向边的终点
成员变量private final int v:起点private final int w:终点private final double weight:当前边的权重

代码实现

@RequiredArgsConstructor
public class DirectedEdge {

    /**
     * 起点
     */
    private final int v;

    /**
     * 终点
     */
    private final int w;

    /**
     * 权重
     */
    private final double weight;

    /**
     * 获取边的权重值
     */
    public double weight() {
        return weight;
    }

    /**
     * 获取有向边的起点
     */
    public int from() {
        return v;
    }

    /**
     * 获取有向边的终点
     */
    public int to() {
        return w;
    }
    
}

加权有向图的实现

之前我们已经完成了有向图,在有向图的基础上,我们只需要把边的表示切换成DirectedEdge对象即可。

API设计

类名EdgeWeightedDigraph
构造方法EdgeWeightedDigraph(int v):创建一个含有V个顶点的空加权有向图
成员方法public int v():获取图中顶点的数量public int e():获取图中边的数量public void addEdge(DirectedEdge e):向加权有向图中添加一条边epublic Queue<DirectedEdge> adj(int v):获取由顶点v指出的所有的边public Queue<DirectedEdge> edges():获取加权有向图的所有边
成员变量private final int v:记录顶点数量private int e:记录边数量private Queue<DirectedEdge>[] adj:邻接表

代码实现

public class EdgeWeightedDigraph {

    /**
     * 记录顶点数量
     */
    private final int v;

    /**
     * 记录边数量
     */
    private int e;

    /**
     * 邻接表
     */
    private final Queue<DirectedEdge>[] adj;

    public EdgeWeightedDigraph(int v) {
        this.v = v;
        this.e = 0;
        this.adj = new Queue[v];
        for (int i = 0; i < adj.length; i++) {
            adj[i] = new Queue<>();
        }
    }

    /**
     * 获取图中顶点的数量
     */
    public int v() {
        return v;
    }

    /**
     * 获取图中边的数量
     */
    public int e() {
        return e;
    }

    /**
     * 向加权有向图中添加一条边e
     */
    public void addEdge(DirectedEdge edge) {
        // 因为是有向图,所以只需要让e出现在起点的邻接表即可
        var v = edge.from();
        adj[v].push(edge);
        e++;
    }

    /**
     * 获取由顶点v指出的所有的边
     */
    public Queue<DirectedEdge> adj(int v) {
        return adj[v];
    }

    /**
     * 获取加权有向图的所有边
     */
    public Queue<DirectedEdge> edges() {
        // 遍历图中的每一个顶点,得到该顶点的邻接表,遍历得到每一条边,添加到队列中返回
        var edges = new Queue<DirectedEdge>();
        for (var i = 0; i < v; i++) {
            for (var edge : adj[v]) {
                edges.push(edge);
            }
        }
        return edges;
    }
}

最短路径

有了加权有向图之后,我们立刻就能联想到实际生活中的使用场景。

例如在一幅地图中,找到顶点a与地点b之间的路径,这条路径可以是距离最短,也可以是时间最短,也可以是费用最小等,如果我们把距离/时间/费用 看做是成本,那么就需要找到地点a和地点b之间成本最小的路径,也就是我们接下来要解决的最短路径问题。

最短路径定义及性质

定义

在一幅加权有向图中,从顶点s到顶点t的最短路径是所有从顶点S到顶点T的路径中总权重最小的那条路径。

数据结构与算法(十一)图的进阶

性质

  1. 路径具有方向性
  2. 权重不一定等价于距离。权重可以是距离、时间、花费等内容,权重最小指的是成本最低。
  3. 只考虑连通图。一幅图中并不是所有的顶点都是可达的,如果s和t不可达,那么它们之间也就不存在最短路径,为了简化问题,这里只考虑连通图。
  4. 最短路径不一定是唯一的。从一个顶点到达另外一个顶点的权重最小的路径可能会有很多条,这里只需要找出一条即可。

最短路径树

给定一幅加权有向图和一个顶点s,以s为起点的一棵最短路径树是图的一幅子图,它包含顶点s以及从s可达的所有顶点。这棵有向树的根结点为s,树的每条路径都是有向图中的一条最短路径。

最短路径树API设计

计算最短路径树的经典算法是dijstra算法,为了实现它,先设计如下API

类名DijkstraSP
构造方法public DijkstraSP(EdgeWeightedDigraph g, int s):根据一幅加权有向图G和顶点s,创建一个计算顶点为s的最短路径树对象
成员方法private void relax(EdgeWeightedDigraph g, int v):松弛图G中的顶点vpublic double distTo(int v):获取从顶点s到顶点v的最短路径的总权重public boolean hasPathTo(int v):判断从顶点s到顶点v是否可达public Queue<DirectedEdge> pathTo(int v):查询从起点s到顶点v的最短路径中所有的边
成员变量private DirectedEdge[] edgeTo:索引代表顶点,值表示从顶点s到当前顶点的最短路径上的最后一条边private double[] distTo:索引代表顶点,值从顶点s到当前顶点的最短路径的总权重private IndexMinPriorityQueue<Double> pq:存放树中顶点与非树中顶点之间的有效横切边

松弛技术

松弛这个词来源于生活:一条橡皮筋沿着两个顶点的某条路径紧紧展开,如果这两个顶点之间的路径不止一条,还有存在更短的路径,那么把皮筋转移到更短的路径上,皮筋就可以放松了。

数据结构与算法(十一)图的进阶

松弛这种简单的原理刚好可以用来计算最短路径树。

在我们的API中,需要用到两个成员变量edgeTodistTo,分别存储边和权重。

一开始给定一幅图G和顶点s,我们只知道图的边以及这些边的权重,其他的一无所知,此时初始化顶点s到顶点s的最短路径的总权重disto[s]=0;顶点s到其他顶点的总权重默认为无穷大,随着算法的执行,不断的使用松弛技术处理图的边和顶点,并按一定的条件更新edgeTodistTo中的数据,最终就可以得到最短路径树。

边的松弛

放松边v -> w意味着检查从s到w的最短路径是否先从s到v,然后再从v到w?如果是,则v-w这条边需要加入到最短路径树中,更新edgeTodistTo中的内容:edgeTo[w]=表示v->w这条边的DirectedEdge对象,distTo[w]=distTo[v] + v->w这条边的权重;如果不是,则忽略v->w这条边。

数据结构与算法(十一)图的进阶

顶点的松弛

顶点的松弛是基于边的松弛完成的,只需要把某个顶点指出的所有边松弛,那么该顶点就松弛完毕。例如要松弛顶点v,只需要遍历v的邻接表,把每一条边都松弛,那么顶点v就松弛了。

如果把起点设置为顶点0,那么找出起点0到顶点6的最短路径0 -> 2 -> 7 -> 3 -> 6的过程如下:

数据结构与算法(十一)图的进阶

Dijstra算法实现

Disjstra算法的实现和Prim算法很类似,构造最短路径树的每一步都是向这棵树中添加一条新的边,而这条新的边是有效横切边pq队列中的权重最小的边。

@Slf4j
public class DijkstraSP {

    /**
     * 索引代表顶点,值表示从顶点s到当前顶点的最短路径上的最后一条边
     */
    private final DirectedEdge[] edgeTo;

    /**
     * 索引代表顶点,值从顶点s到当前顶点的最短路径的总权重
     */
    private final double[] distTo;

    /**
     * 存放树中顶点与非树中顶点之间的有效横切边
     */
    private final IndexMinPriorityQueue<Double> pq;

    /**
     * 根据一幅加权有向图G和顶点s,创建一个计算顶点为s的最短路径树对象
     */
    public DijkstraSP(EdgeWeightedDigraph g, int s) {
        this.edgeTo = new DirectedEdge[g.v()];
        this.distTo = new double[g.v()];
        // 初始化为无穷大
        Arrays.fill(distTo, Double.POSITIVE_INFINITY);
        // 创建一个和图的顶点数一样大小的索引优先队列,存储有效横切边
        this.pq = new IndexMinPriorityQueue<>(g.v());

        // 默认让顶点s进入树中,但s顶点目前没有与树中其他的顶点相连接,因此初始化distTo[s]=0.0
        distTo[s] = 0.0;
        pq.add(s, 0.0);

        // 遍历有效边队列
        while (!pq.isEmpty()) {
            // 松弛图G中的顶点
            relax(g, pq.pop());
        }
    }

    /**
     * 获取从顶点s到顶点v的最短路径的总权重
     */
    public double distTo(int v) {
        return distTo[v];
    }

    /**
     * 判断从顶点s到顶点v是否可达
     */
    public boolean hasPathTo(int v) {
        return distTo[v] < Double.POSITIVE_INFINITY;
    }

    /**
     * 查询从起点s到顶点v的最短路径中所有的边
     */
    public Queue<DirectedEdge> pathTo(int v) {
        // 判断从起点s到顶点v是否可达
        if (!hasPathTo(v)) {
            return null;
        }
        var edges = new Queue<DirectedEdge>();
        // 从顶点逆推,得到每一条边
        while (true) {
            var e = edgeTo[v];
            if (e == null) {
                break;
            }
            edges.push(e);
            // 变换为e的起点
            v = e.from();
        }
        return edges;
    }

    /**
     * 松弛图G中的顶点v
     */
    private void relax(EdgeWeightedDigraph g, int v) {
        // 松弛顶点v就是松弛顶点v邻接表中的每一条边,遍历邻接表
        for (var edge : g.adj(v)) {
            // 获取该边的终点
            var w = edge.to();
            // 通过松弛技术,判断从起点s到顶点w的最短路径是否需要先从顶点s到顶点v,然后再由顶点v到顶点w
            var weight = distTo[v] + edge.weight();
//            LOGGER.info("{} {} -> {} :: {} {}", v, edge.from(), edge.to(), weight, weight < distTo[w]);
            if (weight < distTo[w]) {
                distTo[w] = weight;
                edgeTo[w] = edge;

                // 如果顶点w已经存在于优先队列pq中,则重置顶点w的权重
                if (pq.contains(w)) {
                    pq.changeItem(w, weight);
                } else {
                    // 如果顶点w没有出现在优先队列pq中,则把顶点w及其权重加入到pq中
                    pq.add(w, weight);
                }
            }
        }
    }

}

测试代码

@Slf4j
class DijkstraSPTest {

    @Test
    void testDijkstraSP() throws IOException {
        var br = new BufferedReader(new InputStreamReader(DijkstraSPTest.class.getClassLoader().getResourceAsStream("min_route_test.txt")));
        var total = Integer.parseInt(br.readLine());

        var graph = new EdgeWeightedDigraph(total);

        var edgeNumber = Integer.parseInt(br.readLine());
        for (var i = 0; i < edgeNumber; i++) {
            var arr = br.readLine().split(" ");
            graph.addEdge(new DirectedEdge(Integer.parseInt(arr[0]), Integer.parseInt(arr[1]), Double.parseDouble(arr[2])));
        }

        var dijkstraSP = new DijkstraSP(graph, 0);

        // 查找最短路径树
        var edges = dijkstraSP.pathTo(6);
        /*
        3 -> 6 ::0.52
        7 -> 3 ::0.39
        2 -> 7 ::0.34
        0 -> 2 ::0.26
         */
        for (var edge : edges) {
            LOGGER.info("{} -> {} ::{}", edge.from(), edge.to(), edge.weight());
        }
    }

}