Weighted-DSU

Weighted Disjoint Set Union

Created: 2023-05-23
Updated: 2024-07-19

概要

Disjoint Set Union (別名 union find) に重みの概念を取り入れたデータ構造。 通常の union find はただのグループ分けだが、重み付きの union find は連結判定だけでなく、各ノードの重みの差が適しているか否かも求めることが出来る。 雑に書くと、1 クエリ当たり O(logN) だが、AtCoder Library の DSU を参考に作成しているため経路圧縮がされていて高速で、均し計算量が O(α(n)) (α(n) : アッカーマン関数の逆関数)で抑えられる。

union find に関しては下記を参照。

Union-Find とは | アルゴ式(beta)

union find の計算量に関しては下記を参照。

Union Find の計算量の話 - Qiita

method

  • merge(a, b, w) : ノード a, b 間の重みが w であるとしてノードを結合する
  • same(a, b) : ノード a, b が同じ連結成分に存在するか否かを返す
  • leader(a) : ノード a が存在する連結成分の一番の親要素を返す
  • size(a) : ノード a が存在する連結成分のサイズを返す
  • weight(a) : ノード a の重みを返す
  • diff(a, b) : ノード a, b の重みの差分を返す
  • groups() : 各連結成分を 1 つの配列としてまとめた二次元配列を返す

Program

struct weighted_dsu {
    // ACLよりUF写経
    public:
    // expricit:コンストラクタに付与で暗黙の型変換無向化
    weighted_dsu() : _n(0) {}
    explicit weighted_dsu(int n) : _n(n), parent_or_size(n, -1), diff_weight(n,0) {}

    int merge(int a, int b, ll w) {
        assert(0 <= a && a < _n);
        assert(0 <= b && b < _n);

        // weight[b] = weight[a] + w となるようにmerge
        // ※ 連結成分のmergeだから weightの差分が重みに反映
        w += weight(a); w -= weight(b);

        int x = leader(a), y = leader(b);
        if (x == y) return x;
        if (-parent_or_size[x] < -parent_or_size[y]) std::swap(x, y), w = -w;
        parent_or_size[x] += parent_or_size[y];
        parent_or_size[y] = x;

        diff_weight[y] = w;

        // 連結成分が大きい方のleaderが返り値
        return x;
    }

    bool same(int a, int b) {
        assert(0 <= a && a < _n);
        assert(0 <= b && b < _n);
        return leader(a) == leader(b);
    }

    // 親ノードに行くまでがO(α(n))
    int leader(int a) {
        assert(0 <= a && a < _n);
        if (parent_or_size[a] < 0) return a;
        int r = leader(parent_or_size[a]);
        diff_weight[a] += diff_weight[parent_or_size[a]];
        return parent_or_size[a] = r;
    }

    int size(int a) {
        assert(0 <= a && a < _n);
        return -parent_or_size[leader(a)];
    }

    int weight(ll x){
        leader(x); // 経路圧縮 ( diffを現在の状態に反映 )
        return diff_weight[x];
    }

    int diff(ll x, ll y){
        return weight(y)-weight(x);
    }

    std::vector<std::vector<int>> groups() {
        std::vector<int> leader_buf(_n), group_size(_n);
        for (int i = 0; i < _n; i++) {
            leader_buf[i] = leader(i);
            group_size[leader_buf[i]]++;
        }
        std::vector<std::vector<int>> result(_n);
        for (int i = 0; i < _n; i++) {
            result[i].reserve(group_size[i]);
        }
        for (int i = 0; i < _n; i++) {
            result[leader_buf[i]].push_back(i);
        }
        result.erase(
            std::remove_if(result.begin(), result.end(),
                          [&](const std::vector<int>& v) { return v.empty(); }),
            result.end());
        return result;
    }

    private:
    int _n;
    // root node: -1 * component size
    // otherwise: parent
    std::vector<int> parent_or_size;
    std::vector<ll> diff_weight;
};