ローリングハッシュ法でご丁寧にmodを取っていると時々TLEする

概要

内容

  • 2つの互いに素な数をB, MとしてBの(係数つき)べき乗の和をmod Mしてハッシュを取る
  • M=2^64 としてunsigned intで計算してオーバーフロー前提で計算すると速い
  • Rustだとリリースビルド以外は普通オーバーフローはpanicなので丁寧に %M していこうかなと思った
    • これが結構遅くて時々TLEするくらい
    • 文字が u8 であることを前提に省略できる %M を省略して、前処理できるものを関数から逃がすとなんとか通る
  • オーバーフロー許容構造体の Wrapping で包んで M=2^64 として書くのが良さそう

ご丁寧版(TLE)

yukicoder.me

pub fn search_rh(base: &[u8], key: &[u8]) -> Vec<usize> {
    const B: i64 = 9973;
    const M: i64 = 1_000_000_007;
    let key_len = key.len();
    let base_len = base.len();
    if key_len > base_len {
        return vec![];
    }
    let mut t = 1i64;
    for _ in 0..key_len {
        t *= B;
        t %= M;
    }
    let mut key_h = 0;
    let mut base_h = 0;
    for i in 0..key_len {
        key_h = (key_h * B % M + key[i] as i64) % M;
        base_h = (base_h * B % M + base[i] as i64) % M;
    }
    let mut ret = vec![];
    {
        let mut i = 0;
        while i + key_len <= base_len {
            if key_h == base_h {
                ret.push(i);
            }
            if i + key_len < base_len {
                let p = base_h * B;
                let q = base[i + key_len] as i64;
                let r = base[i] as i64 * t;
                let mut z = (p + q - r) % M;
                if z < 0 {
                    z += M;
                }
                base_h = z;
            }
            i += 1;
        }
    }
    ret
}

Wrappingに加えて少し抽象化したもの(AC)

yukicoder.me

pub fn search_rh<T: Into<u64> + std::clone::Clone>(base: &[T], key: &[T]) -> Vec<usize> {
    use std::num::Wrapping;
    const B: Wrapping<u64> = Wrapping(1_000_000_007u64);
    let key_len = key.len();
    let base_len = base.len();
    if key_len > base_len {
        return vec![];
    }
    let mut t = Wrapping(1u64);
    for _ in 0..key_len {
        t *= B;
    }
    let mut key_h = Wrapping(0u64);
    let mut base_h = Wrapping(0u64);
    for i in 0..key_len {
        key_h = key_h * B + Wrapping(key[i].clone().into());
        base_h = base_h * B + Wrapping(base[i].clone().into());
    }
    let mut ret = vec![];
    {
        let mut i = 0;
        while i + key_len <= base_len {
            if key_h == base_h {
                ret.push(i);
            }
            if i + key_len < base_len {
                base_h = base_h * B + Wrapping(base[i + key_len].clone().into())
                    - Wrapping(base[i].clone().into()) * t;
            }
            i += 1;
        }
    }
    ret
}