字符串匹配——KMP

    技术2022-07-11  91

    最大公共前后缀

    前缀:必须包含第一个元素但不能包含最后一个; 后缀:必须包含最后一个元素但不能包含第一个; (1)最大公共前后缀:满足前缀和后缀长度和元素对应相等条件下长度最长的前后缀; (2) n e x t [ i ] next[i] next[i]:字符串中以 i i i为结尾的那段所拥有的最大公共前后缀的长度,根据前后缀定义当只有一个元素时 n e x t next next数组值为0;

    题目(来自AcWing上的一道KMP模板题)

    给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。 模板串P在模式串S中多次作为子串出现。 求出模板串P在模式串S中所有出现的位置的起始下标。

    输入格式: 第一行输入整数N,表示字符串P的长度。 第二行输入字符串P。 第三行输入整数M,表示字符串S的长度。 第四行输入字符串S。

    输出格式: 共一行,输出所有出现位置的起始下标(下标从0开始计数),整数之间用空格隔开。

    数据范围: 1≤N≤105 1≤M≤106

    输入样例: 3 aba 5 ababa 输出样例: 0 2

    思路

    求next数组的过程就是相当于把模板串也当成一个主串,然后求模板串和这个时候主串对应的匹配关系,如果匹配了,主串中对应的下标i对应到模板串中的 j + 1 j+1 j+1,就相当于滑动之后可以直接从 j + 1 j+1 j+1开始进行匹配。

    j = n e [ j ] j=ne[j] j=ne[j]:当模板串和主串不匹配时(此时主串下标为 i i i,模板串下标为 j j j,比较的是 s [ i ] s[i] s[i] p [ j + 1 ] p[j+1] p[j+1]),j往回跳再次进行匹配。

    #include <iostream> using namespace std; const int N = 1e6 + 10; int n, m, ne[N]; char s[N], p[N]; int main(){ cin >> m >> p + 1 >> n >> s + 1;//模式串和模板串均从1开始遍历比较方便 //求next数组(此时p既是模板串又是模式串) for(int i = 2, j = 0; i <= m; i++){ while(j && p[i] != p[j + 1]) j = ne[j];//当匹配不成功时j往前跳 if(p[i] == p[j + 1]) j++; ne[i] = j; } //模板串和主串进行匹配 for(int i = 1, j = 0; i <= n; i++){ while(j && s[i] != p[j + 1]) j = ne[j];//这里匹配时用p[j + 1]是因为j从0开始但是模板串从1开始 if(s[i] == p[j + 1]) j++; if(j == m) cout << i - m << " "; } return 0; }
    Processed: 0.010, SQL: 9