淘先锋技术网

首页 1 2 3 4 5 6 7

看了许久的kmp,知其然也不知其所以然就很难受…
对于失败函数来说,就是遍历每一个字符j,让以j为结尾的后缀字符串等于以0开始的前缀字符串的最长的长度 例如abcabmgk,j=4时候,最后的ab=最前的ab,所以 f(4)=2
那么这个失败函数有什么用呢,我们知道朴素的算法来说,待匹配串需要模式串去一个一个的用模式串的首字母去对齐待匹配串的每一个字母,但引入失败函数后我们能做的就是通过查找现在匹配失败的元素的前一个元素g 的 f[j-1],然后就把模式串的前缀和g一样的抽过来对齐

abcdabcgghaghfjahllna       
abcdabcacab

我们发现g(斜体)和a不匹配,前面的是匹配的,如果按传统算法需要把下面的串移动很多次
才能让真正可能的让下面的abc匹配上上面的abc,但是如果知道了a前的f[c]=3,就能知道这个以c结尾的长度为3的串和一开始长度为3的那个字串一样,那么就把一样的对齐

abcdabcgghaghfjahllna
    abcdabcacab`

然后下一步发现d和g不一样,所以看d的前一个字符c ,f[c]=0,所以没有什么可能的一样的前缀,就用下面第一个字符a去匹配第一个失败点
abcdabcgghaghfjahllna
abcdabcacab`