`
kmplayer
  • 浏览: 497239 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

BM算法.

阅读更多
1,BM算法是Boyer-Moore算法的简称,由Boyer 和Moore提出.

2,BM算法也是一种快速串匹配算法,BM算法与KMP算法的主要区别是匹配操作的方向不同。虽然BM算法仅把匹配操作的字符比较顺序改为从右向左,但匹配发生失败时,模式T右移的计算方法却发生了较大的变化.

3,滑动距离函数:
为方便讨论,BM算法的关键是,对给定的模式T="t0t1…tm"定义一个从字符到正整数的映射:
dist :c->{1,2,…,m+1}
函数dist称为滑动距离函数,它给出了正文中可能出现的任意字符在模式中的位置。函数dist定义如下:
dist(c) = m-j  j为c在模式中的下标,以后面的为准
dist(c) = m+1  若c不在模式中或c = tm
例如,T="pattern",则dist(p)= 6 – 0 = 6, dist(a)= 6 – 1 =5, dist(t)= 6 – 3 =3,dist(e)= 2, dist(r)= 1, dist(n)= 6 + 1 = 7。

4,BM算法的基本思想是:假设将主串中自位置i起往左的一个子串与模式进行从右到左的匹配过程中,若发现不匹配,则下次应从主串的i + dist(si)位置开始重新进行新一轮的匹配,其效果相当于把模式和主串向右滑过一段距离dist(si),即跳过dist(si)个字符而无需进行比较。
一个具体的例子,如下图所示:



5,实例代码:
#include <iostream>
#include <cstring>
using namespace std;

int Dist(char *t,char ch)
{
    int len = strlen(t);
    int i = len - 1;
    if(ch == t[i])
      return len;
    i--;
    while(i >= 0)
    {
      if(ch == t[i])
         return len - 1 - i;
      else
         i--;
    }
    return len;
}

int BM(char *s,char *t)
{
    int n = strlen(s);
    int m = strlen(t);
    int i = m-1;
    int j = m-1;
    while(j>=0 && i<n)
    {
    if(s[i] == t[j])
    {
        i--;
        j--;
    }
    else
    {
        i += Dist(t,s[i]);
        j = m-1;
    }
    }
    if(j < 0)
    {
        return i+1;
    }
    return -1;
}

int main()
{
    char p1[]="abcdfedcbf";
    char p2[]="cdfe";
    cout<<BM(p1,p2);
    return 0;
}

  • 大小: 20.2 KB
分享到:
评论
2 楼 jkxydp 2013-05-13  
算法运行的结果根本就不对。
1 楼 zhangning290 2011-04-04  
楼主好像只考虑了坏字符规则,。没有考虑好后缀

相关推荐

Global site tag (gtag.js) - Google Analytics