博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
AC自动机模板
阅读量:6207 次
发布时间:2019-06-21

本文共 4830 字,大约阅读时间需要 16 分钟。

AC自动机原理:

摘自,ORZ大牛

一:构建AC自动机

  同样我也用网上的经典例子,现有say she shr he her 这样5个模式串,主串为yasherhs,我要做的就是哪些模式串在主串中出现过?

1: 构建trie树

    如果看过我前面的文章,构建trie树还是很容易的。

2:失败指针

    构建失败指针是AC自动机的核心所在,玩转了它也就玩转了AC自动机,失败指针非常类似于KMP中的next数组,也就是说,

 当我的主串在trie树中进行匹配的时候,如果当前节点不能再继续进行匹配,那么我们就会走到当前节点的failNode节点继续进行

匹配,构建failnode节点也是很流程化的。

①:root节点的子节点的failnode都是指向root。

②:当走到在“she”中的”h“节点时,我们给它的failnode设置什么呢?此时就要走该节点(h)的父节点(s)的失败指针,一直回溯直

     到找到某个节点的孩子节点也是当初节点同样的字符(h),没有找到的话,其失败指针就指向root。

     比如:h节点的父节点为s,s的failnode节点为root,走到root后继续寻找子节点为h的节点,恰好我们找到了,(假如还是没

             有找到,则继续走该节点的failnode,嘿嘿,是不是很像一种回溯查找),此时就将 ”she"中的“h”节点的fainode"指向

            "her"中的“h”节点,好,原理其实就是这样。(看看你的想法是不是跟图一样)

针对图中红线的”h,e“这两个节点,我们想起了什么呢?对”her“中的”e“来说,e到root距离的n个字符恰好与”she“中的e向上的n

个字符相等,我也非常类似于kmp中next函数,当字符失配时,next数组中记录着下一次匹配时模式串的起始位置。

动态模板:

char a[1000001],p[55];struct Trie{    Trie *child[26];    Trie *fail; //失败指针    //int num;    int cnt; //由于同一单词可能出现多次。。。    Trie()    {        //num=0;        cnt=0;        fail=0;        memset(child,0,sizeof(child));    }};Trie *root,*s,*lrelia;void Create(char *str){    s=root;    int i=0;    while(str[i])    {        int id=str[i]-'a';        if(s->child[id]==0)        {            s->child[id]=new Trie;        }            s=s->child[id];        i++;    }    s->cnt++;}void makeFail() //一个节点一个节点找fail指针{    Trie *front ;      queue
q ; q.push(root) ; while(!q.empty()){ front = q.front() ; q.pop() ; for(int i = 0;i < 26;i++){ if(front->child[i] != NULL){ //父结点有孩子i,则找孩子i的fail指针 if(front == root) front->child[i]->fail = root ;//与根结点相连的结点的fail指针都指向根结点 else{ Trie *temp = front ; while(temp->fail != NULL){ //父结点fail指针非空 if(temp->fail->child[i] != NULL){ //父结点fail指针指向的结点有孩子i front->child[i]->fail = temp->fail->child[i] ; break ; } temp = temp->fail ;//父结点向上转移 } if(temp->fail == NULL) front->child[i]->fail = root ; } q.push(front->child[i]) ;//找到孩子i的fail指针后将孩子i加入队列 } } } }int search(char *str){ Trie *p = root ; Trie *temp = NULL ; int i=0,k,ans = 0 ; while(str[i]){ k=str[i] - 'a' ; while(p != root && p->child[k] == NULL){ p = p->fail ; } if(p->child[k] != NULL){
//p记录当前位置最长的后缀匹配,下次从该支继续匹配 p = p->child[k] ; temp = p ; //用temp继续找当前位置较短的后缀匹配 while(temp != root && temp->cnt!=0){ ans +=temp->cnt; temp->cnt = 0 ; temp = temp->fail ; } } i++; } return ans; }

 

静态模板:

struct Trie{    int child[26];    int cnt;    int fail;    Trie()    {      cnt=0;      fail=-1;      memset(child,0,sizeof(child));    }    void set()    {        cnt=0;        fail=-1;        memset(child,0,sizeof(child));    }}t[240005];int p;void Create(char *s){    int root=0,i=0,id;    while(s[i])    {        id=s[i]-'a';        if(t[root].child[id]==0)            t[root].child[id]=p++;        root=t[root].child[id];        i++;    }    t[root].cnt++;}void makeFail() //构造Fail指针{    queue
q; int root=0,front; q.push(root); while(!q.empty()) { front=q.front(); q.pop(); for(int i=0;i<26;++i) { if(t[front].child[i]!=0) { if(front==root) t[t[front].child[i]].fail=root; else { int temp=front; while(t[temp].fail!=-1) { if(t[t[temp].fail].child[i]!=0) { t[t[front].child[i]].fail=t[t[temp].fail].child[i]; break; } temp=t[temp].fail; } if(t[temp].fail==-1) //fail当然有可能等于0咯 t[t[front].child[i]].fail=0; } q.push(t[front].child[i]); } } }}int Search(char *s) //查找字符串{ int p=0,temp=0; int i=0,k,ans=0; while(s[i]) { k=s[i]-'a'; while(p!=0&&t[p].child[k]==0) p=t[p].fail; if(t[p].child[k]!=0) { p=t[p].child[k]; temp=p; while(temp!=0&&t[temp].cnt!=0) { ans+=t[temp].cnt; t[temp].cnt=0; temp=t[temp].fail; } } i++; } return ans;}

使用完静态模板后,记得重新初始化t结构数组

转载于:https://www.cnblogs.com/A-way/archive/2013/05/17/3084457.html

你可能感兴趣的文章
如何构建Win32汇编的编程环境(ONEPROBLEM个人推荐)
查看>>
Flymeos插桩适配教程
查看>>
还在用PS磨皮去皱?看看如何用神经网络高度还原你的年轻容貌!
查看>>
大端模式与小端模式、网络字节顺序与主机字节顺序
查看>>
微信支付申请90%的商户都卡在这儿了,申请微信支付,商户功能设置详细说明...
查看>>
高仿Instagram 页面效果android特效
查看>>
我的友情链接
查看>>
如何查找JSP页面中的错误
查看>>
2016 年总结
查看>>
将String转化成Stream,将Stream转换成String
查看>>
java路径Java开发中获得非Web项目的当前项目路径
查看>>
Google API设计指南-资源名称
查看>>
最全React技术栈技术资料汇总(收藏)
查看>>
【工具使用系列】关于 MATLAB 遗传算法与直接搜索工具箱,你需要知道的事
查看>>
Kali-linux Arpspoof工具
查看>>
PDF文档页面如何重新排版?
查看>>
基于http协议使用protobuf进行前后端交互
查看>>
UML设计一个电影票务销售系统(四)
查看>>
AlphaGo Zero用它来调参?【高斯过程】到底有何过人之处?
查看>>
Linux平台Oracle多个实例启动说明
查看>>