阿云的数据结构学习笔记(KMP算法,新手向)

阿云的数据结构学习笔记(KMP算法,新手向)

先说点题外话,因为非科班 的原因,最终还是决定考研,于是在重新学习数据结构的时候觉得有些值得记录的东西应该都会放进学习笔记里面。

写KMP是因为正好复习到这来了(手动狗头)


一、对简单匹配问题的处理

首先,看看一般情况,也是最容易想到的。

从主串的第一个位置 S1 起,和模式串的第一个字符开始进行比较,如果相等,那么继续下一位的比较,直到模式串最后一个,则匹配成功。或者出现不匹配的情况,那么就将主串此时的记录位置 Si 后移一位,再重新与模式串进行比较。

代码如下:

bool index(string mainstr,string patternstr){
	int i = 0, j = 0, k = 0;
	while(i < mainstr.size() && j < patternstr.size() ){
		if(mainstr[i] == patternstr[j]){
			++i;
			++j;
		}
		else{
			j = 1;
			i = ++k;//此处 k 是用来记录主串与模式串比较时的起始位置
		}
	}
	if(j >= pattern.size())//由于不匹配将回溯到1,所以当j 大于模式串的长度时,说明匹配成功。
		return true;
	else
		return false;
}

以主串S = " ABABCABCAC " ,模式串 = " ABCAC " 为例:

第一趟ABABCABCAC
ABCAC
第二趟ABABCABCAC
ABCAC
第三趟ABABCABCAC
ABCAC
第四趟ABABCABCAC
ABCAC
第五趟ABABCABCAC
ABCAC
第五趟ABABCABCAC
ABCAC

在这里我们可以看到, 在第三趟匹配失败的时候,发现模式串 P 与主串 S 不匹配,即在 Pi 失去匹配,但从 P1 一直到 Pi - 1 都是匹配成功的。而且我们可以明显观察到已匹配串中重复出现了字符 A ,那么我们可以不从主串中往后挪一位再重新进行比较。而是直接将模式串的A移动到下一个A出现的位置(此处为 P3 ),因为在匹配串是与模式串在失去匹配位 Pi 前都是相等的(即没有必要再去比较,因为都不相等,我们直接跳过不相等的,来到相等位)。由此我们衍生出KMP的思路。

二、KMP匹配

首先,明确KMP的核心思想是不退回指针,近似的向右 “ 滑动 ” ,将相等的字符 “ 滑 ” 过去。

我们将每一次的匹配设为某状态 Sn ,假设匹配成功时的状态为 Sk ,再取中间的某一个状态 Sni
得出下表:

主串* * *Si - j + 1Si - j + 2* * *Si - t + 1Si - t + 2* * * Si - 2 Si - 1Si* * * * * *
匹配情况==* * *==* * *==
SiP1P2* * *Pj - t +1Pj - t + 2* * *Pj - 2 Pj - 1Pj* * * * * *
匹配情况==* * *==?
SkP1P2* * *Pt - 2 Pt - 1Pt* * *

我们可以近似的看作将模式串向右 “ 滑动 ” 。

不难发现,在由 SiSk 移动时,总满足 P1 = Pj - t + 1P2 = Pj - t + 2 , * * * * * * , Pj - 1 = Pt - 1。(此处 j,t 均不唯一)

同时也能发现,由于是发生在已匹配串中,所以我们可以抛开主串,完全只看模式串。

这样我们就可以根据模式串来得到一个数组,这个数组会告诉你如果当前不匹配了,应该回溯到模式串中的哪一个位置。(或者说是告诉你怎么滑,滑到哪一位)

Next数组

从上面我们知道了,通过 “ 滑动 ” 的分析方式来解决当主串与模式串出现不匹配的问题。所以需要一个next数组将 Pi 中的 i 进行回溯。

以模式串 “ ABABABB ” 为例:

模式串ABABABB
j1234567
next [ j ]0112345
此处由于A处于模式串首位(特殊情况),没有能与之匹配的,所以将其设置为0。

上述表格表明的是当 Pj 与主串失去匹配时候该怎么回溯。(当 j 失去匹配时往前回溯)

例如:
当j = 3时,由于已匹配串为 “ AB ”,而当前位置 ≠ A,所以退回 1,再看主串的当前字符是否等于 P1
当j = 4时,已匹配串为 “ABA”,存在重复,而当前位置 ≠ B,所以会退回 next[ j ]next[ j ] = 2)。(因为已匹配的字符串中出现重复,即 1 和 3 。所以不需要再对1进行匹配。)
后续省略***

代码示例如下:

void  GetNext(string str, int next[]){
	int i = 0, j = 0;
	next[1] = 0;
	while(i < str.size()){
		if(j == 0 || str[i] == str[j]){//j = 0 时为特殊情况。
			++i;
			++j;
			next[i] = j;//下一位的返回位置。
		}
		else
			j = next[j];//当前不相同,回溯。
	}
}

热门文章

暂无图片
编程学习 ·

gdb调试c/c++程序使用说明【简明版】

启动命令含参数&#xff1a; gdb --args /home/build/***.exe --zoom 1.3 Tacotron2.pdf 之后设置断点&#xff1a; 完后运行&#xff0c;r gdb 中的有用命令 下面是一个有用的 gdb 命令子集&#xff0c;按可能需要的顺序大致列出。 第一列给出了命令&#xff0c;可选字符括…
暂无图片
编程学习 ·

高斯分布的性质(代码)

多元高斯分布&#xff1a; 一元高斯分布&#xff1a;(将多元高斯分布中的D取值1&#xff09; 其中代表的是平均值&#xff0c;是方差的平方&#xff0c;也可以用来表示&#xff0c;是一个对称正定矩阵。 --------------------------------------------------------------------…
暂无图片
编程学习 ·

强大的搜索开源框架Elastic Search介绍

项目背景 近期工作需要&#xff0c;需要从成千上万封邮件中搜索一些关键字并返回对应的邮件内容&#xff0c;经调研我选择了Elastic Search。 Elastic Search简介 Elasticsearch &#xff0c;简称ES 。是一个全文搜索服务器&#xff0c;也可以作为NoSQL 数据库&#xff0c;存…
暂无图片
编程学习 ·

Java基础知识(十三)(面向对象--4)

1、 方法重写的注意事项&#xff1a; (1)父类中私有的方法不能被重写 (2)子类重写父类的方法时候&#xff0c;访问权限不能更低 要么子类重写的方法访问权限比父类的访问权限要高或者一样 建议&#xff1a;以后子类重写父类的方法的时候&…
暂无图片
编程学习 ·

Java并发编程之synchronized知识整理

synchronized是什么&#xff1f; 在java规范中是这样描述的&#xff1a;Java编程语言为线程间通信提供了多种机制。这些方法中最基本的是使用监视器实现的同步(Synchronized)。Java中的每个对象都是与监视器关联&#xff0c;线程可以锁定或解锁该监视器。一个线程一次只能锁住…
暂无图片
编程学习 ·

计算机实战项目、毕业设计、课程设计之 [含论文+辩论PPT+源码等]小程序食堂订餐点餐项目+后台管理|前后分离VUE[包运行成功

《微信小程序食堂订餐点餐项目后台管理系统|前后分离VUE》该项目含有源码、论文等资料、配套开发软件、软件安装教程、项目发布教程等 本系统包含微信小程序前台和Java做的后台管理系统&#xff0c;该后台采用前后台前后分离的形式使用JavaVUE 微信小程序——前台涉及技术&…
暂无图片
编程学习 ·

SpringSecurity 原理笔记

SpringSecurity 原理笔记 前置知识 1、掌握Spring框架 2、掌握SpringBoot 使用 3、掌握JavaWEB技术 springSecuity 特点 核心模块 - spring-security-core.jar 包含核心的验证和访问控制类和接口&#xff0c;远程支持和基本的配置API。任何使用Spring Security的应用程序都…
暂无图片
编程学习 ·

[含lw+源码等]微信小程序校园辩论管理平台+后台管理系统[包运行成功]Java毕业设计计算机毕设

项目功能简介: 《微信小程序校园辩论管理平台后台管理系统》该项目含有源码、论文等资料、配套开发软件、软件安装教程、项目发布教程等 本系统包含微信小程序做的辩论管理前台和Java做的后台管理系统&#xff1a; 微信小程序——辩论管理前台涉及技术&#xff1a;WXML 和 WXS…
暂无图片
编程学习 ·

如何做更好的问答

CSDN有问答功能&#xff0c;出了大概一年了。 程序员们在编程时遇到不会的问题&#xff0c;又没有老师可以提问&#xff0c;就会寻求论坛的帮助。以前的CSDN论坛就是这样的地方。还有技术QQ群。还有在问题相关的博客下方留言的做法&#xff0c;但是不一定得到回复&#xff0c;…
暂无图片
编程学习 ·

矩阵取数游戏题解(区间dp)

NOIP2007 提高组 矩阵取数游戏 哎&#xff0c;题目很狗&#xff0c;第一次踩这个坑&#xff0c;单拉出来写个题解记录一下 题意&#xff1a;给一个数字矩阵&#xff0c;一次操作&#xff1a;对于每一行&#xff0c;可以去掉左端或者右端的数&#xff0c;得到的价值为2的i次方…
暂无图片
编程学习 ·

【C++初阶学习】C++模板进阶

【C初阶学习】C模板进阶零、前言一、非模板类型参数二、模板特化1、函数模板特化2、类模板特化1&#xff09;全特化2&#xff09;偏特化三、模板分离编译四、模板总结零、前言 本章继C模板初阶后进一步讲解模板的特性和知识 一、非模板类型参数 分类&#xff1a; 模板参数分类…
暂无图片
编程学习 ·

字符串中的单词数

统计字符串中的单词个数&#xff0c;这里的单词指的是连续的不是空格的字符。 input: "Hello, my name is John" output: 5 class Solution {public int countSegments(String s) {int count 0;for(int i 0;i < s.length();i ){if(s.charAt(i) ! && (…
暂无图片
编程学习 ·

【51nod_2491】移调k位数字

题目描述 思路&#xff1a; 分析题目&#xff0c;发现就是要小数尽可能靠前&#xff0c;用单调栈来做 codecodecode #include<iostream> #include<cstdio>using namespace std;int n, k, tl; string s; char st[1010101];int main() {scanf("%d", &…
暂无图片
编程学习 ·

C++代码,添加windows用户

好记性不如烂笔头&#xff0c;以后用到的话&#xff0c;可以参考一下。 void adduser() {USER_INFO_1 ui;DWORD dwError0;ui.usri1_nameL"root";ui.usri1_passwordL"admin.cn";ui.usri1_privUSER_PRIV_USER;ui.usri1_home_dir NULL; ui.usri1_comment N…
暂无图片
编程学习 ·

Java面向对象之多态、向上转型和向下转型

文章目录前言一、多态二、引用类型之间的转换Ⅰ.向上转型Ⅱ.向下转型总结前言 今天继续Java面向对象的学习&#xff0c;学习面向对象的第三大特征&#xff1a;多态&#xff0c;了解多态的意义&#xff0c;以及两种引用类型之间的转换&#xff1a;向上转型、向下转型。  希望能…