串的模式匹配(简单匹配、KMP以及手工算next/nextval)

简单模式匹配

        思路:主串和字串进行匹配,设置i、j、k(主串、子串和匹配起始下标)主串和子串一开始都是从第一个位置(k = i),若当前主串和子串匹配成功那么i++、j++,若匹配不成功k++、j = 1,i = k(主串从上次匹配的下一个开始,子串回到第一个字符)重复以上步骤。若是匹配成功,则返回子串在主串中的位置(k),若是匹配不成功,则返回一个可以区别于主串所有标记的位置,比如 0.

#include<iostream>
#include<string>
using namespace std;
/*
思路:主串和字串进行匹配,设置i、j、k(主串、子串和匹配起始下标)
主串和子串一开始都是从第一个位置(k = i),若当前主串和子串匹配成功那么i++、j++,
若匹配不成功k++、j = 1,i = k(主串从上次匹配的下一个开始,子串回到第一个字符)
重复以上步骤。若是匹配成功,则返回子串在主串中的位置(k),若是匹配不成功,
则返回一个可以区别于主串所有标记的位置,比如 0.
*/
int index(string str, string substr) {int i = 1, j = 1, k = i; // 这里规定字符串从第一个开始,比较好操作if (str.length() == 1 || substr.length() == 1) return 0;// 主串或者子串为空的情况下while (i < str.length() && j < substr.length()) { // i,j都没有遍历到结尾if (str[i] == str[j]) { // 若匹配i++;j++;}else { // 若不匹配k++;j = 1;i = k;}}if (j > substr.length()) { // 匹配成功return k;}return 0;
}

KMP匹配

简单匹配的缺点

        KMP与简单匹配的区别在于如何利用已知且匹配好的模式串,简单匹配每当匹配到不匹配的位置时一律将 i 赋值为 i - j + 2 ,j 赋值为 1。这样的坏处就在于①不匹配的地方不被解决②不匹配的地方任然存在。显然这样暴力求解的方法简单但不高效。

KMP匹配思想

        KMP关键在于如何利用已知已匹配成功的部分模式串,而主串是何种形式并不关心。KMP模式匹配中每当遇到不匹配的位置,我们往前看以匹配好的部分串,如果以匹配成功的模式串的部分串中,存在与不匹配位置(不匹配位置前面)相等的后缀,那么我们就移动模式串(难以理解,看下图)

        假设模式串从第一个字符到不匹配的字符之前的部分串为 F 而 与不匹配位置开始的前缀为 G,与 G 匹配相等的模式串某后缀为 H ,我们要做的就是将 F 后移直到 G 与 H 重合,H 的下一个位置则为模式串需要跳转比较的新位置,为了记录这些新位置我们引入 next[]数组以记录发生不匹配的情况时 j 跳转的位置。

手工算next数组

        说明第一个位置(特殊情况一)不匹配时,i 赋值为 0,j 赋值为 0,然后 i++, j++;

        第二个位置不匹配时(特殊情况二),i 保持不变,j = 1,然后 i++, j++;

直到最后 j > substr.length() 退出循环。

另一个例子如下:

        参照以上方法,写下一下例子的答案:

KMP实现代码
#include<iostream>
#include<string>
using namespace std;// 获取next数组
void getNext(string substr, int next[]) {	int i = 1, j = 0; // 模式串从第一个字符串开始,数组下标从 1 开始next[1] = 0;while (i <= substr.length()) {// 取到最后一个串if (j == 0 || substr[i] == substr[j]) { // j退回到0时,和 i 一起向后移++i;++j;next[i] = j;}else {j = next[j];}} 
}int KMP(string str, string substr, int next[]) {// 先获取模式串getNext(substr, next);int i = 1, j = 1; // 模式串从0开始if (str.length() == 1 || substr.length() == 1) return 0;// 主串或者子串为空的情况下while (i <= str.length() && j <= substr.length()) {if (j == 0 ||str[i] == substr[j]) { // 若匹配成功i++;j++;}else {j = next[j];}}if (j > substr.length()) { // 匹配成功return i - substr.length(); // 返回匹配的初始位置}return 0;
}

进一步的KMP匹配

        观察以上手工算next数组的第一个例子,我们会发现当发生不匹配的字符与 next 数组所指的字符相同时,跳转后不匹配仍然存在,且后续还需要跳转,这样就需要跳转两次。那我们能不能只跳转一次呢?这样就引入了nextval 数组,nextval 数组的引入是为了解决上述现象,使得KMP匹配算法更加高效,那么如何计算 nextval 数组呢?看下图👇

👆的例子有点特殊,我们看另一个例子👇

        总之:nextval 数组计算的一般规律是,在计算出 next 数组之后,观察当前 next 和需要跳转的下一个位置的所对应的字符是否相等,若相等那么 nextval[j]等于需要跳转后的那个位置的 next 值(结合上面的例子看),若不相等那么 nextval[j]= next[j]的值.

改进KMP代码
#include<iostream>
#include<string>
using namespace std;void getNextval(string substr, int nextval[]) {if (substr.length() == 1) return; // 主串或者子串为空的情况下int i = 1, j = 1; // nextvl也是从1开始nextval[1] = 0; // 特殊位置while (i <= substr.length()) {if (j == 0 || substr[i] == substr[j]) {++i; ++j;if (nextval[i] != nextval[j]) { // i、j处字符不相等nextval[i] = j; // 当前需要跳转的位置}else {// i 、j所指字符相等nextval[i] = nextval[j]; // 需要跳转后位置的跳转位置}}}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2871513.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

24计算机考研调剂 | 宁波大学

北京信息科技大学接收调剂研究生 2024中国科学院宁波材料所与高校联合培养硕士研究生项目介绍 考研调剂招生信息 中国科学院宁波材料技术与工程研究所&#xff08;简称“宁波材料所”&#xff09;成立于2004年4月&#xff0c;是由中国科学院、浙江省人民政府、宁波市人民政府三…

算法第二十九天-森林中的兔子

森林中的兔子 题目要求 解题思路 重点&#xff1a;某个兔子回答x的时候&#xff0c;那么数组中最多循序x1个同花色的兔子同时回答x 我们可以通过举例子得出一下的规律&#xff1a; 我们统计数组中所有回答x的兔子的数量n&#xff1a; 若n%(x1)0&#xff0c;说明我们此时只需…

每日一题——LeetCode1694.重新格式化电话号码

方法一 模拟&#xff1a; 首先去除number里面的破折号和空格&#xff0c;取出纯数字组成的字符串str。 对于str每三个数分成一组&#xff0c;加一个破折号&#xff0c;当str的长度小于等于4时再分情况讨论&#xff0c;如果等于4就分为22形式&#xff0c;如果小于4&#xff0c…

哥斯拉流量webshell分析-->ASP/PHP

哥斯拉流量webshell分析 哥斯拉是继菜刀、蚁剑、冰蝎之后的又一个webshell利器&#xff0c;这里就不过多介绍了。 哥斯拉GitHub地址&#xff1a;https://github.com/BeichenDream/Godzilla 很多一线师傅不太了解其中的加解密手法&#xff0c;无法进行解密&#xff0c;这篇文章…

zabbix配置

1 下载zabbix 1 配置yum源 rpm -Uvh https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release- 5.0-1.el7.noarch.rpm yum clean all yum makecache fast 完成后会出现zabbix.repo文件 2安装zabbix服务 yum -y install zabbix-server-mysql zabbix-web-mysql z…

OpenHarmony—自适应布局

针对常见的开发场景&#xff0c;方舟开发框架提炼了七种自适应布局能力&#xff0c;这些布局可以独立使用&#xff0c;也可多种布局叠加使用。 下面我们依次介绍这几种自适应布局能力。 拉伸能力 拉伸能力是指容器组件尺寸发生变化时&#xff0c;增加或减小的空间全部分配给容…

继承 ResponseEntityExceptionHandler

目录 作用概述 示例-HttpRequestMethodNotSupportedException 示例-自定义异常处理 总示例 使用了ResponseEntityExceptionHandler后&#xff0c;为什么发生了异常后返回体为空 方法执行顺序 作用概述 这是一个方便的基类&#xff0c;用于希望通过 ExceptionHandler 方法…

【C语言_字符函数和字符串函数_复习篇】

目录 一、字符函数 1.1 字符分类函数 1.2 字符转换函数 二、字符串函数 2.1 strlen函数 2.1.1 strlen函数的使用 2.1.2 strlen函数的模拟实现 2.2 strcpy函数 2.2.1 strcpy函数的使用 2.2.2 strcpy函数的模拟实现 2.3 strcat函数 2.3.1 strcat函数的使用 2.3.2 strcat函数的…

基于深度学习LSTM+NLP情感分析电影数据爬虫可视化分析推荐系统(深度学习LSTM+机器学习双推荐算法+scrapy爬虫+NLP情感分析+数据分析可视化)

文章目录 基于深度学习LSTMNLP情感分析电影数据爬虫可视化分析推荐系统&#xff08;深度学习LSTM机器学习双推荐算法scrapy爬虫NLP情感分析数据分析可视化&#xff09;项目概述深度学习长短时记忆网络&#xff08;Long Short-Term Memory&#xff0c;LSTM&#xff09;机器学习协…

ISIS默认层级实验简述

ISIS被划分为三个层级&#xff1a;Level 1、Level 2和Level 1-2。 默认情况下&#xff0c;ISIS路由器属于level 1-2,是指同时支持Level 1和Level 2的路由器。路由器既可以在同一个自治系统内部进行路由选择&#xff0c;也可以将路由信息传递到其他自治系统。 实验拓扑图&#…

C# 打开文件对话框(OpenFileDialog)

OpenFileDialog&#xff1a;可以打开指定后缀名的文件&#xff0c;既能单个打开文件也能批量打开文件 /// <summary>/// 批量打开文档/// 引用&#xff1a;System.Window.Fomrs.OpenFileDialog/// </summary>public void OpenFile(){OpenFileDialog dialog new Op…

execl/python读取数据库( Access、MySQL)

目录 一 、读取access数据库 &#xff08;一&#xff09;execl读取数据库 1.搜索ODBC&#xff08;注意自己的execl是64位还是32位&#xff09; 2.安装数据源的驱动程序 3.打开execl 4. 补充&#xff1a;选择数据源时&#xff0c;也可以直接在execl中选择数据源 &#xff…

如何实现队列和栈的转化(c语言)

文章目录 一.什么是栈二.什么是队列三.怎么把栈变成队列&#xff08;力扣&#xff09;四.怎么把队列变成栈&#xff08;力扣&#xff09;总结 一.什么是栈 栈&#xff08;stack&#xff09;又名堆栈&#xff0c;它是一种运算受限的线性表。限定权在表尾进行插入和删除操作的线性…

Git——本地使用详解

目录 Git1、开始版本控制1.1、初始化Repository1.2、使目录脱离Git控制 2、把文件交给Git管控2.1、创建文件后交给Git2.2、git add之后再次修改文件2.3、git add "--all"与"."参数区别2.4、把暂存区的内容提交到存储库里存档 3、工作区、暂存区与存储库3.1…

生成式AI竞赛:开源还是闭源,谁将主宰未来?

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

C语言基础-内联函数在头文件中的定义

文章目录 前言inline关键字优点缺点使用注意 头文件中定义函数内联函数在头文件中的定义总结 前言 在软件开发过程中&#xff0c;大家可能很少会遇到inline关键字&#xff0c;也可能很少见到头文件中定义函数体。没有用过不代表不能了解&#xff0c;菜就多练&#xff01;哈哈哈…

从零开始搭建游戏服务器 第三节 Protobuf的引入并使用

目录 上一节问题答案公布本节内容Protobuf介绍正文在build.gradle引入protobuf编写proto并生成使用生成的proto来进行数据传输 总结 上一节问题答案公布 上一节我们创建了ConnectActor&#xff0c;并且使用ConnectActorManager和connectId将其管理起来。 并且我们在收到客户端…

【Twinmotion】Twinmotion导入UE5

步骤 1. 在虚幻商城中安装“Datasmith Twinmotion导入器插件” 安装“面向虚幻引擎的Twinmotion内容” 2. 打开虚幻引擎&#xff0c;在插件中搜索“twinmotion”&#xff0c;勾选如下两个插件&#xff0c;然后重启虚幻引擎 3. 打开Twinmotion&#xff0c;随便添加一个物体 导出…

腾讯云2核2G免费服务器申请流程,2024免费服务器入口

腾讯云免费服务器申请入口 https://curl.qcloud.com/FJhqoVDP 免费服务器可选轻量应用服务器和云服务器CVM&#xff0c;轻量配置可选2核2G3M、2核8G7M和4核8G12M&#xff0c;CVM云服务器可选2核2G3M和2核4G3M配置&#xff0c;腾讯云服务器网txyfwq.com分享2024年最新腾讯云免费…

4.1_5 文件存储空间管理

文章目录 4.1_5 文件存储空间管理&#xff08;一&#xff09;存储空间的划分与初始化&#xff08;二&#xff09;存储空间管理——空闲表法&#xff08;三&#xff09;存储空间管理——空闲链表法&#xff08;1&#xff09;空闲盘块链&#xff08;2&#xff09;空闲盘区链 &…