STL—string类—模拟实现

STL—string类—模拟实现

熟悉了string的结构和各自接口的使用之后,现在就要尝试去模拟实现string类

这个string类为了避免和我们库里的string类冲突,因此我们需要定义一个自己的命名空间

namespace wzf
{class string{public://成员函数private://成员变量    }
}

成员变量:

		// 我们说string类其实是一个字符数组char* _str; // 这个指针指向的字符串可能来自各个地方,栈区、堆区、代码段(常量区)、数据段(静态区)size_t _size; // 表示有效字符的个数size_t _capacity; // 表示空间的大小还能存多少个有效字符static size_t npos; // 静态成员只能在类外定义

1.构造函数和析构函数

在这里我们先来看一个代码

string s("hello");

这里的hello是处于代码段(常量区)的,是常量,不可以改变的,是const char* 类型。但是我们string类是有很多接口是可以修改字符串的,因此我们的string类中需要存放一个指针去指向这个字符串,并且这个字符串不能是在代码段的,我们需要将其拷贝到堆区,这里空间大,并且我们可以操控。

  • 构造函数&拷贝构造函数

image-20240709184245124

拷贝构造函数一定要自己去实现,不然就会调用系统的默认拷贝构造的函数,系统做的就是浅拷贝,就是一个字节一个字节的复制过去,那么两个string对象的_str指针指向的是同一个地址,那么在析构函数就会程序崩溃,因为对同一个地址的空间释放了两次。

因此关于拷贝构造我们需要自己实现,这样就可以实现深拷贝

如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。一般情况都是按照深拷贝方式提供。

image-20240709184555338

熟悉了深拷贝的概念,我们来看看拷贝构造和赋值运算符的深拷贝思路

深拷贝思路:

image-20240710123219425

image-20240710123346571

//string()
//	:_str(new char[1]) // 初始化列表
//{
//	_str[0] = '\0'; // 尽管没有有效字符,但是需要一个\0
//}//string(char* str)
//	:_str(new char[strlen(str) + 1]) // +1是为了给\0留一个空间
//{
//	strcpy(_str, str);
//}//对于上面的两个构造函数来说,他构成了默认构造函数,有没有参数都能处理
// 但是在c++来说,这种可以用全缺省来让代码更合理一些string(const char* str = "") // 如果str没有参数,那么默认是"",空字符串,只有一个'\0'。{// str不能是nullptr,不然strlen函数会对其解引用,那么就会报错。if (str == nullptr){assert(false);return;}_size = strlen(str);_capacity = _size;_str = new char[_capacity + 1]; // + 1是为了存下'\0'strcpy(_str, str); // 把str指向的字符串复制到堆区,方便我们进行操作// 也可以用memcpy//memcpy(_str, str, strlen(str));// strlen(str)就代表着要拷贝的字节}string(const string& s):_str(new char[s._capacity + 1]),_size(s._size),_capacity(s._capacity){//this->_size = s._size; // 这个this指针加不加都行,不加编译器帮你加//this->_capacity = s._capacity;strcpy(_str, s._str);}

拷贝构造的string(const string& s)中的形参一定得是引用&,不然就会陷入无限递归构造。具体原因和过程我在之前博客的面向对象中的拷贝构造有详细解析

类和对象(中)-CSDN博客在这篇博客的拷贝构造内容中有讲述无穷递归的详解

  • 析构函数:

我们的string是动态开辟的数组,因此我们需要通过析构函数来释放其空间,不然会造成内存泄漏

	// 析构函数~string(){delete[] _str;_str = nullptr;}

2.赋值运算符重载

	// 赋值运算符重载string& operator=(const string& s) {// 首先判断是否是自己给自己赋值,虽然过程不会报错,但是是无用的消耗if (this != &s) // 这里的&s是s的地址,要注意{delete[] _str; // 释放旧空间,不然会造成内存泄漏_str = new char[s._capacity + 1]; // 指向新开辟的空间_size = s._size;_capacity = s._capacity;strcpy(_str, s._str); // 再把要赋值的内容拷贝到新开辟的空间}return *this; // 返回值是为了支持连等号}

3.[]运算符重载

char& operator[](size_t i) const{assert(i < _size && i >= 0);return _str[i];}

this指针指向的对象如果不需要改变,那么我们通常会加const修饰

4.size()接口实现

size_t size() const
{return strlen(_str);
}

5.capacity()接口实现

size_t capacity() const{return _capacity;}

6.重载<<和>>(输入/输出符)

  • 重载<<输出符

要想重载<<,我们需要用到友元,具体原因可以复习之前的友元的学习。

想要访问s中的成员,需要声明友元friend ostream& operator<<(ostream& out, const string& s);

	// 重载<<运算符ostream& operator<<(ostream& out, const string& s){out << s._str;return out;}

当然,也有不需要友元的用法,可以用for循环

	ostream& operator<<(ostream& out, const string& s){for (int i = 0; s.size(); i++){out << s[i];}return out;}

当然,这样的话,我们就需要我们的size接口和[]运算符重载的this指针,都要被const修饰

  • 重载>>输入符号

同样也是需要用到友元

friend istream& operator>>(istream& in, string& s);

	// 重载 >>运算符istream& operator>>(istream& in, string& s){cout << "输入字符串" << endl;char str[999]; in >> str;delete[] s._str; // 释放旧空间s._size = strlen(str);s._capacity = s._size;s._str = new char[s._capacity + 1]; // 开辟新空间strcpy(s._str, str); // 将栈区的内容拷贝都堆区的新空间上return in;}

但是这个写法有一个缺点,那就是str[999];一旦输入的字符超过999个,那么就会出问题。

优化后的写法:

这个写法需要实现+=

istream& operator>>(istream& in, string& s)
{while (1){char ch;//in >> ch; // 不能用这个,因为当输入' '或者'\n'的时候,ch无法接收到ch = in.get();if (ch == ' ' || ch == '\n'){break;}else{s += ch;}}return in;
}

7.迭代器实现

在讲述迭代器实现之前,我们得先知道迭代器是干什么的,其实迭代器对于string来说就是一个方便去遍历它的东西。

而我们说遍历string类通常就有三种方式

  1. [] + for
  2. 迭代器
  3. 范围for循环

迭代器的实现:

	// 迭代器的实现typedef char* iterator; // 在string类中是指针,但是迭代器不一定都是指针,在链表就不是指针iterator begin(){return _str;}iterator end(){// 返回的是指向\0的位置return _str + _size;}

要注意:迭代器在string类中,我们可以将其理解成指针,但是迭代器不一定是指针。

测试代码:

	void test_string4(){cout << "test_string4: " << endl;// 遍历string的三种方式([], 迭代器,范围for)string s("hello");// 第一种遍历方式for (int i = 0; i < s.size(); i++){cout << s[i];}cout << endl;// 第二种遍历方式——迭代器string::iterator it = s.begin1();while (it != s.end()){cout << *it;it++;}cout << endl;// 第三种遍历方式——范围for// 范围for是由迭代器支持的,最终会被编译器替换成迭代器去 for (auto e : s){cout << e;}cout << endl;}

范围for循环,本身是由迭代器去支持的,怎么证明呢?

其实我们把迭代器的begin改个名,范围for就会报错了。如图所示。

image-20240711182030074

对于范围for来说,它需要一个迭代器,iterator,并且还需要这个迭代器能支持 begin(),end()。

增删查改类的接口实现

1.reserve()

		// reserve实现增容void reserve(size_t n){if (n > _capacity) // 当n大于容量时才需要扩容{char* tmp = new char[n + 1]; // + 1是留给\0这个无效字符的。strcpy(tmp, _str);delete[] _str;// 释放旧的空间 _str = tmp; // 指向新的空间_capacity = n;// 更新_capacity成员}}

2.resize()

resize一共分3种情况:

  1. n < _size
  2. n > _size && n < _capacity
  3. n > _size && n > _capacity
	void resize(size_t n, char ch = '\0'){assert(n >= 0);// 一共3种情况分类讨论。if (n < _size){// 将_size减小到n_size = n;_str[n] = '\0'; // 因为有效字符个数是n个,第二个字符之后的数据都不重要了}else{// 除了保留原数据,要把_size增大到n,原数据不够n的都填充ch字符if (n > _capacity) // 如果n大于能存的空间就要扩容{reserve(n); // 扩容到n}// 除了原数据,在n个有效字符(下标n-1)之前,都要填充ch字符for (int i = _size; i < n; i++){_str[i] = ch;}_size = n;_str[_size] = '\0'; // 补充\0}}

3.push_back()

在c++中string类的push_back实现的是尾插字符,就是单个的字符

	void push_back(char ch){// 先判断空间是否足够添加一个字符,不够的话要进行增容if (_size == _capacity){size_t newcapacity = _capacity == 0 ? 5 : _capacity * 2;reserve(newcapacity);}// 尾插ch字符_str[_size] = ch;++_size;_str[_size] = '\0';}

要注意手动的给有效字符的最后+一个’\0’。尽管strcpy也会把’\0’拷贝到。但是后面我们尾插ch字符的时候将其覆盖了,因此我们需要手动补充。

4.append()

在c++中string类的append实现的是字符串的尾插

要注意其扩容的逻辑和push_back是不太一样的。

		void append(const char* str){// append接口需要考虑当前容量是否能装下新增的字符串size_t len = strlen(str);if (_size + len > _capacity){size_t newcapacity = _size + len;reserve(newcapacity);}// 尾插字符串strcpy(_str + _size, str); // str被拷贝到_str后边的时候,str自带\0,因此这里不需要我们手动插入\0了_size += len;}void append(const string& s){size_t len = s._size;if (_size + len > _capacity){size_t newcapacity = _size + len;reserve(newcapacity);}strcpy(_str + _size, s._str);_size += len;}

5.+=

我们在实际使用中append和push_back我们都不太喜欢用,我们最喜欢用的就是**+=**。

因为+=无论是单个字符还是字符串还是string类对象都可以使用。

	string& operator+=(char ch){// 实现+=push_back(ch);// 等价于this->push_back(ch);return *this;}string& operator+=(const char* str){// 实现+=append(str);// 等价于this->append(str);return *this;}string& operator+=(const string& s){append(s);return *this;}

6.insert()

insert实现在具体位置插入字符和字符串

  • insert单个字符
		string& insert(size_t pos, char ch){assert(pos <= _size && pos >= 0);if (_size == _capacity){size_t newcapacity = _capacity + 1; //只插入一个ch字符reserve(newcapacity);}// 将pos位置开始,整体往后移动一位,再在pos位置插入chint end = _size;// 从后往前移动,防止数据被覆盖丢失while (end >= pos && end >= 0) // 这里一定要有end>=0。不然当pos=0的时候会死循环(注意)// 当 end = 0时进入循环完成最后一次后移数据,本应--为-1,// 但是int类型在-1的二进制补码,在pos(size_t)看来,就是一个很大的正数,自然死循环{_str[end + 1] = _str[end];end--;}_str[pos] = ch; // 插入ch字符_size++;//_str[_size] = '\0'; // 补充被覆盖的0return *this;}

while (end >= pos && end >= 0)要注意end >=0一定要有

当 end = 0时进入循环完成最后一次后移数据,end本应–为-1,然后退出循环。但是int类型在0的时候–变成了一个很大的正数了,因此无法变成-1,自然死循环。

这是为什么呢?因为判断是否退出循环的条件是end >= pos,而pos我们知道又是size-t类型。也就是无符号的int类型,因此int为-1的二进制补码在size_t看来就是一个非常大的正数,因为size_t没有符号位。

看两个例子

	int i = 2;size_t pos = 0;while (i >= pos){cout << "n" << endl;i--;}

这个代码的结果是死循环

	int i = 2;int pos = 0;while (i >= pos){cout << "n" << endl;i--;}

而这个代码的结果就不是死循环。

image-20240714161428935

关于这个问题可以复习c语言中数据在内存的存储

数据在内存中的存储-CSDN博客

  • insert字符串
		string& insert(size_t pos, const char* str){assert(pos <= _size && pos >= 0);// 考虑当前的_capacity是否能够装下新增的字符串size_t len = strlen(str);if (_size + len > _capacity){size_t newcapacity = _size + len;reserve(newcapacity);}// 扩容之后要先将pos位置后的数据后移len个长度int end = _size; //从\0开始移动,这样后面不用处理\0的问题while (end >= pos && end >= 0){_str[end + len] = _str[end]; // 后移len个长度end--;}//从pos位置插入str字符串/*int k = 0;for (int i = pos; i < pos + len; i++){_str[i] = str[k];k++;}*/strncpy(_str + pos, str, len); // 由于不想拷\0,用strncpy只拷len个长度_size += len; // 更新_sizereturn *this;}

7.erase()

同样的erase也需要分类讨论

  1. _size - pos <= len,说明pos位置之后的元素要被全部删除
  2. _size - pos > len 说明pos + len位置之后的数据要往pos位置覆盖
void erase(size_t pos, size_t len = npos)
{assert(pos >= 0 && pos < _size);// 分两种情况if (_size - pos <= len){// 这种情况就说明pos后面的有效字符小于等于要删除的字符数_str[pos] = '\0'; // 直接让pos位置为\0就行_size = pos; // 更新_size}else{// 删不完要把剩余属于往pos位置移动for (int i = pos + len; i <= _size; i++) //pos + len 就是剩余数据的第一个数据{_str[i - len] = _str[i]; // 向前移动len个长度}_size -= len; // 更新_size}
}

8.find

  • 找字符
	size_t find(char ch, size_t pos = 0){for (int i = pos; i < _size; i++){if (_str[i] == ch)return i; // 找到了返回下标位置}return npos;}
  • 找字符串
	size_t find(const char* str, size_t pos = 0){char* p = strstr(_str, str); // 这个也可以自己实现,这里用库里的if (p == nullptr){return npos;}else{// 要判断是否找的是pos位置之后的strif (p - _str < pos){p = strstr(_str + pos, str);return p - _str;}// 如果是pos位置之后的那直接返回其下标return p - _str; // 返回字符串首元素的下标}}

运算符重载

运算符重载比较简单,实现了< 和 == 的重载之后,其他运算符都可以用代码复用来实现

		// 运算符重载bool operator<(const string& s){// strcmp,第一个参数比第二个参数大那就返回1int ret = strcmp(_str, s._str);return ret < 0;}bool operator==(const string& s){int ret = strcmp(_str, s._str);return ret == 0;}bool operator<=(const string& s){return *this < s || *this == s;}bool operator>(const string& s){return !(*this <= s);}bool operator>=(const string& s){return *this > s || *this == s;}bool operator!=(const string& s){return !(*this == s);}

关于string类的大致就模拟实现完了,当然不是将其完整的模拟实现出来,因为能力上也无法将库中的string类中的143个接口模拟实现出来,而且对于我的学习来说好处也没有那么大。主要就是为了了解其常用接口和string类的底层原理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3248522.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

java之 junit单元测试案例【经典版】

一 junit单元测试 1.1 单元测试作用 单元测试要满足AIR原则&#xff0c;即 A&#xff1a; automatic 自动化&#xff1b; I: Independent 独立性&#xff1b; R&#xff1a;Repeatable 可重复&#xff1b; 2.单元测试必须使用assert来验证 1.2 案例1 常规单元测试 1.…

H6392升压恒压芯片输入2.6V4.2V5V升压9V12V18V2.5Aic 制冷市场应用

在制冷市场应用中&#xff0c;H6392升压恒压芯片由于其多种特性和优势&#xff0c;可以找到多种应用场景。虽然直接提及“制冷市场”的具体应用可能不太常见&#xff0c;但我们可以从产品特征和典型应用中推导出一些潜在的应用场景。 制冷系统电子控制器供电&#xff1a;H6392…

让旧书重焕新生:旧书回收小程序开发

在这个数字化的时代&#xff0c;书籍依然是知识的重要载体&#xff0c;承载着无数的智慧与情感。然而&#xff0c;随着时间的推移&#xff0c;许多旧书被闲置在角落&#xff0c;逐渐被遗忘。为了让这些旧书重新发挥价值&#xff0c;我们致力于开发一款创新的旧书回收小程序&…

Re:从零开始的C++世界——类和对象(下)

文章目录 前言1.再谈构造函数&#x1f34e;构造函数体赋值&#x1f34e;初始化列表&#x1f34e;特性&#x1f34c;特性一&#x1f34c;特性二&#x1f34c;特性三&#x1f34c;特性四&#x1f34c;特性五 &#x1f34e;explicit 关键字 2.static成员&#x1f34e;概念&#x1…

ThinkBook_TypeC外接显卡突然无输出了怎么解决?这里有方法!

ThinkBook用了快一年了&#xff0c;使用群体蛮多&#xff01;速度和效果还是值得肯定。 但是这个外接显示器用着用着&#xff0c;偶尔就碰到无输出了&#xff01;在使用TypeC外接显卡的情况下! 这个问题我咨询过联想客服&#xff0c;一顿乱指导&#xff0c;方向根本不对&…

连接池应用

一、什么是连接池&#xff1a; 当应用程序需要执行数据库操作时&#xff0c;它会从连接池中请求一个可用的连接。如果连接池中有空闲的连接&#xff0c;那么其中一个连接会被分配给请求者。一旦数据库操作完成&#xff0c;连接不会被关闭&#xff0c;而是被归还到连接池中&…

【数据结构】非线性表----树详解

树是一种非线性结构&#xff0c;它是由**n&#xff08;n>0&#xff09;**个有限结点组成一个具有层次关系的集合。具有层次关系则说明它的结构不再是线性表那样一对一&#xff0c;而是一对多的关系&#xff1b;随着层数的增加&#xff0c;每一层的元素个数也在不断变化&…

Uniapp 组件 props 属性为 undefined

问题 props 里的属性值都是 undefined 代码 可能的原因 组件的名字要这样写&#xff0c;这个官方文档有说明

docker emqx 配置密码和禁用匿名连接

mqtt版本emqx/emqx:4.4.3 1.首先把镜像内目录/opt/emqx/etc拷贝到本地 2.做映射 3.allow_anonymous&#xff0c; false改成true 4. 5.MQTTX连不上的话看看下图的有没有打开

最优控制问题中的折扣因子

本文探讨了在线性二次型调节器&#xff08;LQR&#xff09;中引入折扣因子的重要性和方法。通过引入折扣因子&#xff0c;性能指标在无穷时间上的积分得以收敛&#xff0c;同时反映了现实问题中未来成本重要性递减的现象&#xff08;强化学习重要概念&#xff09;。详细推导了带…

《0基础》学习Python——第十六讲 __文件读写

<文件读写> 一、什么是文件读写 文件读写是指在Python程序中对文件进行读取和写入操作。通过文件读写&#xff0c;可以读取文件中的数据&#xff0c;或者向文件中写入数据。 Python提供了多种文件读写的方式&#xff0c;其中最常用的方式是使用open()函数打开一个文件&a…

uniapp打包h5,白屏并报错Failed to load resource: net::ERR_FILE_NOT_FOUND

在manifest.json内找到web配置修改运行的基础路径

9 Docker实践_安装JDK

欢迎来到一夜看尽长安花 博客&#xff0c;您的点赞和收藏是我持续发文的动力 对于文章中出现的任何错误请大家批评指出&#xff0c;一定及时修改。有任何想要讨论的问题可联系我&#xff1a;3329759426qq.com 。发布文章的风格因专栏而异&#xff0c;均自成体系&#xff0c;不足…

5G以太网和5G前传业务的有效解决方案——25G可调DWDM光模块

信息技术的迅猛发展和数据传输需求的不断增加&#xff0c;光通信技术在现代网络中扮演着至关重要的角色。DWDM技术通过在一根光纤上使用多个不同波长的光信号同时传输&#xff0c;大幅提高了数据传输的容量。而可调光模块则能够在多种波长之间进行切换&#xff0c;实现灵活、高…

昇思25天学习打卡营第14天|munger85

基于MindNLPMusicGen生成自己的个性化音乐 这个所谓的个性化的音乐就是指你输入一段文字它会根据这个文字输出一段音乐这个音乐是贴近于那段文字的所以叫做文生成音乐&#xff0c; 如果网络正常的话就可以直接从下载这个模型。 那么音乐生成的有两种方式呢有两种方式&#xff…

计算机网络基础:局域网、广域网及OSI七层模型解析

文章目录 一、局域网和广域网1、局域网&#xff08;LAN - Local Area Network&#xff09;2、广域网&#xff08;WAN - Wide Area Network&#xff09;3、对比局域网和广域网 二、OSI七层模型1、OSI的七层网络结构2、OSI的数据传输方式3、网络与操作系统的关系 一、局域网和广域…

基于自编码器和孪生框架的乳腺组织病理图像分类方法

乳腺癌组织病理图像的自动分类是计算机辅助诊断系统的重要任务之一。由于乳腺癌组织病理图像具有类间差异小、类内差异大的特点&#xff0c;提取用于乳腺癌分类的特征比较困难。为了解决这一问题&#xff0c;设计了一种改进的自编码器(AE)网络&#xff0c;该网络使用Siamese框架…

【BUG】已解决:TypeError: object of type ‘int‘ has no len()

已解决&#xff1a;TypeError: object of type ‘int‘ has no len() 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页&#xff0c;我是博主英杰&#xff0c;211科班出身&#xff0c;就职于医疗科技公司&#xff0c;热衷分享知识&#xff0c;武汉城市…

【windows|015】UDP协议详解

&#x1f341;博主简介&#xff1a; &#x1f3c5;云计算领域优质创作者 &#x1f3c5;2022年CSDN新星计划python赛道第一名 &#x1f3c5;2022年CSDN原力计划优质作者 ​ &#x1f3c5;阿里云ACE认证高级工程师 ​ &#x1f3c5;阿里云开发者社区专家博主 &#x1f48a;交流社…

学懂C语言(四):C语言数据类型

目录 一、数据类型分类 二、存储大小和值范围 三、类型转换 在 C 语言中&#xff0c;数据类型指的是用于声明不同类型的变量或函数的一个广泛的系统。变量的类型决定了变量存储占用的空间&#xff0c;以及如何解释存储的位模式。 一、数据类型分类 C 中的类型可分为以下几…