聊聊mysql唯一索引的哪些坑,为什么还是产生重复数据?

在这里插入图片描述

前言

前段时间我踩过一个坑:在mysql8的一张innodb引擎的中,加了唯一索引,但最后发现数据竟然还是重复了。

到底怎么回事呢?

本文通过一次踩坑经历,聊聊唯一索引,一些有意思的知识点。

图片

1.还原问题现场

前段时间,为了防止商品组产生重复的数据,我专门加了一张防重表

问题就出在商品组的防重表上。

具体表结构如下:

CREATE TABLE `product_group_unique` (`id` bigint NOT NULL,`category_id` bigint NOT NULL,`unit_id` bigint NOT NULL,`model_hash` varchar(255) COLLATE utf8mb4_bin DEFAULT NULL,`in_date` datetime NOT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;

为了保证数据的唯一性,我给那种商品组防重表,建了唯一索引:

alter table product_group_unique add unique index 
ux_category_unit_model(category_id,unit_id,model_hash);

根据分类编号、单位编号和商品组属性的hash值,可以唯一确定一个商品组。

给商品组防重表创建了唯一索引之后,第二天查看数据,发现该表中竟然产生了重复的数据:图片

表中第二条数据和第三条数据重复了。

这是为什么呢?

2.唯一索引字段包含null

如果你仔细查看表中的数据,会发现其中一个比较特殊地方:商品组属性的hash值(model_hash字段)可能为null,即商品组允许不配置任何属性。

在product_group_unique表中插入了一条model_hash字段等于100的重复数据:图片

执行结果:图片

从上图中看出,mysql的唯一性约束生效了,重复数据被拦截了。

接下来,我们再插入两条model_hash为null的数据,其中第三条数据跟第二条数据中category_id、unit_id和model_hash字段值都一样。图片

从图中看出,竟然执行成功了。

换句话说,如果唯一索引的字段中,出现了null值,则唯一性约束不会生效。

最终插入的数据情况是这样的:

  1. 当model_hash字段不为空时,不会产生重复的数据。
  2. 当model_hash字段为空时,会生成重复的数据。

我们需要特别注意:创建唯一索引的字段,都不能允许为null,否则mysql的唯一性约束可能会失效。

3.逻辑删除表加唯一索引

我们都知道唯一索引非常简单好用,但有时候,在表中它并不好加。

不信,我们一起往下看。

通常情况下,要删除表的某条记录的话,如果用delete语句操作的话。

例如:

delete from product where id=123;

这种delete操作是物理删除,即该记录被删除之后,后续通过sql语句基本查不出来。(不过通过其他技术手段可以找回,那是后话了)

还有另外一种是逻辑删除,主要是通过update语句操作的。

例如:

update product set delete_status=1,edit_time=now(3) 
where id=123;

逻辑删除需要在表中额外增加一个删除状态字段,用于记录数据是否被删除。在所有的业务查询的地方,都需要过滤掉已经删除的数据。

通过这种方式删除数据之后,数据任然还在表中,只是从逻辑上过滤了删除状态的数据而已。

其实对于这种逻辑删除的表,是没法加唯一索引的。

为什么呢?

假设之前给商品表中的namemodel加了唯一索引,如果用户把某条记录删除了,delete_status设置成1了。后来,该用户发现不对,又重新添加了一模一样的商品。

由于唯一索引的存在,该用户第二次添加商品会失败,即使该商品已经被删除了,也没法再添加了。

这个问题显然有点严重。

有人可能会说:把namemodeldelete_status三个字段同时做成唯一索引不就行了?

答:这样做确实可以解决用户逻辑删除了某个商品,后来又重新添加相同的商品时,添加不了的问题。但如果第二次添加的商品,又被删除了。该用户第三次添加相同的商品,不也出现问题了?

由此可见,如果表中有逻辑删除功能,是不方便创建唯一索引的。

但如果真的想给包含逻辑删除的表,增加唯一索引,该怎么办呢?

3.1 删除状态+1

通过前面知道,如果表中有逻辑删除功能,是不方便创建唯一索引的。

其根本原因是,记录被删除之后,delete_status会被设置成1,默认是0。相同的记录第二次删除的时候,delete_status被设置成1,但由于创建了唯一索引(把name、model和delete_status三个字段同时做成唯一索引),数据库中已存在delete_status为1的记录,所以这次会操作失败。

我们为啥不换一种思考:不要纠结于delete_status为1,表示删除,当delete_status为1、2、3等等,只要大于1都表示删除。

这样的话,每次删除都获取那条相同记录的最大删除状态,然后加1。

这样数据操作过程变成:

  1. 添加记录a,delete_status=0。
  2. 删除记录a,delete_status=1。
  3. 添加记录a,delete_status=0。
  4. 删除记录a,delete_status=2。
  5. 添加记录a,delete_status=0。
  6. 删除记录a,delete_status=3。

由于记录a,每次删除时,delete_status都不一样,所以可以保证唯一性。

该方案的优点是:不用调整字段,非常简单和直接。

缺点是:可能需要修改sql逻辑,特别是有些查询sql语句,有些使用delete_status=1判断删除状态的,需要改成delete_status>=1。

3.2 增加时间戳字段

导致逻辑删除表,不好加唯一索引最根本的地方在逻辑删除那里。

我们为什么不加个字段,专门处理逻辑删除的功能呢?

答:可以增加时间戳字段。

把name、model、delete_status和timeStamp,四个字段同时做成唯一索引

在添加数据时,timeStamp字段写入默认值1

然后一旦有逻辑删除操作,则自动往该字段写入时间戳。

这样即使是同一条记录,逻辑删除多次,每次生成的时间戳也不一样,也能保证数据的唯一性。

时间戳一般精确到

除非在那种极限并发的场景下,对同一条记录,两次不同的逻辑删除操作,产生了相同的时间戳。

这时可以将时间戳精确到毫秒

该方案的优点是:可以在不改变已有代码逻辑的基础上,通过增加新字段实现了数据的唯一性。

缺点是:在极限的情况下,可能还是会产生重复数据。

3.3 增加id字段

其实,增加时间戳字段基本可以解决问题。但在在极限的情况下,可能还是会产生重复数据。

有没有办法解决这个问题呢?

答:增加主键字段:delete_id。

该方案的思路跟增加时间戳字段一致,即在添加数据时给delete_id设置默认值1,然后在逻辑删除时,给delete_id赋值成当前记录的主键id。

把name、model、delete_status和delete_id,四个字段同时做成唯一索引。

这可能是最优方案,无需修改已有删除逻辑,也能保证数据的唯一性。

4. 重复历史数据如何加唯一索引?

前面聊过如果表中有逻辑删除功能,不太好加唯一索引,但通过文中介绍的三种方案,可以顺利的加上唯一索引。

但来自灵魂的一问:如果某张表中,已存在历史重复数据,该如何加索引呢?

最简单的做法是,增加一张防重表,然后把数据初始化进去。

可以写一条类似这样的sql:

insert into product_unqiue(id,name,category_id,unit_id,model) 
select max(id), select name,category_id,unit_id,model from product
group by name,category_id,unit_id,model;

这样做可以是可以,但今天的主题是直接在原表中加唯一索引,不用防重表。

那么,这个唯一索引该怎么加呢?

其实可以借鉴上一节中,增加id字段的思路。

增加一个delete_id字段。

不过在给product表创建唯一索引之前,先要做数据处理。

获取相同记录的最大id:

select max(id), select name,category_id,unit_id,model from product
group by name,category_id,unit_id,model;

然后将delete_id字段设置成1。

然后将其他的相同记录的delete_id字段,设置成当前的主键。

这样就能区分历史的重复数据了。

当所有的delete_id字段都设置了值之后,就能给name、model、delete_status和delete_id,四个字段加唯一索引了。

完美。

5.给大字段加唯一索引

接下来,我们聊一个有趣的话题:如何给大字段增加唯一索引。

有时候,我们需要给几个字段同时加一个唯一索引,比如给name、model、delete_status和delete_id等。

但如果model字段很大,这样就会导致该唯一索引,可能会占用较多存储空间。

我们都知道唯一索引,也会走索引。

如果在索引的各个节点中存大数据,检索效率会非常低。

由此,有必要对唯一索引长度做限制。

目前mysql innodb存储引擎中索引允许的最大长度是3072 bytes,其中unqiue key最大长度是1000 bytes。

如果字段太大了,超过了1000 bytes,显然是没法加唯一索引的。

此时,有没有解决办法呢?

5.1 增加hash字段

我们可以增加一个hash字段,取大字段的hash值,生成一个较短的新值。该值可以通过一些hash算法生成,固定长度16位或者32位等。

我们只需要给name、hash、delete_status和delete_id字段,增加唯一索引。

这样就能避免唯一索引太长的问题。

但它也会带来一个新问题:

一般hash算法会产生hash冲突,即两个不同的值,通过hash算法生成值相同。

当然如果还有其他字段可以区分,比如:name,并且业务上允许这种重复的数据,不写入数据库,该方案也是可行的。

5.2 不加唯一索引

如果实在不好加唯一索引,就不加唯一索引,通过其他技术手段保证唯一性。

如果新增数据的入口比较少,比如只有job,或者数据导入,可以单线程顺序执行,这样就能保证表中的数据不重复。

如果新增数据的入口比较多,最终都发mq消息,在mq消费者中单线程处理。

5.3 redis分布式锁

由于字段太大了,在mysql中不好加唯一索引,为什么不用redis分布式锁呢?

但如果直接加给name、model、delete_status和delete_id字段,加redis分布式锁,显然没啥意义,效率也不会高。

我们可以结合5.1章节,用name、model、delete_status和delete_id字段,生成一个hash值,然后给这个新值加锁。

即使遇到hash冲突也没关系,在并发的情况下,毕竟是小概率事件。

图片

6.批量插入数据

有些小伙们,可能认为,既然有redis分布式锁了,就可以不用唯一索引了。

那是你没遇到,批量插入数据的场景。

假如通过查询操作之后,发现有一个集合:list的数据,需要批量插入数据库。

如果使用redis分布式锁,需要这样操作:

for(Product product: list) {try {String hash = hash(product);rLock.lock(hash);//查询数据//插入数据} catch (InterruptedException e) {log.error(e);} finally {rLock.unlock();}
}

需要在一个循环中,给每条数据都加锁。

这样性能肯定不会好。

当然有些小伙伴持反对意见,说使用redis的pipeline批量操作不就可以了?

也就是一次性给500条,或者1000条数据上锁,最后使用完一次性释放这些锁?

想想都有点不靠谱,这个锁得有多大呀。

极容易造成锁超时,比如业务代码都没有执行完,锁的过期时间就已经到了。

针对这种批量操作,如果此时使用mysql的唯一索引,直接批量insert即可,一条sql语句就能搞定。

数据库会自动判断,如果存在重复的数据,会报错。如果不存在重复数据,才允许插入数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/143394.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL普通索引与唯一索引

MySQL普通索引与唯一索引 1. MySQL普通索引与唯一索引区别2. MySQL普通索引与唯一索引选择 1. MySQL普通索引与唯一索引区别 MySQL索引详解 MySQL索引分为很多种,常见的有主键索引与非主键索引,主键索引也就是我们常说的聚簇索引,主键索引叶…

MySQL | 普通索引和唯一索引,应该怎么选择?

在前面的基础篇文章中,我给你介绍过索引的基本概念,相信你已经了解了唯一索引和普通索引的区别。今天我们就继续来谈谈,在不同的业务场景下,应该选择普通索引,还是唯一索引? 假设你在维护一个市民系统&…

【MySQL】轻松学习 唯一索引

目录 🍀🍀🍀🍀🍀 引言:什么是索引 一、唯一索引概述 二、创建唯一索引 1.创建表时创建唯一索引 唯一索引与unique约束共存时 2、已存在的表上创建索引 2.1、使用create语句 2.2、使用alter table语句 引…

mysql索引(七)唯一索引

Mysql索引大概有五种类型: 普通索引(INDEX):最基本的索引,没有任何限制 唯一索引(UNIQUE):与"普通索引"类似,不同的就是:索引列的值必须唯一,但允许有空值。 主键索引(PRIMARY)&…

MySQL数据库-表索引-唯一索引

所谓唯一索引,就是在创建索引时,限制索引的字段值必须是唯一的。通过该类型的索引可以比普通索引更快的查询某条记录。 创建表时定义索引 语法: CREATE TABLE tablename( propName1 type1, propName2 type2, ... UNIQUE INDEX|KEY [indexn…

word文档图标变成白色

word文档图标变成白色,有可能是电脑上既有microsoft office,又安装又WPS(WPS比较流氓,会篡改注册表中图标的路径,下图打个比方) 图标路径被修改后,容易与office发生冲突,就会出现两种…

Word图表自动编号

1.选择【引用】菜单,然后点击【插入题注】。 2.弹出 【题注对话框】,点击【新建标签】。 3.弹出【新建标签】对话框,输入需要的【标签】,点击确定。如图所示,比如第一章的图,就输入 【图 1-】。 4.回到“题…

Java操作Word图表

一、POM <dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>4.1.0</version></dependency><dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml…

WORD图标显示为白色解决办法

&#xff08;操作过程幸得朋友相助&#xff0c;但我还是决定用写博客的方式把操作成功的过程写下来&#xff0c;以免以后再出现相关问题可以翻看自己的博客知快速获取解决办法&#xff0c;也能帮助到一些遇到类似状况的朋友。鄙人电脑小白&#xff0c;初入江湖&#xff0c;涉世…

计算机图标显示的是word,word图标不显示怎么办 设置显示word图标的方法

word是我们常用的办公软件&#xff0c;有时在使用时&#xff0c;图标会莫名其妙不显示&#xff0c;那么word图标不显示怎么办&#xff1f;下面小编带来设置显示word图标的方法&#xff0c;希望对大家有所帮助。 设置显示word图标的方法&#xff1a; 按键盘上的 Windows 徽标健 …

计算机word图标不显示,word图标不显示怎么办 设置图标显示的具体方法

word是我们常用的办公软件&#xff0c;有时在使用时&#xff0c;图标会莫名其妙不显示&#xff0c;那么word图标不显示怎么办&#xff1f;下面小编带来设置显示word图标的方法&#xff0c;希望对大家有所帮助。 设置显示word图标的方法&#xff1a; 按键盘上的Windows徽标健R键…

Word生成图表(柱状图、线形图等,并附带表格展示数值)

说明 Java poi实现生成图表并附带表格数据展示一、效果图与模板 1、模板 2、效果图 二、Word生成图标与报表工具类 1.工具类 代码如下&#xff1a; package com.ml.module.file.util.wordchart;import com.google.common.base.Strings; import com.google.common.collec…

word中实现图表的自动编号功能

工作中&#xff0c;经常需要对图表进行编辑和编号&#xff0c;有的时候会涉及图表的顺序调整、增加或删除&#xff0c;刚刚调整好的图表的编号就会被打乱&#xff0c;有的时候还会漏调&#xff0c;从而导致即使耗费了大量的时间&#xff0c;图表的序号依然会出现问题&#xff0…

使用word代码域自动为图表 标号

当写一个比较几万字文档时&#xff0c;文章中可能会有很多 图表&#xff0c;而且下文引用上文的图表&#xff0c;手动敲的比较麻烦。 word的域是一个比较复杂的一个功能&#xff0c;今天通过word的代码域&#xff0c;提供两种方法来解决 自动为图生成图注&#xff0c;并引用&am…

Word图标显示异常空白解决方案

问题描述 最近使用电脑时突然发现桌面的word文档图标变成了空白&#xff0c;之前也遇到过这个问题&#xff0c;但一时想不起来之前是怎么解决的&#xff08;只记得是跟注册表相关&#xff09;&#xff0c;遂上网查找了一番&#xff0c;经过一两个小时折腾后终于解决了问题&…

用手机打开word图表位置很乱_9个工作中经常用到的Word技巧,能大大提升你的工作效率...

不管是职场小白还是职场大神&#xff0c;Word基本是我们都需要用到办公软件&#xff0c;所以今天跟大家分享9个超级实用的word技巧&#xff0c;学会了能让你的工作效率快到起飞&#xff0c;保姆级教程&#xff0c;一起来看看吧&#xff01; 1、不滚动鼠标快速翻到100页 文档第1…

电脑系统安装Word图标变成白色怎么恢复?

Win11 Word图标变成白色怎么恢复&#xff1f;有一些朋友发现自己电脑上的doc格式的word文档图标是白色的&#xff0c;这是怎么回事呢&#xff1f;出现这种情况应该如何解决&#xff1f;大家肯定要先确保电脑上有安装Office软件&#xff0c;今天给朋友们讲讲具体的解决方法&…

电脑桌面图标全部变成Word图标?

最近有用户发现自己的电脑桌面图标全部变成了Word文档图标&#xff0c;这是什么情况&#xff1f;到底是哪里出现了问题&#xff1f;针对这一问题&#xff0c;下面就由小编给大家分享桌面图标全部变成Word图标的解决办法。 操作步骤&#xff1a; 1、双击打开桌面的“计算机”。 …

POI Word 图表、柱状图、条形图、折线图、饼图

poi Excel 图表&#xff1a;https://blog.csdn.net/u014644574/article/details/105695787 1、pom.xml <dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>4.1.2</version></dependenc…

我计算机桌面的word图标改变了咋办,桌面上word图标异常的处理方法

今天打开电脑&#xff0c;不知什么原因&#xff0c;所有word图标都变成了灰色&#xff0c;能正常打开&#xff0c;但看起来非常不舒服&#xff0c;怎样让他恢复原来的样子呢&#xff0c;学习啦小编采取了以下几个操作步骤来恢复&#xff0c;有需要的朋友可以来看看哦。 解决Wor…