Redis中数据分片与分片策略

概述

数据分片是一种将数据分割并存储在多个节点上的技术,可以有效提高系统的扩展性和性能。在Redis中,数据分片主要用于解决单个实例存储容量和性能瓶颈的问题。通过将数据分散存储到多个Redis节点中,可以将负载均衡到不同的服务器上,提高系统的吞吐量和响应速度。

数据分片的原理与实现方式

数据分片是一种将大规模数据分割并存储在多个节点上的技术,旨在提高系统的容量和性能。在Redis中,数据分片的实现方式和原理主要有两种:客户端分片和服务端分片。

客户端分片

客户端分片是指由客户端应用程序负责将数据分割并分配到不同的Redis节点上。具体步骤如下:

  1. 分片规则定义: 客户端根据一定的规则将数据进行分片,通常使用哈希函数或范围规则来确定数据应该存储在哪个节点上。

  2. 分片映射表维护: 客户端维护一个分片映射表,记录每个数据项对应的Redis节点信息,以便于后续的数据读写操作。

  3. 数据路由: 客户端根据分片规则选择合适的Redis节点进行数据操作,确保数据存储和读取的正确性和一致性。

客户端分片的优点是实现简单、灵活性高,但缺点是需要客户端维护分片映射表,并且可能会出现数据倾斜的情况。

服务端分片

服务端分片是指由Redis集群负责将数据分割并存储在多个节点上,客户端无需关心数据的具体分片情况,只需将请求发送到任意一个Redis节点即可。具体步骤如下:

  1. 分片规则定义: Redis集群定义了一套分片规则,用于确定数据应该存储在哪个节点上,通常使用哈希函数或一致性哈希算法来实现。

  2. 数据路由: 客户端将数据请求发送到任意一个Redis节点,集群会根据分片规则将请求路由到正确的节点上进行处理。

  3. 数据分发: Redis集群负责将数据按照分片规则分发到各个节点上进行存储和管理。

服务端分片的优点是实现简单、透明度高,客户端无需关心数据的具体分片情况,但缺点是集群规模的扩展和缩减可能会引起数据的迁移和重新分片,影响系统的稳定性和性能。

选择分片方式的考虑因素

在选择数据分片的方式时,需要考虑以下因素:

  • 系统复杂度: 客户端分片相对较为简单,适用于小规模系统;而服务端分片适用于大规模系统,但实现和维护的复杂度较高。

  • 数据一致性: 服务端分片能够保证数据的一致性和完整性,而客户端分片可能会出现数据不一致的情况。

  • 扩展性和灵活性: 客户端分片具有较高的灵活性,可以根据业务需求定制分片规则,但集群规模的扩展和缩减可能会受到限制;而服务端分片具有较好的扩展性和灵活性,但受制于集群规模的限制。

根据实际业务需求和系统规模,选择合适的数据分片方式是确保系统高效运行和稳定性的关键。

数据分片策略

数据分片是将大规模数据分割成多个部分,并分布存储在不同的节点上,以提高系统的容量和性能。在Redis中,实现数据分片的策略通常包括以下几种:

哈希分片

哈希分片是将数据的键通过哈希函数计算得到哈希值,然后根据哈希值的范围将数据分配到不同的节点上。常见的哈希函数有MD5、SHA1等,可以将数据均匀地分散到不同的节点上。哈希分片的特点是简单高效,但可能会出现数据倾斜的情况,即部分节点存储的数据量过大,而另一部分节点存储的数据量较小。

一致性哈希分片

一致性哈希分片是一种基于一致性哈希算法的数据分片策略,它将数据的键通过哈希函数计算得到哈希值,并将哈希值映射到一个环形的哈希空间中。每个节点在哈希空间中占据一个区域,数据的键根据其哈希值顺时针寻找下一个节点,直到找到一个节点为止。这样可以保证数据在节点之间均匀分布,且节点的增加和删除对数据的影响较小。

范围分片

范围分片是将数据的键按照一定的范围进行划分,并将不同范围的数据存储到不同的节点上。例如,可以根据数据的键的字母顺序或数字大小来划分范围,然后将相应范围内的数据存储到对应的节点上。范围分片的优点是可以根据业务需求灵活划分数据的范围,但可能会出现数据不均匀分布的情况。

混合分片

混合分片是将多种分片策略结合起来使用,以充分利用各种分片策略的优点,提高数据的均匀分布和系统的容错能力。例如,可以先使用一致性哈希分片将数据分配到不同的虚拟节点上,然后再使用范围分片将虚拟节点分配到不同的物理节点上,以实现数据的均匀分布和节点的负载均衡。

数据分片策略的选择

在选择数据分片策略时,需要考虑以下因素:

  • 数据均衡性: 数据分片策略应确保数据在各个节点上均匀分布,避免出现数据倾斜的情况。

  • 节点扩缩容: 数据分片策略应具备良好的扩缩容性能,当节点数量发生变化时,能够尽量减少数据迁移的成本。

  • 系统复杂度: 数据分片策略应尽量简单易实现,降低系统的复杂度和维护成本。

  • 数据一致性: 数据分片策略应保证数据的一致性和完整性,避免数据丢失或损坏的情况。

根据实际业务需求和系统规模,选择合适的数据分片策略是确保系统高效运行和稳定性的关键。

一致性哈希算法

  1. 首先求出服务器(节点)的哈希值,并将其配置到0~2^32的圆(continuum)上。

  2. 然后采用同样的方法求出存储数据的键的哈希值,并映射到相同的圆上。

  3. 然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器上。如果超过2^32仍然找不到服务器,就会保存到第一台服务器上。

Redis集群分片机制

Redis 集群没有使用一致性hash, 而是引入了哈希槽的概念。

Redis Cluster 采用虚拟哈希槽分区,所有的键根据哈希函数映射到 0 ~ 16383 整数槽内,每个key通过CRC16校验后对16384取模来决定放置哪个槽(Slot),每一个节点负责维护一部分槽以及槽所映射的键值数据。在Redis Cluster中,只有Master才拥有槽的所有权,如果是某个Master的slave,这个slave只负责槽的使用,但是没有所有权。计算公式:slot = CRC16(key) % 16383。

(1)假设主节点的数量为3,将16384个槽位按照用户自己的规则手动去分配这3个节点,16384除以3,那么每个节点大约得到5460个槽。(用户自定义分配的原因在于有些机器的配置高,有些机器的配置低,配置高的可以分配多一点槽位,配置低的可以分配少一点槽位)

图中定义的规则是平均分配槽位:

  1. 节点1的槽位区间范围为0-5460,

  2. 节点2的槽位区间范围为5461-10922

  3. 节点3的槽位区间范围为10923-16383

(2)存储数据时,对要存储的键进行crc16哈希运算,得到一个值,并取模16384,判断这个值在哪个节点的范围区间。

假设crc16(“test_key”)%16384=3345,

因为3345在区间0-5460之间,

所以test_key数据写入到节点1里面。

(3)查询数据时,对要查询的键进行crc16哈希运算,得到一个值,并取模16384,判断这个值在哪个节点的范围区间。

假设crc16(“test_key”)%16384=3345,

因为3345在区间0-5460之间,

所以test_key数据应该从节点1里面获取。

以上就是redis集群采用的虚拟哈希槽的原理和计算规则说明,是不是没有想象的那么复杂。

这种结构很容易添加或者删除节点,并且无论是添加删除或者修改某一个节点,都不会造成集群不可用的状态。使用哈希槽的好处就在于可以方便的添加或移除节点。

  1. 当需要增加节点时,只需要把其他节点的某些哈希槽挪到新节点就可以了。

  2. 当需要移除节点时,只需要把移除节点上的哈希槽挪到其他节点就可以了。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3248564.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Qt5.12.2安装教程

文章目录 文章介绍下载连接安装教程 文章介绍 安装Qt5.12.2 下载连接 点击官网下载 安装包下载完毕 安装教程 点开设置,添加临时储存库,复制连接“https://download.qt.io/online/qtsdkrepository/windows_x86/root/qt/” 点击测试&#xff0…

NetSuite Item Receipt的头行To Location字段设置

最近用户有碰到一个问题是说,在没有转移或者调整,发出货品的情况下,为什么在Item Receipt上明明写的是Location A,而对应的库存却到了Location B中呢?有点奇怪,查明原因后是与To Location的头行设置与改动相…

Stable Diffusion【艺术风格】:当游戏角色遇上古代纸莎草纸艺术

提示词[character] as Oni demon | full body | ancient papyrus art | Goryeo blueprint mapping[角色] 饰演 Oni demon |全身 |古代纸莎草纸艺术 |高丽蓝图映射** 纸莎草纸艺术**通常指的是古埃及时期使用纸莎草纸进行书写和绘画的艺术形式。纸莎草纸(Papyrus&…

【数据结构】Splay详解

Splay 引入 Splay旋转操作splay操作插入操作查询x排名查询排名为x删除操作查询前驱/后继模板Splay时间复杂度分析 进阶操作截取区间区间加,区间赋值,区间查询,区间最值区间翻转原序列整体插入指定位置插入整体插入末尾区间最大子段和 一些好题…

学会这个技巧,电子画册制作从此不再难

​在数字化时代,电子画册作为一种新型的宣传和展示工具,已经越来越受到企业和个人的青睐。它不仅能够以生动活泼的形式展示内容,还能够实现高度的互动性和分享性,从而大大提高信息的传播效率。然而,制作一款精美且功能…

【机器学习】机器学习与图像分类的融合应用与性能优化新探索

文章目录 引言第一章:机器学习在图像分类中的应用1.1 数据预处理1.1.1 数据清洗1.1.2 数据归一化1.1.3 数据增强 1.2 模型选择1.2.1 卷积神经网络1.2.2 迁移学习1.2.3 混合模型 1.3 模型训练1.3.1 梯度下降1.3.2 随机梯度下降1.3.3 Adam优化器 1.4 模型评估与性能优…

GESP CCF C++ 七级认证真题 2024年6月

第 1 题 下列C代码的输出结果是&#xff08; &#xff09;。 #include <iostream> #include <cmath> using namespace std; int main() { cout << sin(3.1415926 / 2); return 0; } A. 0 B. 1 C.0.5 D.0.7071 第 2 题 对于如下图的二叉树&#x…

【免费】中国电子学会所有历年真题卷全部免费

今天登录到csdn 遇到一件非常气愤的事情 原本就是电子学会网站的试卷 某些博主为了赚那么点钱 真的是不要Face了 之前没有放开资源 是因为懒得整理 为了这个不要face 花了我一下午时间把所有的资源整合在一起 现在全部拿走 全部免费&#xff01;全部免费&#xff01;全…

【网络】掌握网络基础概念

文章目录 OSI七层模型TCP/IP五层&#xff08;或四层&#xff09;模型为什么要有TCP/IP协议网络传输的基本流程网络传输流程图数据包封装和分用 网络中的地址管理IP地址Mac地址比较IP地址和Mac地址 OSI七层模型 OSI即Open System Interconnection,开发系统互连。OSI七层模型是一…

ABAP 物料主数据屏幕增强记录

参考文章&#xff1a;https://zhuanlan.zhihu.com/p/692818545 先从SPRO进入——》SAP 参考IMG——》后勤_常规——》物料主数据——》配置物料主记录——》创建定制子屏幕的程序 然后会让你创建一个函数组,此处命名为ZTEST2 &#xff08;后面才发现这张图截图不对&#xf…

昇思25天学习打卡营第13天|LLM-基于MindSpore实现的GPT对话情绪识别

打卡 目录 打卡 预装环境 流程简述 部分执行结果演示 词向量加载过程 模型结构 模型训练过程 模型预测过程 代码 预装环境 pip install -i https://pypi.mirrors.ustc.edu.cn/simple mindspore2.2.14 pip install mindnlp pip install jieba pip install spacy pip …

Typescript 实现倒计时功能 useCountdown

效果图 代码块 useCountdown.ts import {onUnmounted, reactive, ref, watch} from "vue";type union days | hours | minutes | seconds | millisecondsexport type Remains Record<union, number>;/*** 创建一个倒计时** 用法*/ export const useCountDo…

Python酷库之旅-第三方库Pandas(029)

目录 一、用法精讲 74、pandas.api.interchange.from_dataframe函数 74-1、语法 74-2、参数 74-3、功能 74-4、返回值 74-5、说明 74-6、用法 74-6-1、数据准备 74-6-2、代码示例 74-6-3、结果输出 75、pandas.Series类 75-1、语法 75-2、参数 75-3、功能 75-4…

C语言函数:编程世界的魔法钥匙(2)

引言 注&#xff1a;由于这部分内容比较抽象&#xff0c;而小编我又是一个刚刚进入编程世界的计算机小白&#xff0c;所以我的介绍可能会有点让人啼笑皆非。希望大家多多包涵&#xff01;万分感谢&#xff01;待到小编我学有所成&#xff0c;一定会把这块知识点重新介绍一遍&a…

【JAVA基础】反射

编译期和运行期 首先大家应该先了解两个概念&#xff0c;编译期和运行期&#xff0c;编译期就是编译器帮你把源代码翻译成机器能识别的代码&#xff0c;比如编译器把java代码编译成jvm识别的字节码文件&#xff0c;而运行期指的是将可执行文件交给操作系统去执行&#xff0c; …

Linux介绍和文件管理

一Linux的起源 1.Unix Dennis Ritchie和Ken Thompson发明了C语言&#xff0c;而后写出了Unix的内核 2.Minix MINIX是一种基于微 内核架构的类UNIX计算机操作系统&#xff0c;由 Andrew S. Tanenbaum发明 3.Linux内核 芬兰赫尔辛基大学的研究生Linus Torvalds基于Gcc、 ba…

stack与queue的介绍与使用

stack 栈&#xff08;stack&#xff09;是一种遵循先入后出&#xff08;FILO&#xff09;逻辑的线性数据结构。其只能从容器的一端进行元素的插入与提取操作。 我们可以把他比作串串&#xff0c;我们在串肉的时候都是从底依次往上串肉&#xff0c;然后在吃的时候是从串顶依次…

springboot websocket 知识点汇总

以下是一个详细全面的 Spring Boot 使用 WebSocket 的知识点汇总 1. 配置 WebSocket 添加依赖 进入maven官网, 搜索spring-boot-starter-websocket&#xff0c;选择版本, 然后把依赖复制到pom.xml的dependencies标签中 配置 WebSocket 创建一个配置类 WebSocketConfig&…

platformIO STM32 upload-“Failed to init device.”问题解决

因为发现自己的32板子有带自动下载功能&#xff0c;platformIO也支持串口下载&#xff0c;但一直提示这个问题 问题情况 问题解决 把BOOT0接3.3V&#xff0c;BOOT1接GND&#xff0c;再点击下载(之后接回去复位也可以显示) 这是我从一个有相同问题的人从他尝试过的解决方案中…

手动添加node包给nvm管理

1.下载二进制包文件&#xff1a;https://nodejs.org/zh-cn/download/prebuilt-binaries 2.解压后&#xff0c;改名为v20.15.1。 3.放入nvm文件夹下&#xff1a; 4.运行命令即可查看&#xff1a;nvm ls 5.命令大全&#xff1a; 更新 nvm&#xff1a; nvm install-latest-npm…