【运维】StarRocks数据迁移到新集群(针对于集群互通、不互通的情况)

文章目录

  • 一. 迁移整体思路
    • 1. 对于新旧集群互通的情况
    • 2. 对于新旧集群不互通的情况
  • 二、迁移过程(两个集群互通的情况)
    • 1. 备份过程
      • 1.1. 通过mysqlclient与starrocks进行关联
      • 1.2. 创建仓库与minio建立联系
      • 1.3. 备份数据到minio
    • 2. 迁移过程
      • 2.1. 通过mysqlclient与starrocks进行关联
      • 2.2. 在新集群中创建仓库
      • 2.3. 恢复数据到新集群
  • 二、迁移过程(两个集群不互通的情况)
    • 1. 集群A数据迁移到minioA
      • 1.1. 通过mysqlclient与starrocks进行关联
      • 1.2. 创建仓库与minioA建立联系
      • 1.3. 备份数据到minioA
    • 2. minioA数据迁移到minioB
      • 2.1. 下载minioA中的文件到本地
      • 2.2. 将文件上传到minioB
    • 3.minioB数据迁移到集群B
      • 3.1. 通过mysqlclient与starrocks进行关联
      • 3.2. 在新集群中创建仓库
      • 3.3. 恢复数据到新集群

一. 迁移整体思路

SR官网提供了分区、表和数据库级别的数据迁移策略,此方案通过数据库级别将数据迁移到新集群。

1. 对于新旧集群互通的情况

在这里插入图片描述

 

2. 对于新旧集群不互通的情况

在这里插入图片描述
 

二、迁移过程(两个集群互通的情况)

在这里插入图片描述

准备

规划

序号组件说明
1minio用于创建桶,将库备份放到minio的桶中
2集群A旧集群,用于将库迁移到minio中
3集群B新集群,从minio迁移数据到集群B

 
minio操作

# 1. 创建minio集群别名:用于后续操作;在任意minio节点
语法
/usr/local/minio/mc alias set ${minio_alias} ${minio_server} ${minio_user} ${minio_password}
实例
/usr/local/minio/mc alias set minio_data_starrocks http://server_minio:9019 admin Administrator123# 2. minio集群创建桶star11:用于存储数据备份
语法:
/usr/local/minio/mc mb ${minio_alias}/${bucket_name}
实例:
/usr/local/minio/mc mb minio_data_starrocks/star11

 

1. 备份过程

集群A(旧集群)数据迁移到minio:3个FE( poc1、2、3), 3个BE(poc4、5、6)的 StarRocks。

1.1. 通过mysqlclient与starrocks进行关联

mysql -h${starrocks_leader_host} -P9030 -uroot -pstar_rocks;

 

1.2. 创建仓库与minio建立联系

-- 1.  创建仓库
语法:
CREATE REPOSITORY `${repo_name}`
WITH BROKER
ON LOCATION "s3a://${bucket_name}/backup"
PROPERTIES
(
"aws.s3.enable_ssl" = "false",
"aws.s3.access_key" = "${minio_username}",
"aws.s3.enable_path_style_access" = "true",
"aws.s3.secret_key" = "${minio_password}",
"aws.s3.endpoint" = "${minio_server}"
);实例:
CREATE REPOSITORY `test_repo`
WITH BROKER
ON LOCATION "s3a://star11/backup"
PROPERTIES
(
"aws.s3.enable_ssl" = "false",
"aws.s3.access_key" = "admin",
"aws.s3.enable_path_style_access" = "true",
"aws.s3.secret_key" = "Administrator123",
"aws.s3.endpoint" = "minio_server:9009"
);-- 2. 展示仓库
show REPOSITORY `test_repo`;如果仓库创建失败,或重新创建同名仓库,则删除仓库命令如下
DROP REPOSITORY `test_repo`;删除仓库时后记得手动在minio上的文件。

 

1.3. 备份数据到minio

备份语法:https://docs.starrocks.io/zh/docs/2.5/sql-reference/sql-statements/data-definition/BACKUP/

-- 1.备份命令
-- 以下示例在数据库 radar_test 中创建数据快照 sr_member_backup(命名随意) 并备份至仓库 test_repo 中。BACKUP SNAPSHOT radar_test.radar_test_backup
TO test_repo
PROPERTIES ("type" = "full");-- 2. 查看数据库radar_test备份过程:
show backup from radar_test \G;*************************** 1. row ***************************JobId: 129388SnapshotName: radar_test_backupDbName: radar_testState: FINISHEDBackupObjs: [radar_test.20230815_baseurl], [radar_test.20230815_baseurl.csv], [radar_test.dim_report_pro_detail], [radar_test.dim_report_pro_logs], [radar_test.dwd_qdas_monitor_donelog_test], [radar_test.dwd_thjl_d_xky], [radar_test.dwd_thjl_d_xky2], [radar_test.dwd_thjl_d_xky_20240125], [radar_test.ftp_baseurl], [radar_test.ods_pc_user_portrait_detail], [radar_test.ods_pc_user_portrait_detail2], [radar_test.ods_thjl_d], [radar_test.t], [radar_test.test2_100m_pc_user_portrait_detail], [radar_test.test2_10m_pc_user_portrait_detail], [radar_test.test2_1m_pc_user_portrait_detail], [radar_test.test2_join_id], [radar_test.test_100m_pc_user_portrait_detail], [radar_test.test_10m_pc_user_portrait_detail], [radar_test.test_1m_pc_user_portrait_detail]CreateTime: 2024-03-14 15:05:03
SnapshotFinishedTime: 2024-03-14 15:05:09UploadFinishedTime: 2024-03-14 15:16:36FinishedTime: 2024-03-14 15:16:45UnfinishedTasks:Progress:TaskErrMsg: [129534: S3: Fail to complete multipart upload for object starrocks-1/backup/__starrocks_repository_test_repo/__ss_radar_test_backup/__ss_content/__db_10228/__tbl_18770/__part_19744/__idx_18771/__19845/02000000006a04786743e0da3614f6285f61e260bcdfc887_0.dat.part, msg: The specified multipart upload does not exist. The upload ID may be invalid, or the upload may have been aborted or completed.]Status: [OK]Timeout: 86400看到State为FINISHED,Status为OK说明备份完成TaskErrMsg和Status:会显示任务过程中Task的一些错误信息,但只要State列不为CANCELLED,
就说明作业依然在继续,这些Task有可能会重试成功。当然,有些Task错误,也会直接导致作业失败。

 
在这里插入图片描述

当一次备份作业涉及到的表和数据都很多时,我们需要不时关注作业状态,若发现任务长时间没有进度或有其他问题,也可以将任务手动取消,取消语法为:

mysql> CANCEL BACKUP FROM db_name;

 

2. 迁移过程

迁移到集群B(新集群):

2.1. 通过mysqlclient与starrocks进行关联

mysql -h ${clusterB_server} -P9031 -uroot -pstar_rocks

 

2.2. 在新集群中创建仓库

注意在新集群中使用相同仓库名和地址创建仓库,否则将无法查看先前备份的数据快照。

-- 1. 创建数据库 新集群中需要建库,迁移的表不需要创建。
create database radar_test;-- 2. 创建与A集群相同的仓库CREATE REPOSITORY `test_repo`
WITH BROKER
ON LOCATION "s3a://star11/backup"
PROPERTIES
(
"aws.s3.enable_ssl" = "false",
"aws.s3.access_key" = "admin",
"aws.s3.enable_path_style_access" = "true",
"aws.s3.secret_key" = "Administrator123",
"aws.s3.endpoint" = "${minio_server}:9019"
);-- 3. 查看仓库SHOW REPOSITORIES;-- 如果创建仓库失败,或想重新创建。使用如下命令删除仓库
DROP REPOSITORY test_repo;

 

2.3. 恢复数据到新集群

-- 在(旧集群)A集群中执行
-- 1. 连接A集群
mysql -h${star_rocks_cluster_fe_leader} -P9030 -uroot  -pstar_rocks;-- 查看备份快照信息,用于恢复使用
mysql> SHOW SNAPSHOT ON test_repo;
+-------------------+-------------------------+--------+
| Snapshot          | Timestamp               | Status |
+-------------------+-------------------------+--------+
| radar_test_backup | 2024-03-14-15-05-03-957 | OK     |
+-------------------+-------------------------+--------+-- 在(新集群)B集群中执行
-- 2. 将仓库 test_repo 中的数据快照 radar_test_backup恢复到数据库中radar_test,恢复三个数据副本。
-- 语法
RESTORE SNAPSHOT ${clusterB_database}.${clusterA_Snapshot_name}
FROM test_repo
PROPERTIES ("backup_timestamp"="${clusterA_Snapshot_Timestamp}","replication_num" = "3"
);-- 执行实例
RESTORE SNAPSHOT radar_test_1.radar_test_backup
FROM test_repo
PROPERTIES ("backup_timestamp"="2024-03-14-15-05-03-957","replication_num" = "3"
);Query OK, 0 rows affected (1.77 sec)-- 3. 查看备份进度SHOW RESTORE from radar_test \G;*************************** 1. row ***************************JobId: 10078Label: radar_test_backupTimestamp: 2024-03-14-15-05-03-957DbName: radar_testState: FINISHEDAllowLoad: falseReplicationNum: 1RestoreObjs: ... 会展示所有表和分区CreateTime: 2024-03-15 11:28:04MetaPreparedTime: 2024-03-15 11:28:07
SnapshotFinishedTime: 2024-03-15 11:28:10
DownloadFinishedTime: 2024-03-15 11:28:43FinishedTime: 2024-03-15 11:30:03UnfinishedTasks:Progress:TaskErrMsg:Status: [OK]Timeout: 86400如果StateFINISHEDStatus[OK],则迁移数据到新集群完成。

 

二、迁移过程(两个集群不互通的情况)

在这里插入图片描述

规划

序号组件说明
1minioA用于创建桶,将库备份放到minioA的桶中
2集群A旧集群,用于将库迁移到minioA中
3minioBminioA的数据迁移到minioB中
4集群B新集群,从minioB迁移数据到集群B

minioA操作

. minioA操作
# 1. 创建minioA集群别名:用于后续操作;在任意minio节点
语法
/usr/local/minio/mc alias set ${minio_alias} ${minio_server} ${minio_user} ${minio_password}# 2. minioA集群创建桶star11:用于存储数据备份
语法:
/usr/local/minio/mc mb ${minio_alias}/${bucket_name}
实例:
/usr/local/minio/mc mb minio_data_starrocks/star11

 

1. 集群A数据迁移到minioA

集群A(旧集群)数据迁移到minio:3个FE( poc1、2、3), 3个BE(poc4、5、6)的 StarRocks。

 

1.1. 通过mysqlclient与starrocks进行关联

1.2. 创建仓库与minioA建立联系

1.3. 备份数据到minioA

如上过程参考:集群互通时的操作

 

2. minioA数据迁移到minioB

现在我们将minioA的文件下载到本地,然后从本地上传到minioB

 

2.1. 下载minioA中的文件到本地

# 将minioA中的桶star11的数据备份到/home/taiyi/minio-data目录
# 创建目录
mkdir -p /home/taiyi/minio-data/
# 备份到本地
语法
# /usr/local/minio/mc cp --recursive ${minioA_alias}/${bucket_name}/ ${local_dir}
实例
/usr/local/minio/mc cp --recursive minio_data_starrocks/star11/ /home/taiyi/minio-data/

 

2.2. 将文件上传到minioB

因为网络不互通,需要将文件从上述位置拷贝到minioB的客户端机器中,具体方法不再描述,用户自行操作。

现在

# 1. 设用户已将数据上传到minioB的客户机目录/home/taiyi/minio-data/下# 2. 创建minioB集群别名:用于后续操作;在任意minioB的客户端节点
语法
/usr/local/minio/mc alias set ${minioB_alias} ${minioB_server} ${minioB_user} ${minioB_password}# 3. minioB集群创建桶star11:用于上传数据备份
语法:
/usr/local/minio/mc mb ${minioB_alias}/${bucket_name}
实例:
/usr/local/minio/mc mb minio_data_starrocks_restore/star11# 4. 将文件夹下/home/taiyi/minio-data/所有数据上传到minioB中star11的桶中/usr/local/minio/mc cp --recursive  /home/taiyi/minio-data/ minio_data_starrocks_restore/star11/

 

3.minioB数据迁移到集群B

迁移到集群B(新集群):

3.1. 通过mysqlclient与starrocks进行关联

3.2. 在新集群中创建仓库

3.3. 恢复数据到新集群

如上过程参考:集群互通时的操作

 
参考:
https://blog.csdn.net/ult_me/article/details/123235041

https://blog.csdn.net/gongxiucheng/article/details/132675927

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2869932.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

win10 + cpu + pycharm + mindspore

MindSpore是华为公司自研的最佳匹配昇腾AI处理器算力的全场景深度学习框架。 1、打开官网: MindSpore官网 2、选择以下选项: 3、创建conda 环境,这里python 选择3.9.0,也可以选择其他版本: conda create -c conda-…

计算机设计大赛 题目:基于机器视觉opencv的手势检测 手势识别 算法 - 深度学习 卷积神经网络 opencv python

文章目录 1 简介2 传统机器视觉的手势检测2.1 轮廓检测法2.2 算法结果2.3 整体代码实现2.3.1 算法流程 3 深度学习方法做手势识别3.1 经典的卷积神经网络3.2 YOLO系列3.3 SSD3.4 实现步骤3.4.1 数据集3.4.2 图像预处理3.4.3 构建卷积神经网络结构3.4.4 实验训练过程及结果 3.5 …

SQLiteC/C++接口详细介绍之sqlite3类(十八)

返回目录:SQLite—免费开源数据库系列文章目录 上一篇:SQLiteC/C接口详细介绍之sqlite3类(十七) ​ 56.sqlite3_update_hook 函数功能:向应用程序通知每一个 INSERT、UPDATE 或 DELETE 语句。 当INSERT、UPDATE或D…

HarmonyOS(二十)——管理应用拥有的状态之LocalStorage(页面级UI状态存储)

LocalStorage是页面级的UI状态存储,通过Entry装饰器接收的参数可以在页面内共享同一个LocalStorage实例。LocalStorage也可以在UIAbility实例内,在页面间共享状态。 本文仅介绍LocalStorage使用场景和相关的装饰器:LocalStorageProp和LocalS…

【模电技术从入门到精通到放弃】半导体基础知识

目录 🤩🤩🤩前言 Hello,大家好。我是CSDN厉昱辰。很高兴能够跟大家再次探索模电知识,那就让我们在接下来的日子里,一起去分享模电的相关知识,共同去讨论关于模电的相关问题! &#…

第七篇【传奇开心果系列】Python自动化办公库技术点案例示例:深度解读数据分析数据挖掘的几个重要算法为代表的核心技术

传奇开心果博文系列 系列博文目录Python自动化办公库技术点案例示例系列 博文目录前言一、重要算法介绍二、回归分析示例代码三、聚类分析示例代码四、决策树示例代码五、关联规则挖掘示例代码六、神经网络示例代码七、支持向量机示例代码八、聚类分析示例代码九、主成分分析示…

React低代码平台实战:构建高效、灵活的应用新范式

文章目录 每日一句正能量前言一、React与低代码平台的结合优势二、基于React的低代码平台开发挑战三、基于React的低代码平台开发实践后记好书推荐编辑推荐内容简介作者简介目录前言为什么要写这本书 读者对象如何阅读本书 赠书活动 每日一句正能量 人生之美,不在争…

【机器学习】分类模型的评价方法

🌻个人主页:相洋同学 🥇学习在于行动、总结和坚持,共勉! #学习笔记# 目录 一、混淆矩阵(Confusion Matrix) 二、评估指标(Evaluation metrics) 1.正确率(accuracy) …

Type-C接口CC连接过程

1、CC线连接过程 DFP和UFP会实时监控CC1和CC2引脚的电压,来评估DFP和UFP是否都已经在位。同时DFP可以根据电压确定自己所能提供的电流的大小 2、连接过程 Source端使用一个MOS管去控制Vbus,初始状态下,FET为关闭状态,Vbus不通。S…

在Windows上编译QGC 4.3.0

软件版本: QGC4.3.0QT6.6.1VSvs2019 1. 下载和安装 QT 官网安装包下载地址 qt-unified-windows-x64-4.6.1-online.exehttps://download.qt.io/official_releases/online_installers/命令行中运行: .\qt-unified-windows-x64-4.6.1-online.exe --mirro…

NeRF学习——NeRF-Pytorch的源码解读

学习 github 上 NeRF 的 pytorch 实现项目(https://github.com/yenchenlin/nerf-pytorch)的一些笔记 1 参数 部分参数配置: 训练参数: netdepth:神经网络的层数。默认值为8 netwidth:每层的通道数。默认…

代码随想录算法训练营三刷day25 | 回溯 之 216.组合总和III 17.电话号码的字母组合

三刷day25 216.组合总和III剪枝 17.电话号码的字母组合 216.组合总和III 题目链接 解题思路: 选取过程如图: 图中,可以看出,只有最后取到集合(1,3)和为4 符合条件。 递归三部曲 确定递归函数参…

如何通过人才测评系统来寻找个人的潜能

潜力这个词,有的时候真是虚无缥缈,人们总说人的潜力是无限,又总说人的潜力是有限的,想一想两句话也都有道理,人的潜能怎么可能无限大?但在某些时候,你也许可以做的更好,但是对于这个…

【Java基础】IO流(三):字符流的FileReader(文件字符输入流)和 FileWriter(文件字节输出流)

目录 字符流 1、FileReader(字符输入流) 1.1、无参的read( )方法示例 ​编辑 1.2、有参的read(char[ ] buffer)方法示例 2、FileWriter(字符输出流) 字符流 字符流的底层其实就是字节流,即字符流 字节流 字符集…

sqllab第二十六关通关笔记

知识点: 空格替换 %09 %0a %0b %0c %0d %a0 (%2b)or替换:|| ||是不需要空格区分的and替换:&& &&同样不需要空格区分的双写绕过,但是绕过后需要和内容进行空格区分的,要不然不发挥作用;这关…

unity学习(61)——hierarchy和scene的全新认识+模型+皮肤+动画controller

刚刚开始,但又结束的感觉? 1.对hierarchy和scene中的内容有了全新的认识 一定要清楚自己写过几个scene;每个scene之间如何跳转;build setting是add当前的scene。 2.此时的相机需要与模型同级,不能在把模型放在相机下…

最细节操作 Linux LVM 逻辑卷管理

Linux LVM(逻辑卷管理) 周末愉快,今天带大家实战一下LVM! 一、LVM理论 LVM,即Logical Volume Manager,逻辑卷管理器,是一种硬盘的虚拟化技术,可以允许用户的硬盘资源进行灵活的调整和动态管理…

数学建模博弈理论与实践国防科大版

目录 4.博弈模型 4.1.Nash平衡点和帕雷托最优 4.2.囚徒困境 4.3.智猪博弈 4.4.脏脸之谜 5.军事问题数学建模 5.1.兰彻斯特作战模型 5.1.1.一般战斗模型 5.1.2游击战模型 5.1.3.混合战模型 5.2.硫磺岛战役 4.博弈模型 本讲介绍博弈模型,包括博弈论&#x…

C/C++整数和浮点数在内存中存储

1. 整数在内存中的存储: 整数的2进制表⽰⽅法有三种,即 原码、反码和补码 三种表⽰⽅法均有符号位和数值位两部分,符号位都是⽤0表⽰“正”,⽤1表⽰“负”,⽽数值位最 ⾼位的⼀位是被当做符号位,剩余的都是…

Redis远程连接本机——Docker

1. Docker拉取redis镜像并创建容器 1.1 拉取redis镜像 如果要指定redis版本,需要使用redis:(版本),不写默认最新版本 docker pull redis1.2 创建容器并挂载配置文件 创建一个redis目录,并在其创建一个conf目录和一个d…