三分钟快速理解Flink 作业提交流程(包工头的工程之路)

核心组件

我们先来简单了解一下 flink 作业提交涉及到的组件

同时,如果不了解 Yarn 的同学欢迎跳转到这篇文章,了解一下健鑫集团的工程承包流程(doge):

三分钟快速理解Yarn的工作流程

JobManager

JobManager 是整个flink作业的管理者 包含 Dispatcher、ResourceManager 以及 JobMaster

Dispatcher

主要用来接收 client 提交的 flink 作业,为 flink 作业启动一个 JobMaster

JobMaster

负责一个 flink 作业

作业提交阶段,将逻辑执行计划转换为物理执行计划

部署阶段,向ResourceManager 请求执行 flink 作业执行所需要的资源,将任务分发到不同的节点上去运行

运行阶段,对任务的运行进行持续的监控和协调;比如:进行checkpoint、故障恢复、异常容错等

TaskManager

flink 实际处理作业的组件

client

主要帮助用户将 flink 作业提交到对应环境上去运行

Flink 作业提交部署流程

首先,简单来就是:

用户提交作业 -> 生成逻辑执行计划 -> 物理执行计划 -> 启动 master 节点,申请对应资源(包工头去跟 boss 申请资源) -> master 节点将任务分发到 worker 节点上去执行(包工头雇佣农民工,给农民工分配任务、发工资)

  1. 用户提交 flink 作业到client

  2. client 将 flink 作业中的数据处理逻辑转换成 JobGraph,JobGraph 可以简单理解为逻辑执行计划。然后 client 将作业提交到Dispatcher 中

  3. Dispatcher 对程序进行分发,启动一个JobMaster 解析 JobGraph

  4. JobMaster 将 JobGraph 解析成 ExecutionGraph,ExecutionGraph 可以简单理解成物理执行计划,解析完成之后,JobMaster 就会知道作业运行需要多少资源

  5. JobMaster 向 ResourceManager 申请运行 flink 作业所需要的 TaskManager,ResourceManaager 向资源管理系统(比如 Yarn)申请对应的资源;ResourceManager 申请到资源之后,在对应的资源节点上启动 TaskManager

  6. TaskManager 启动之后向 ResourceManager 注册并提供Task Solt(Task Solt 是 flink 资源分配的最小单位)

  7. JobMaster 将 flink 作业分发到 TaskManager 的 Task Solt 上去运行

END

本文介绍了 flink 作业的提交流程,希望可以帮助到你

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2980424.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

“PowerInfer:消费级GPU上的高效大型语言模型推理引擎“

PowerInfer是由上海交通大学IPADS实验室开发的一个高效大型语言模型(LLM)推理引擎,专为个人电脑(PC)上的消费者级GPU设计。它通过利用LLM推理中的高局部性,实现了快速且资源消耗低的模型推理,这…

深入探究图像增强(C语言实现)

我们将从基础出发使用C语言进行图像处理与分析,重点讨论图像增强和平滑技术。图像增强技术旨在通过增加对比度、亮度和整体清晰度来改善图像的视觉质量。另一方面,图像平滑方法则用于减少噪声并减少图像中的突变,使图像更加均匀和视觉上吸引人…

Github Copilot正版的激活成功,终于可以chat了

Github Copilot 代码补全等功能,提高写代码的效率 https://web.52shizhan.cn/activity/copilot 登录授权后,已经可以使用,完美。如图

OpenFE:开启数据特征工程新时代

OpenFE:开启数据特征工程新时代 数据特征工程是机器学习和数据分析领域中至关重要的一环,它涉及对原始数据进行处理和转换,以提取出有用的特征,为模型构建和预测提供更好的输入。在这个领域中,Python库OpenFE为数据科学…

查找两个字符串的最长公共子串

暴力解法 #include <iostream> #include <vector> #include <cstring> using namespace std; string a, b, minn ""; // a和b是我们输入的 // minn存储的是我们最小的那个字符串string cut(int l, int r) {string tmp "";for (int i …

大小端解释以及如何使用程序判断IDE的存储模式

今天让我们来了解一下大小端的概念吧 什么是大小端&#xff1f; 大端&#xff08;存储&#xff09;模式&#xff1a;指的是数据的低位保存在内存的高地址处&#xff0c;而数据的高位则保存在内存的低地址处。 小端&#xff08;存储&#xff09;模式&#xff1a;指的是数据的低位…

Discuz! X系列版本安装包

源码下载地址&#xff1a;Discuz! X系列版本安装包 很多新老站长跟我说要找Discuz! X以前的版本安装包&#xff0c;我们做Discuz! X开发已经十几年了&#xff0c;这些都是官方原版安装包&#xff0c;方便大家使用&#xff08;在官网已经找不到这些版本的安装包了&#xff09; …

新网站上线需要注意什么?

质量保证&#xff1a;确保网站的所有功能和页面都经过了充分的测试&#xff0c;并且在各种不同的浏览器和设备上都能够正常运行。检查所有链接、表单和交互式元素&#xff0c;确保它们都能够按照预期工作。优化性能&#xff1a;确保网站加载速度快&#xff0c;响应迅速。优化图…

详细UI色彩搭配方案分享

UI 配色是设计一个成功的用户界面的关键之一。UI 配色需要考虑品牌标志、用户感受、应用程序的使用场景&#xff0c;这样可以帮助你创建一个有吸引力、易于使用的应用程序。本文将分享 UI 配色的相关知识&#xff0c;帮助设计师快速构建 UI 配色方案&#xff0c;以满足企业的需…

环回光模块

&#x1f44f;&#x1f4cd;环回光模块&#xff08;Lookback&#xff09;&#xff0c;也称为光模块自环测试回路器&#xff0c;用于测试系统或网络中的信号回传。通过回传信号&#xff08;主要是成对连接发射端到接收端的一侧&#xff09;&#xff0c;可以检测网络链路中各种潜…

文件上传的复习(upload-labs1-5关)

什么是文件上传漏洞&#xff1f; 文件上传本身是一个正常的业务需求&#xff0c;对于网站来说&#xff0c;很多时候也确实需要用户将文件上传到服务器&#xff0c;比如&#xff1a;上传图片&#xff0c;资料。 文件上传漏洞不仅涉及上传漏洞这个行为&#xff0c;还涉及文件上…

安卓手机投屏到电脑:实现屏幕共享的实用指南

“吃饭的时候觉得手机看剧实在是太费眼睛了&#xff0c;终于经过一番摸索、试验&#xff0c;我探索出了新大陆&#xff01;只要将安卓手机投屏到电脑&#xff0c;就可以放大画面&#xff0c;还能同步操作&#xff0c;远离屏幕的同时还能够看清视频&#xff01;这些方法太实用啦…

JS -正则表达式

正则表达式 关于正则表达式&#xff0c;其实我写过几篇了&#xff0c;但是真正的正则表达式其实主要用于定义一些字符串的规则&#xff0c;计算机根据给出的正则表达式&#xff0c;来检查一个字符串是否符合规则。 我们来看一下&#xff0c;在JS中如何创建正则表达式对象。 语…

公链系统开发全指南: 从规划到实施

在区块链技术的迅速发展和应用推广下&#xff0c;公链系统的开发成为了当前数字资产领域的热门话题。从规划到实施&#xff0c;公链系统的开发过程需要经历多个步骤&#xff0c;下文将详细介绍每个步骤。 第一步: 规划和设计 市场调研: 分析市场需求和竞争情况&#xff0c;确定…

Power BI 如何创建页面导航器?(添加目录按钮/切换页面按钮)

Power BI 中页导航是什么&#xff1f; 在Power BI中&#xff0c;页导航&#xff08;Page Navigation&#xff09;是指在报告中创建多个页面&#xff08;页&#xff09;&#xff0c;然后允许用户在这些页面之间进行导航的功能。 如下图所示&#xff0c;页导航的选项和报告中的…

多模态模型

转换器成功作为构建语言模型的一种方法&#xff0c;促使 AI 研究人员考虑同样的方法是否对图像数据也有效。 研究结果是开发多模态模型&#xff0c;其中模型使用大量带有描述文字的图像进行训练&#xff0c;没有固定的标签。 图像编码器基于像素值从图像中提取特征&#xff0c;…

调度问题变形的贪心算法分析与实现

调度问题变形的贪心算法分析与实现 一、问题背景与算法描述二、算法正确性证明三、算法实现与分析四、结论 一、问题背景与算法描述 带截止时间和惩罚的单位时间任务调度问题是一个典型的贪心算法应用场景。该问题的目标是最小化超过截止时间导致的惩罚总和。给定一组单位时间…

基于51单片机的数码管显示的proteus仿真

文章目录 一、数码管二、单个数码管显示0~F仿真图仿真程序 三、数码管静态显示74HC138译码器74HC245缓冲器仿真图仿真程序 四、数码管动态显示仿真图仿真程序 三、总结 一、数码管 数码管&#xff0c;也称作辉光管&#xff0c;是一种可以显示数字和其他信息的电子设备。它的基…

毕业撒花 流感服务小程序的设计与实现

目录 1.1 总体页面设计 1.1.1 用户首页 1.1.2 新闻页面 1.1.3 我的页面 1.1.5 管理员登陆页面 1.1.6 管理员首页 1.2 用户模块 1.2.1 体检预约功能 1.2.2 体检报告功能 1.2.4 流感数据可视化功能 1.2.5 知识科普功能 1.2.6 疾病判断功能 1.2.7 出示个人就诊码功能 …

2(第一章,数据管理)

目录 概述 基本概念 数据与信息 数据管理原则 1. 数据是有独特属性的资产 2. 数据的价值可以用经济术语来表示 数据价值评估模型 3. 管理数据意味着对数据的质量管理 4. 管理数据需要元数据 5. 数据管理需要规划 6. 数据管理须驱动信息技术决策 7. 数据管理是跨职能…