【运维】hadoop集群安装(一)多节点安装

文章目录

  • 一.Purpose
  • 二. Prerequisites
  • 三. Installation
    • 1. 节点规划
    • 2. Configuring Hadoop in Non-Secure Mode
    • 3. 准备工作
    • 4. 配置
      • core-site.xml
      • hdfs-site.xml
      • yarn-site.xml
      • mapred-site.xml
      • workers
    • 4. 分发配置、创建文件夹
    • 5. 格式化
    • 6. 操作进程
      • 6.1. hdfs
        • 启动
        • 停止
      • 6.2. yarn
        • 启动
        • 停止
    • 7. 访问

一.Purpose

This document describes how to install and configure Hadoop clusters ranging from a few nodes to extremely large clusters with thousands of nodes.
This document does not cover advanced topics such as Security or High Availability.

此文章目的在于多节点hadoop(从几个节点到上千个节点)的安装,但这里不包括高可用和安全相关的内容。

 

二. Prerequisites

  • java 8
  • 稳定版的hadoop镜像:本文下载的是hadoop3.0.3版本

 

三. Installation

Typically one machine in the cluster is designated as the NameNode and another machine as the ResourceManager, exclusively. These are the masters.
Other services (such as Web App Proxy Server and MapReduce Job History server) are usually run either on dedicated hardware or on shared infrastructure, depending upon the load.
The rest of the machines in the cluster act as both DataNode and NodeManager. These are the slaves.

  • 管理节点:通常,集群中的一台机器被指定为NameNode,另一台机器被指定为ResourceManager。
  • 工作节点:集群中的其余机器同时充当DataNode和NodeManager。
  • 其他服务:(如Web App Proxy Server和MapReduce Job History Server)通常在专用硬件或共享基础设施上运行,具体取决于负载,这里我放在了除管理节点之外的节点

 

1. 节点规划

根据上面的建议,我这里选择了两个安装节点进行组件规划

节点hdfs组件yarn组件
10.xxx(node1)namenode、datanoderesourcemanager、nodemanager
10.xxx(node2)secondaryNameNode、datanodenodemanager、jobHistorynode

 

2. Configuring Hadoop in Non-Secure Mode

HDFS daemons are NameNode, SecondaryNameNode, and DataNode. YARN daemons are ResourceManager, NodeManager, and WebAppProxy. If MapReduce is to be used, then the MapReduce Job History Server will also be running. For large installations, these are generally running on separate hosts.

Hdfs 包括:namenode、secondaryNamenode、datanode
yarn包括:resourcemanager、nodemanger、和WebAppProxy(暂时没有规划此进程)
如果运行mr,则MapReduce Job History Server也需要

注意:

对于大型安装,上述组件都是分散在不同机器中的。

 

3. 准备工作

每个节点【node1、node2】操作:

mkdir -p /home/user/hadoop
cd   /home/user/hadoop
tar -zxvf hadoop.tar.gz
ln -s   hadoop-3.0.3 hadoop

 

设置环境变量:

vim ~/.bashrc # 添加如下内容
export HADOOP_HOME=/home/user/hadoop/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export HADOOP_CONF_DIR=/home/user/hadoop/hadoop/etc/hadoop# 执行
source ~/.bashrc 

 

4. 配置

在/{user_home}/hadoop/hadoop/etc/hadoop/ 下

core-site.xml


<configuration><property><name>fs.defaultFS</name><value>hdfs://namenodeIp:9000</value><description>ip 为namenode所在ip</description></property>
</configuration>   

 

hdfs-site.xml

  <!-- ===========namenode===========   -->  <property>  <name>dfs.namenode.name.dir</name>  <value>/opt/data/hdfs/namenode,/opt/data02/hdfs/namenode</value>  <description>If this is a comma-delimited list of directories then the name table is replicated in all of the  directories, for redundancy.  Path on the local filesystem where the NameNode stores the namespace and transactions logs persistently.  用于保存Namenode的namespace和事务日志的路径  </description>  </property>  <!-- ===========namenode===========   -->  <!-- ===========datanode===========   -->  <property>  <name>dfs.datanode.data.dir</name>  <value>/opt/data/hdfs/data,/opt/data02/hdfs/data</value>  <description>If this is a comma-delimited list of directories, then data will be stored in all named directories, typically on different devices.</description>  </property>  

 

yarn-site.xml

  <!--  Configurations for ResourceManager:   -->  <property>  <name>yarn.resourcemanager.address</name>  <value>node1:8832</value>  </property>  <property> <name>yarn.resourcemanager.scheduler.address</name>  <value>node1:8830</value>  </property>  <property> <name>yarn.resourcemanager.resource-tracker.address</name>  <value>node1:8831</value>    </property>  <property> <name>yarn.resourcemanager.admin.address</name>  <value>node1:8833</value>  </property>  <property> <name>yarn.resourcemanager.webapp.address</name>  <value>node1:8888</value>  </property> <property> <name>yarn.resourcemanager.hostname</name>  <value>rmhostname</value>  </property>  <property><name>yarn.nodemanager.local-dirs</name>  <value>/data/yarn/nm-local-dir,/data02/yarn/nm-local-dir</value>   </property>  <property> <name>yarn.nodemanager.log-dirs</name>  <value>/home/taiyi/hadoop/yarn/userlogs</value>  </property>  <property> <name>yarn.nodemanager.remote-app-log-dir</name>  <value>/home/taiyi/hadoop/yarn/containerlogs</value>  </property><property>  <name>yarn.nodemanager.resource.memory-mb</name>  <value>61440</value><description>通过free -h 查看机器具体内存设定</description></property>

 

mapred-site.xml

<!--Configurations for MapReduce JobHistory Server:-->  <property>  <name>mapreduce.jobhistory.address</name>  <value>node2:10020</value>  </property>  <property>  <name>mapreduce.jobhistory.webapp.address</name>  <value>node2:19888</value>   </property>  <!--Configurations for MapReduce JobHistory Server:-->

 

workers

配置工作节点

node1
node2

 

4. 分发配置、创建文件夹

配置分发到另外一个节点

scp -r   \
/home/user/hadoop/hadoop/etc/hadoop/  \
root@node2hostname:/home/user/hadoop/hadoop/etc/

所有节点创建文件夹

mkdir -p /data/yarn/nm-local-dir /data02/yarn/nm-local-dir
chown -R user:user /data/yarn /data02/yarnmkdir -p /opt/data/hdfs/namenode /opt/data02/hdfs/namenode /opt/data/hdfs/data /opt/data02/hdfs/data
chown -R user:user /opt/data /opt/data02

 

5. 格式化

namenode所在节点执行

hdfs namenode -format

如果看到这些信息格式化成功

2022-08-12 17:43:11,039 INFO common.Storage: Storage directory /Users/lianggao/MyWorkSpace/002install/hadoop-3.3.1/hadoop_repo/dfs/name 
has been successfully formatted.2022-08-12 17:43:11,069 INFO namenode.FSImageFormatProtobuf: Saving image file /Users/lianggao/MyWorkSpace/002install/hadoop-3.3.1/hadoop_repo/dfs/name/current/fsimage.ckpt_0000000000000000000 using no compression
2022-08-12 17:43:11,200 INFO namenode.FSImageFormatProtobuf: Image file /Users/lianggao/MyWorkSpace/002install/hadoop-3.3.1/hadoop_repo/dfs/name/current/fsimage.ckpt_0000000000000000000 of size 403 bytes saved in 0 seconds .

如果格式化失败需要先删除nn的管理目录
 
因为格式化的时候是创建了nn文件的管理目录 common.Storage: Storage directory /data/hadoopdata/name has been successfully formatted.

 

6. 操作进程

6.1. hdfs

启动

node1

hdfs --daemon start namenode
hdfs --daemon start datanode

node2

hdfs --daemon start secondarynamenode
hdfs --daemon start datanode

停止

hdfs --daemon stop namenode
hdfs --daemon stop secondarynamenode
hdfs --daemon stop datanode

 

6.2. yarn

启动

node1

yarn --daemon start resourcemanager
yarn --daemon start nodemanager

node2

mapred --daemon start historyserver
yarn --daemon start nodemanager

停止

yarn --daemon stop resourcemanager
yarn --daemon stop nodemanager
mapred --daemon stop historyserver

 

7. 访问

http://node1:9870/
http://node2:8088/

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1620105.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Mysql--技术文档--基本概念--《世界上最流行的关系型数据库之一》

官方网址 MySQL 阿丹&#xff1a; 作为关系型数据库管理的老大哥&#xff0c;一个合格的程序员多多少少一定要了解mysql库。 官方解释 MySQL是一个关系型数据库管理系统&#xff0c;由瑞典MySQL AB 公司开发&#xff0c;属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管…

Spring Boot中通过maven进行多环境配置

上文 java Spring Boot将不同配置拆分入不同文件管理 中 我们说到了&#xff0c;多环境的多文件区分管理 说到多环境 其实不止我们 Spring Boot有 很多的东西都有 那么 这就有一个问题 如果 spring 和 maven 都配置了环境 而且他们配的不一样 那么 会用谁的呢&#xff1f; 此…

二十年前的电脑配置单,大家见过吗?

去年搬家时&#xff0c;从角落里找到一台小时候用过的台式电脑&#xff0c;当时家人像宝贝供着&#xff0c;不让我用&#xff0c;后来出去读书&#xff0c;不知道什么时候淘汰的&#xff0c;现在放在角落里吃灰。如下图所示&#xff0c;不知道是什么牌子&#xff0c;还是挺重的…

无盘服务器怎么设置客户端启动,网吧无盘客户端配置向导

你知道网吧无盘客户端配置向导是怎么样的吗?网吧无盘客户端配置向导如何呢?下面是学习啦小编收集整理的网吧无盘客户端配置向导,希望对大家有帮助~~ 网吧无盘客户端配置向导 工具/原料 深度无盘网吧系统 网吧服务器设备 步骤/方法 1客户端安装完毕后,重启客户机,进入BIOS设…

网吧无盘60台服务器配置,网吧40台无盘服务器的配置

网吧40台无盘服务器的配置 内容精选 换一换 弹性云服务器(Elastic Cloud Server)是一种可随时自动获取、计算能力可弹性伸缩的云服务器&#xff0c;可帮助您打造可靠、安全、灵活、高效的应用环境&#xff0c;确保服务持久稳定运行&#xff0c;提升运维效率。 本节定义了云耀云…

网吧无盘最新服务器配置,2018年50台机网吧无盘服务器配置

大家都知道&#xff0c;现在的网吧都是无盘&#xff0c;无盘网吧服务器和网络配置决定了网吧的大部分性能。而网吧电脑配置的性能直接影响到网吧顾客对网吧的印象。网吧顾客玩得不爽&#xff0c;下次自然不会再来你网吧了。所以&#xff0c;网吧无盘服务器的电脑配置非常关键。…

网吧服务器组装方案,网吧服务器配置方案有哪些

服务器作为硬件来说&#xff0c;通常是指那些具有较高计算能力&#xff0c;能够提供给多个用户使用的计算机。服务器与PC机的不同点很多&#xff0c;例如PC机在一个时刻通常只为一个用户服务。服务器与主机不同&#xff0c;主机是通过终端给用户使用的&#xff0c;服务器是通过…

网吧服务器系统如何配置,网吧服务器系统配置

网吧服务器系统配置 内容精选 换一换 支持。SFS容量型文件系统:支持为SFS容量型文件系统配置多个VPC,以使归属于不同VPC的云服务器,只要所属的VPC被添加到文件系统的VPC列表下,或云服务器被添加到了VPC的授权地址中,则实际上归属于不同VPC的云服务器也能共享访问同一个文件…

网吧电脑可以练计算机一级吗,为啥网吧电脑配置不高却不卡?真相恍然大悟

为什么网吧电脑配置不高&#xff0c;但从来不会觉得卡&#xff1f; 5月13日消息&#xff0c;联想官方微博解读了这一问题&#xff0c;原因有以下几点&#xff1a; 1、独享光纤网络 咱们都知道很多家里玩起来卡的游戏&#xff0c;在网吧玩就流畅的不行&#xff0c;配合着旁边队友…

网吧计算机配置特点,为何网吧电脑配置不高,但玩起来却一点都不卡?网管说出真相!...

原标题&#xff1a;为何网吧电脑配置不高&#xff0c;但玩起来却一点都不卡&#xff1f;网管说出真相&#xff01; 自从电脑开始普及之后&#xff0c;网吧这个新的娱乐场所也随之诞生了。在当时我们买不起电脑的时代&#xff0c;我们若是想要上网玩游戏&#xff0c;往往都是会选…

VSCode连接服务器

Pycharm连接服务器参考我的另一篇文章Pycharm远程连接服务器_pycharm进入服务器虚拟环境终端_Jumbo星的博客-CSDN博客 本质上Pycharm和VSCode都只是IDE&#xff0c;没有什么好坏之分。但是因为Pycharm连接服务器&#xff08;准确来说是部署&#xff09;需要买professional。而…

商品管理系统开发

商品管理系统开发 程序介绍代码 程序介绍 商品管理系统主要是对商品的基本信息进行增、删、改、查以及商品的插入的操作&#xff0c;以便用户可以快速地对这些信息进行管理。 操作流程 用户在编译完成后会产生一个系统的可执行文件&#xff0c;用户只要双击可执行文件就可以进…

商品管理系统——商品库存和采购需求检索功能

一 商品库存 1 控制器 /*** 功能描述&#xff1a;商品库存分页查询** param params 过滤条件* return R 返回给前端的数据* author cakin* date 2020/11/8*/RequestMapping("/list")public R list(RequestParam Map<String, Object> params) {PageUtils page …

DevOps系列文章之 Python基础

列表 Python中的列表类似于C语言中的数组的概念&#xff0c;列表由内部的元素组成&#xff0c;元素可以是任何对象 Python中的列表是可变的 简单的理解就是&#xff1a;被初始化的列表&#xff0c;可以通过列表的API接口对列表的元素进行增删改查 1、定义列表 1.可以将列表当成…

商品管理

淘淘商品管理 服务搭建(详细) 工程结构 taotao-parent&#xff1a;父工程&#xff0c;打包方式pom&#xff0c;管理jar包的版本号。 ​ | (项目中所有工程都应该继承父工程。) ​ |–taotao-common&#xff1a;通用的工具类通用的pojo,util。打包方式jar ​ |–taotao-man…

基于hadoop的商品推荐系统_更好用的商品管理软件推荐,免费的维格表进销存系统...

概述 维格表是集商品进、销、存和财务管理一体化的数据平台&#xff1a;即将物流与钱流、业务数据与财务数据自动集成&#xff0c;实现商品库存、往来账项、资金流动、费用收支及利润浑然联结。 它提供了全面的业务解决&#xff0c;包括&#xff1a;订货管理、采购管理、销售管…

大宗商品进口管理软件可以帮助企业解决哪些?

什么是大宗商品贸易&#xff1f;简单讲就是大宗商品在国际上自由流通。以贸易的形式&#xff0c;把商品从价格低的地方拉到价格高的地方出售。大宗商品是指可进入流通领域&#xff0c;可在工农业领域生产与消费使用的大批量买卖的。主要包括的类别有&#xff1a;能源商品、基础…

复习之docker部署--项目实战

一、实验环境 1.安装7.6虚拟机 最小化安装&#xff0c;不安装图形&#xff01; 2.封装虚拟机 关闭selinux关闭防火墙关闭networkmanager配置网络&#xff0c;保证可以ssh修改主机名添加双向解析配置7.6网络仓库--安装常用的工具 配置完成后&#xff0c;在真机ssh虚拟机 如果…

小马的免杀

一般的php一句话后门很容易被网站防火墙waf拦截&#xff0c;而waf通常通过判断关键字来辨别一句话木马&#xff0c;要想绕过waf就需要对木马进行一些变形。(仅供分享经验&#xff0c;不可用作非法用途) 图片来源 一句话木马 <?php eval($_POST[attack]);?>一.先看一只有…

算法通关村——解析堆在数组和链表的应用

1. 堆 1.1 什么是堆&#xff1f; 堆是将一组数据以完全二叉树的形式存储在数组里面。一般有大根堆和小根堆。 小根堆&#xff1a;任意节点的值小于等于它的左右孩子&#xff0c;最小值在堆顶。 大根堆&#xff1a;任意节点的值大于等于它的左右还是&#xff0c;最大值在堆顶。…