简介
Cloudera是一家位于美国的软件公司,成立于2008年,专注于为企业客户提供基于Apache Hadoop的软件、支持、服务以及培训。Cloudera的开源Apache Hadoop发行版,即Cloudera Distribution including Apache Hadoop(CDH),是面向Hadoop企业级部署的。2018年10月,Cloudera与Hortonworks公司宣布以52亿美元的价格合并,这两家公司都是基于开源平台的。
Cloudera提供的服务帮助企业管理和分析大量数据,以驱动价值和竞争差异化。它提供了一个混合数据平台,包括安全的数据管理和可移植的云原生数据分析。Cloudera的使命是使数据和分析对每个人都易于访问和使用,通过改善对技能、软件和指导的访问,增加技术领域的多样性,并推动全球经济的可持续性。
此外,Cloudera还在全球范围内设有办事处,并在硅谷加利福尼亚州设有总部。它由来自硅谷领先公司的一些最聪明的头脑创立,包括Google、Yahoo!、Oracle和Facebook的前员工。2011年,来自Yahoo!原始Hadoop团队的24名工程师分拆出来成立了Hortonworks。这两家公司在2019年1月合并,它们都建立在开源、开放标准和开放市场最佳的信念之上。
安装部署
在企业环境中安装和部署Cloudera平台,通常涉及以下几个步骤:
1. 环境准备:确保操作系统满足Cloudera平台的要求,如使用CentOS 7.x或Ubuntu 16.04等,并确保服务器能够访问外部网络以下载必要的软件包。
2. 系统配置:配置网络环境,确保所有主机之间网络全通,关闭防火墙,以及配置SELinux策略。
3. 内存和存储要求:保证每台设备的内存至少8G以上,以及/var目录和/usr目录的剩余空间在30G以上。
4. JDK安装:因为Cloudera Data Hub (CDH) 的运行依赖JDK1.8,所以安装CDH之前需要先安装JDK1.8,并配置好环境变量。
5. Cloudera Manager安装:Cloudera Manager是Cloudera提供的一个集群管理工具,它包括Cloudera Manager Server和Cloudera Manager Agent。Server负责整个集群的监控与管理,而Agent部署在每个需要监控和管理的设备上。
6. 数据库配置:Cloudera Manager使用关系型数据库存储集群数据,需要配置好数据库并确保Cloudera Manager可以连接。
7. 安装Cloudera Manager Server和Agent:在主服务器上安装Cloudera Manager Server,而在其他服务器上安装Cloudera Manager Agent。
8. 配置Cloudera Manager Service:安装并配置Cloudera Management Service,这是用于监控整个CDH集群的服务。
9. 部署CDH:通过Cloudera Manager的Web界面进行CDH的部署,包括选择版本、配置集群、分发软件包、配置服务和启动集群。
10. 验证安装:安装完成后,通过Cloudera Manager的Web界面检查集群状态,确保所有服务正常运行。
11. 解决常见问题:如果在安装过程中遇到问题,如依赖关系错误、无法连接到Web界面或集群启动失败,需要根据错误信息进行相应的排查和修复。
12. 扩展和优化:根据业务需求对集群进行扩展和优化,以满足更多的数据处理和分析需求。
在安装过程中,务必遵循Cloudera官方文档的指导,确保每一步操作正确无误。同时,注意安全设置,避免不必要的安全风险。