首页 1 2 3 4 5 6 7

python大数据运维工程师待遇_什么是大数据运维工程师

一.运维三板斧

三板斧可以解决90%以上的故障处理工作。1>.重启

重启有问题的机器或经常，使其正常工作。2>.切换

主备切换或主主切换，链接正常工作的节点。3>.查杀

查杀有问题的进程，链接等。4>.三板斧的问题

第一：只能处理故障处理问题，不能解决性能调优，架构优化等问题；

第二：只能治标，不能治本；5>..大数据运维和传统运维的不同

第一：传统运维面对的底层软硬件基本稳固，大数据运维面对的是商用硬件和复杂linux版本；

第二：传统运维面对的是单机架构为主，大数据运维面对复杂的分布式架构；

第三：传统运维大多维护闭源商业版系统，大数据运维通常面对开源系统，文档手册匮乏，对阅读源码要求高。

第四：大数据运维对自动化工具的依赖大大增加；

二.Iaas层(基础设置及服务)运维工作

一般中大型企业有自己的基础设施维护团队，这部分工作不会交给大数据运维来做。小公司可能需要大数据运维键值这部分工作，主要关注三个方面：1>.硬件

大数据系统大多使用廉价PC Server或虚拟机，硬件故障是常态，通过告警，日志，维护命令等识别故障，并支持硬件更换。2>.存储

大多使用PC Server挂本磁盘的存储方式，极少情况会使用SAN(存储区域网络)或NAS(网络附属存储)，熟悉分区，格式化，巡检等基本操作。3>.网络

网络的配置变更更需要比较专业的知识，如有需要可学习CCNA，CCNP等认证课程，但网络硬件和配置出问题概率很低，主要关注丢包，延时。

三.HDFS运维工作1>.容量管理

第一：HDFS空间我使用超过80%要警惕，如果是多租户环境，租户的配额空间也能用完；

第二：熟悉hdfs，fsck，distcp等常用命令，会使用DataNode均衡器；2>.进程管理

第一：NameNode的进程是重点

第二：熟悉dfsadmin等Ingles。怎么做NameNode高可用。3>.故障管理

Hadoop最常见的故障就是硬盘损坏。4>.配置管理

hdfs-site.xml中的参数设置。

四.MapReduce运维工作1>.进程管理

第一：jobtracker进程故障概率比较低，有问题可以通过重启解决；

第二：了解一下HA的做法；2>.配置管理

mapred-site.xml中的参数设置。

五.Yarn运维工作1>.故障管理

主要是当任务异常这中止时看日志排查，通茶故障原因会集中在资源问题，权限问题中的一种。2>.进程管理

ResourceManager主要是学会配置HA

NodeManager进程挂掉不重要，重启即可。3>.配置管理

yarn-site.xml中的参数设置，主要分三块配置，scheduler的，ResourceManager的，NodeManager的。

六.Hive/Impala运维工作1>.SQL问题排查

第一：结果不对，主要原因可能是SQL错误，数据不存在，UDF错误等，需要靠经验排查

第二：慢SQL，这类问题开发经常会找运维排查，有可能是劣势SQL，数据量大，也有可能是集群资源紧张；2>.元数据管理

Hive和Impala公用的元数据，存在关系型数据库中。

七.其它组件

根据组件用途，特性，关注点的不用，运维工作也各不相同，如：1>.HBase关注读写性能，服务的可用性2>.Kafka关注吞吐量，负载均衡，消息不丢机制3>.Flume关注屯度量，故障后的快速恢复

工程项目中：replace的慎用

replace本身就是一个事务，他是通过唯一索引（如果没有指定则为主键）判断当前repalce的数据是否在表中存在，如果存在，则先delete删除，然后再inserte插入新数据覆盖旧数据。如果不存在，则直接Inserte。注意：在工程项

在云服务器上安装Jenkins

说明：Jenkins是一个部署项目的平台，通过Jenkins可以省去从项目开发–>部署项目之间的所有流程，做到代码提交即上线。本文介绍在云服务CentOS上安装Jenkins。前提安装Jenkins之前，先要在云服务上安装JD

Kubernetes 和 Kubeflow 学习笔记

Kubernetes Kubernetes是一个完备的分布式系统支撑平台，具有完备的集群管理能力，多扩多层次的安全防护和准入机制、多租户应用支撑能力、透明的服务注册和发现机制、內建智能负载均衡器、强大的故障发现和自我修复能力、服务

nvm配置(安装，解决nvm下载的node无npm问题

nvm配置卸载node，删除node环境变量路径在win面板删除node

怎么修改db2服务器名字,服务器创建db2数据库实例名

服务器创建db2数据库实例名内容精选换一换

batchupdate写法_mybatis执行批量插入insert和批量更新update

Mybatis批量插入和批量更新数据的资料相信大家从网上能查找到很多资料，本文重点总结一下mybatis执行批量插入insert和批量更新update数据。在mysql数据库中批量插入，如：insert into ... values (),(),...语法；而在oracle数据

最长异或路径java_最长异或值路径【字典树应用】

任何新类型的题，都可以转换成自己熟悉的题来解答。就像下面的这题：给定一个树，树上的边都具有权值。树中一条路径的异或长度被定义为路径上所有边的权值的异或和：

CANoe Test Module

基于微信小程序的校园失物招领系统设计与实现，可作为毕业设计

博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝30W+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌

Springboot中使用websocket

前端了解更多请参考h