冷热集群数据同步、分类存储
集群数据整体搬迁
- 当公司业务迅速的发展，导致的当前的服务器数量资源出现临时紧张的时候，为了更高效的利用资源，会将A机房数据整体迁移到B机房的，原因可能是B机房机器多，而且B机房本身开销较A机房低些等
数据的准实时同步
- 数据准实时同步的media在于数据的双倍份可用，比如某天A集群突然宣告不允许再使用了，此时可以将线上使用集群直接切向B的同步集群，因为B集群实时同步A集群数据，拥有完全一致的真实数据和元数据信息，所以对于业务方使用而言是不会收到任何影响的。

数据迁移要素考量

Bandwidth-带宽
- 带宽用的多了，会影响到线上业务的任务运行，带宽用的少了又会导致数据同步满的问题。
performance-性能
- 是采用简单的单机程序？还是多线程的性能更佳的分布式程序？
data-increment-增量同步
- 当TB,PB级别的数据需要同步的时候，如果每次以全量的方式去同步数据，结果一定是非常糟糕。如果仅针对变化的增量数据进行同步将会是不错的选择。可以陪着HDFS快照等技术实现增量数据同步。
syncable-数据迁移的同步性
- 数据迁移的过程中需要保证周期内数据是一定能够同步完的，不能差距太大。比如A集群7天内的增量数据，我只要花半天就可以完全同步到B集群，然后我有可以等到下周再次进行同步，最可怕的事情在于A集群的7天内的数据，我的程序花了7天还同步不完，然后下一个周期又来了，这样就无法做到准实时的一致性，其实7天还是一个比较大的时间，最好是能达到按天同步。

HDFS分布式拷贝工具-DistCp

hadoop distcp hdfs://src_cluster:8020/user/data hdfs://dest_cluster:8020/user/data_backup

这个命令告诉distcp工具将hdfs://src_cluster:8020/user/data目录下的数据复制到hdfs://dest_cluster:8020/user/data_backup目录下。

rk3399 SDK做的很完善了，里面直接有一个build.sh的脚本。脚本的某一处如下：

Hive 是基于 Hadoop 的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制，在安装配置 Hive 前需要先安装好 hadoop 集群，如果还没安装好 hadoop 集群的要先将集群安装好！

文章目录环境配置

题目求出所有可能的以下形式的算式，每个算式中有九个数位，正好用尽1到9这九个数字。 ○○×○○=○×○○○○ (共有7种可能的组合)

引用回帖: ------PSO start 6.219116,3.410710,-4.782166,1.132898 3.181979,1.134846,-3.718395,1.227941 2.302928,-0.9105

立即学习:https://edu.csdn.net/cours

由于管理多个前端项目，且使用的node版本不一样，需要安装多个node版本，并快速切换。一.多版本安装 1.在nodejs官网下载需要的版本（

1、Zookeeper入门 1.1概述 Zookeeper是一个开源的分布式的，为分布式应用提供协调服务的Apache项目 Zookeeper工作机制

一、Bootstrap 1. 概念一个前端开发的框架，Bootstrap，来自 Twitter，是目前很受欢迎的前端框架。Bootstrap 是基于 HTML、CSS、