1. 软件版本

scala-2.11.8.tgz

spark-1.6.1-bin-hadoop2.6.tgz

2. scala安装

2.1 0master机器安装

下载 scala-2.11.8.tgz，解压到 /usr/scala 目录下，即： /usr/scala/scala-2.11.8。
解压：tar -zxvf scala-2.11.8
权限

sudo chown -R hadoopmi:hadoopmi scala-.

环境变量

/etc/profile

#scala env
export SCALA_HOME=/usr/scala/scala-.
export PATH=$PATH:$SCALA_HOME/bin

source /etc/profile

scala的shell环境

scala

*　安装slave

2. 安装spark

2.1 0master机器

下载 spark-1.6.1-bin-hadoop2.6.tgz，解压到 //spark 目录下。
修改 spark-1.6.1-bin-hadoop2.6 目录所属用户和用户组。

环境变量：/etc/profile

# Spark Env
export SPARK_HOME=/home/spark-.-bin-hadoop2.
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

source /etc/profile

* spark配置

进入 Spark 安装目录下的 conf 目录，拷贝 spark-env.sh.template 到 spark-env.sh。

编辑 spark-env.sh，在其中添加以下配置信息：

export SCALA_HOME=/usr/scala/scala-.
export JAVA_HOME=/usr/java/jdk1._79
export SPARK_MASTER_IP=.
export SPARK_WORKER_MEMORY=g
export HADOOP_CONF_DIR=/usr/hadoop/hadoop-./etc/hadoop

slaves.template 拷贝到 slaves，编辑其内容为：

0slave1
0slave2
0slave3

* slave机器

*　和0master相同

3. 启动spark集群

* 启动yarn

启动 Master 节点
运行 start-master.sh
启动所有 Worker 节点
运行 start-slaves.sh
浏览器查看 Spark 集群信息
http://master:8080
spark-shell
浏览器访问 SparkUI
访问 http://master:4040

4. 停止集群

停止 Master 节点
运行 stop-master.sh 来停止 Master 节点。
停止 Worker 节点
运行 stop-slaves.sh 可以停止所有的 Worker 节点

* bug: no … to stop

http://www.cnblogs.com/quchunhui/p/5413807.html

Git常见错误（持续更新。。。）

1、error: RPC failed; curl 56 OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 10054 在clone时遇到这个问题，可以先执行：git config http.sslVerify "false"，再clone

Dubbo 3.x源码(9)—Dubbo启动元数据中心源码

基于Dubbo 3.1，详细介绍了Dubbo启动元数据中心源码。此前我们学习了Dubbo应用程序发布器DefaultApplicationDeployer#initialize方法部分源码，该方法完成

Apache Kafka：开启单机版的RestApi

当前版本：kafka_2.12-2.8.0、CentOS7 1. 声明当前内容主要为本人学习和测试开启Kafka的RestApi的方式，当前

应届生开40万年薪？OPPO大手笔招揽芯片人才引热议

记一次搭建局域网linux服务器过程

一、制作linux系统启动U盘下载centos7-dvd.iso，使用UItraISO来制作启动U盘

python在计算机视觉中常用的包

Python机器视觉编程常用数据结构与示例

10 分钟入门 AST 代码优化与修改

张大胖一上班，领导就扔了一个任务给他，把项目中的JavaScript代码做点“小小”的改变： 1. 把 == 改为全等 ===2. 把parsetInt

教你完全学会JavaScript（BOM篇-更新中）从入门到精通（js基础-DOM-BOM-jQuery）

Elasticsearch写入性能调优

bulk批量写入如果业务场景支持将一批数据聚合起来，一次性写入Elasticsarch，那么尽量采用bulk的方式，bulk批量写入的速度远高于一条一条写入大量document的速度。并不是bulk size越大越好，而是根

linux之wget命令

wget是

淘先锋技术网

spark配置：spark集群

1. 软件版本

2. scala安装

2.1 0master机器安装

*　安装slave

2. 安装spark

2.1 0master机器

* spark配置

* slave机器

3. 启动spark集群

* 启动yarn

4. 停止集群

* bug: no … to stop

spark配置：spark集群

1. 软件版本

2. scala安装

2.1 0master机器安装

* 安装slave

2. 安装spark

2.1 0master机器

* spark配置

* slave机器

3. 启动spark集群

* 启动yarn

4. 停止集群

* bug: no … to stop

*　安装slave