spark1.2.0伪分布式搭建 - benladeng5225 - ITeye博客

`

benladeng5225

浏览: 50359 次
性别:
来自: 西安

最近访客更多访客>>

szxiaoli

limengna845567

wangyy

fengchao723

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

小胖vs小猪：很好，一定程度上解决了我有些迷惑的问题，
JAVA中文字符编码问题详解(2)

spark1.2.0伪分布式搭建

博客分类：

云计算大数据

阅读更多

1、下载scala2.11.5版本，下载地址为：http://www.scala-lang.org/download/2.11.5.html;

2、安装和配置scala：

第一步：上传scala安装包并解压

第二步配置SCALA_HOME环境变量到bash_profile

第三步 source 使配置环境变量生效：

第四步验证scala：

3、下载spark 1.2.0，具体下载地址：http://spark.apache.org/downloads.html

4、安装和配置spark：

第一步解压spark：

第二步配置SPARK_HOME环境变量：

第三步使用source生效：

进入spark的conf目录：

第四步修改slaves文件，首先打开该文件：

slaves修改后：

第五步配置spark-env.sh

首先把spark-env.sh.template拷贝到spark-env.sh：

然后打开“spark-env.sh”文件：

spark-env.sh文件修改后：

5、启动spark伪分布式帮查看信息：

第一步先保证hadoop集群或者伪分布式启动成功，使用jps看下进程信息：

如果没有启动，进入hadoop的sbin目录执行 ./start-all.sh

第二步启动spark：

进入spark的sbin目录下执行“start-all.sh”：

此刻我们看到有新进程“Master” 和"Worker"

我们访问“http://master:8080/”，进如spark的web控制台页面：

从页面上可以看到一个Worker节点的信息。

我们进入spark的bin目录，使用“spark-shell”控制台：

通过访问"http://master:4040"，进入spark-shell web控制台页面：

6、测试spark伪分布式：

我们使用之前上传到hdfs中的/data/test/README.txt文件进行mapreduce

取得hdfs文件：

对读取的文件进行一下操作：

使用collect命令提交并执行job：

readmeFile.collect

查看spark-shell web控制台：

states：

端口整理：

master端口是7077

master webui是8080

spark shell webui端口是4040

分享到：

maven不能设置为Dynamic Web Module3.0解 ... | Hadoop2.6.0集群安装

2016-01-13 15:31
浏览 586
评论(0)
分类:数据库
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Spark1.2.0单点或伪分布式安装总结.pdf: 由于之前在网上找的关于Spark搭建的资料都很老旧，大多时1.1之前的版本，于是自己安装后总结了一些相关知识，希望能和初学者共勉，也希望各位大神批评指正

spark 1.2.0 文档(spark-1.2.0-doc): spark-1.2.0 文档 api Spark Overview Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala and Python, and an optimized engine that supports ...

hbase-spark-1.2.0-cdh5.16.2.jar: HBaseContext所需要的jar包。由于不知道为啥maven配置仓库地址不生效。所以手动下载了个。导入本地环境的maven仓库。

spark-1.3.1-bin-2.2.0_gong.tgz: spark-1.2.0-bin-hadoop2.4.tgz，用于hadoop2.4的spark1.2.0

深入理解Spark+核心思想与源码分析.pdf: 《深入理解SPARK：核心思想与源码分析》一书对Spark1.2.0版本的源代码进行了全面而深入的分析，旨在为Spark的优化、定制和扩展提供原理性的指导。阿里巴巴集团专家鼎力推荐、阿里巴巴资深Java开发和大数据专家撰写。...

seata-server-1.2.0.zip: 该项目为seata-1.2.0分布式事务服务器项目。需要单独搭建的项目,里面包含项目和sql文件。需要的可以下载！

seata-server-1.2.0.rar: seata-server-1.2.0.zip 分布式事务阿里巴巴分布式事务中间件分布式事务解决方案

深入理解Spark 核心思想与源码分析: 花钱买的扫描版，不是太清晰，下载前考虑..., 《深入理解SPARK：核心思想与源码分析》一书对Spark1.2.0版本的源代码进行了全面而深入的分析，旨在为Spark的优化、定制和扩展提供原理性的指导。阿里巴巴集团专家鼎力推荐

seata-server1.2.0.rar: seata-服务端1.2.0 分布式事务服务器,下载后解压进入conf里面进行配置，配置nacos服务或者zookeeper

hadoop2.7.2 +hbase1.2.0: hadoop2.7.2 +hbase1.2.0 集群环境搭建软件资源

Linux环境Hadoop2.6+Hbase1.2集群安装部署: Spark分布式集群搭建

spark 高级数据分析高清书签: , 《深入理解SPARK：核心思想与源码分析》一书对Spark1.2.0版本的源代码进行了全面而深入的分析，旨在为Spark的优化、定制和扩展提供原理性的指导。阿里巴巴集团专家鼎力推荐、阿里巴巴资深Java开发和大数据专家...

python2.7 xlrd-1.2.0: python2.7 xlrd-1.2.0

GTV1.2.0.apk: GTV1.2.0.apk

Global site tag (gtag.js) - Google Analytics