spark集群中运行SparkPi的示例 -

sxyqhyt

浏览: 77493 次
性别:
来自: 北京

最近访客更多访客>>

mzyp

czbkjava

feige1990

繁星水

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

spark集群中运行SparkPi的示例

博客分类：

spark
scala

1、SparkPi.scala源码（官网例子）

import scala.math.random

import org.apache.spark._

/** Computes an approximation to pi */
object SparkPi {
  def main(args: Array[String]) {
    val conf = new SparkConf().setAppName("Spark Pi")
    val spark = new SparkContext(conf)
    val slices = if (args.length > 0) args(0).toInt else 2
    val n = 100000 * slices
    val count = spark.parallelize(1 to n, slices).map { i =>
      val x = random * 2 - 1
      val y = random * 2 - 1
      if (x*x + y*y < 1) 1 else 0
    }.reduce(_ + _)
    println("Pi is roughly " + 4.0 * count / n)
    spark.stop()
  }
}

2、在Intellij IDE集成开发环境中运行，会出错，需要修改代码，增加

val conf = new SparkConf().setAppName("Spark Pi").setMaster("spark://master:7077")

3、利用IDE环境，把代码打成jar，只需要源码程序即可（其它的引用包去掉）

4、然后在IDE的代码中增加

spark.addJar("/home/cec/spark-1.2.0-bin-hadoop2.4/helloworld.jar")

把helloworld.jar分发到各个worker中

5、运行即可

14/12/31 15:28:57 INFO DAGScheduler: Stage 0 (reduce at SparkPi.scala:21) finished in 4.500 s

14/12/31 15:28:58 INFO DAGScheduler: Job 0 finished: reduce at SparkPi.scala:21, took 8.608873 s

Pi is roughly 3.14468

修改后的运行代码如下：

import scala.math.random
import org.apache.spark.{SparkConf, SparkContext}

/**
 * Created by cec on 12/31/14.
 */


object SparkPi {

  def main(args: Array[String]) {
    val conf = new SparkConf().setAppName("Spark Pi").setMaster("spark://master:7077")
    val spark = new SparkContext(conf)
    spark.addJar("/home/cec/spark-1.2.0-bin-hadoop2.4/helloworld.jar")
    val slices = if (args.length > 0) args(0).toInt else 2
    val n = 100000 * slices
    val count = spark.parallelize(1 to n, slices).map { i =>
      val x = random * 2 - 1
      val y = random * 2 - 1
      if (x*x + y*y < 1) 1 else 0
    }.reduce(_ + _)
    println("Pi is roughly " + 4.0 * count / n)
    spark.stop()
  }

}

分享到：

dubbo2.5.3与spring冲突的解决方法 | hibernate获取SessionFactory的方法

2014-12-31 15:42
浏览 1688
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

spark集群中运行SparkPi的示例

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

spark集群中运行SparkPi的示例

评论

发表评论

相关推荐

spark读取hbase数据

spark streaming准实时计算demo

spark streaming使用数据源方式插入mysql数据

spark查看历史任务的信息

Spark把执行结果写入到mysql中

spark sql自定义函数udf

最近访客更多访客>>