spark wordcount 第一个spark 程序 - Ctrl+C&Ctrl+V - ITeye博客

`

knight_black_bob

浏览: 825134 次
性别:
来自: 北京

最近访客更多访客>>

bian1024

lli

cqh520llr

hxgdragon

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

knight_black_bob： chenhua1228 写道楼主，怎开启服务哦？Constan ...
仿QQ android 实战（学习 android 先来个QQ）
knight_black_bob： chenhua1228 写道楼主，怎开启服务哦？Constan ...
仿QQ android 实战（学习 android 先来个QQ）
chenhua1228：楼主，怎开启服务哦？Constants这个类里的 Stri ...
仿QQ android 实战（学习 android 先来个QQ）
masuweng：
身份证验证
knight_black_bob： kevinflynn 写道看了这篇文章，受益匪浅，点赞！！！ ...
elk(日志监控系统搭建),elastic search,kibana,logstash,filebeat搭建

spark wordcount 第一个spark 程序

博客分类：

scala
spark

spark wordcount 第一个程序

阅读更多

wordcount

package com.baoy.worldcount

import org.apache.spark.{SparkConf, SparkContext}

/**
  * Created by cmcc-B100036 on 2016/4/1.
  */
object WordCount {
  def main(args: Array[String]) {
    if(args.length == 0) {
      println("usage: wordcount <file>")
      System.exit(1)
    }
    val conf = new SparkConf ().setAppName("wordcount")
    val sc = new SparkContext(conf)
    sc.textFile(args(0))
      .flatMap(_.split(" "))
      .map(x => (x, 1))
      .reduceByKey(_ + _)
      .foreach(println)
    sc.stop()
  }
}

pom

 <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-core_2.10</artifactId>
      <version>1.4.1</version>
      <scope>provided</scope>
    </dependency>

准备原始数据

在 /home/cloudera/baoyou/data/log

创建文件 wordcount.log

在 hdfs 上创建 /data 路径

hdfs dfs -mkdir /data

上传 wordcount.log 到data路径

hdfs dfs -put wordcount.log /data/

运行本地 spark-submit

 spark-submit  --class com.baoy.worldcount.WordCount --master local  /home/cloudera/baoyou/project/SparkDemo.jar /data/wordcount.log

运行结果：

捐助开发者

在兴趣的驱动下,写一个免费的东西，有欣喜，也还有汗水，希望你喜欢我的作品，同时也能支持一下。当然，有钱捧个钱场（右上角的爱心标志，支持支付宝和PayPal捐助），没钱捧个人场，谢谢各位。

谢谢您的赞助，我会做的更好！

查看图片附件

0
顶

6
踩

分享到：

spark sql maven idea打包 | scala maven idea 第一个scala 程序

2016-04-01 16:04
浏览 1808
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

java实现的spark的wordcount单词技术程序: 采用java实现的spark的wordcount单词技术的程序.可以跑通。

WordCount_Spark!_spark_wordcount_java_: 在spark上运行wordcount程序，可以进行单词计数

Spark 最简单WordCount: 博客配套文件，详细演示了本地和集群模式如何运行Spark程序，演示了一个简单wordCount程序流程。

spark下实现wordcount: 亲自测试的

基于Spark的wordcount代码: 基于Spark的wordcount代码

spark运行wordcount例子: 本例子是让新手熟悉了解如果用idea开发程序，提交到spakr集群上读取hdfs数据这么一个流程。博客讲解链接：https://blog.csdn.net/cuicanxingchen123456/article/details/83573838

Spark-通过 API实现WordCount案例的数据集和jar包: 下载资料后，免费获取数据集和jar包

spark框架中wordcount的scala实现: scala语言和python一样都是交互式的语言，操作简单。这是wordcount的scala实现，简单明了，比java实现简单很多，希望对大家有所帮助

spark local下 WordCount运行示例: spark local下 WordCount运行示例，maven项目，直接导入eclipse即可

大数据实验报告Windows环境下安装Spark及RDD编程和Spark编程实现wordcount.doc: 大数据实验报告Windows环境下安装Spark及RDD编程和Spark编程实现wordcount.doc

hadoop scala spark 例子项目，运行了单机wordcount: hadoop scala spark 例子项目，运行了单机wordcount

Java实现Spark词配对Wordcount计数代码实现: 使用Spark实现对一个文档中的每一行的单词进行词配对计数，要求去标点符号，将大写符号统一转化成为小写单词。

Hadoop原理与技术Spark操作实验: 一、实验目的 1．理解Spark编程思想； 2．学会在Spark Shell中编写Scala程序； 3．学会在Spark Shell中运行Scala程序。二、实验环境 Windows 10 VMware Workstation Pro虚拟机 ...（二）spark运行wordcount程序

实验2-在Hadoop平台上部署WordCount程序-孙淼1: 1．每个实验单元在 50 页的篇幅内完成一份报告 3．实验报告要求：书写工整规范，语言表达清楚，数据和程序真 4．参加实验的每位同学应独立完成实验报告的撰写，其

(4)Spark程序的开发和运行: 创建SparkContext WordCount程序

Spark-wordcount:spark wordcount示例| 在Eclipse + Maven + Scala Project + Spark中构建: Eclipse+Maven+Scala Project+Spark | 编译并打包wordcount程序学习用Eclipse+Maven来构建并打包一个简单的单词统计的例程。第一步在EclipseIDE中安装Scala插件在Eclipse中安装Scala插件第二步创建Scala ...

MapReduce WordCount Java API代码实现，包括pom.xml的配置: 代码实现了 MapReduce的 WordCount，演示了MapReduce的基本编程模型，并且pom.xml也已经配置好，eclispse和IDEA皆可使用，JDK版本1.7即可。

使用Scala设计WordCount程序: 使用Scala设计WordCount程序软件环境: hadoop-2.6.5.tar.gz spark-1.6.2-bin-hadoop2.6.tgz scala-2.10.4.gz scala-SDK-4.0.0-vfinal-2. 11-linux.gtk.x86_64.tar.gz

centos下配置hadoop环境并运行wordcount程序: 最详细hadoop配置教程！centos下完美运行wordcount程序，从无到有，初学者必备！我自己亲自试了一遍并加以修改，准确无误～

Global site tag (gtag.js) - Google Analytics