`
conkeyn
  • 浏览: 1506946 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

hadoop命令操作记录

 
阅读更多

FS

    1、使用-text参数将gzip和sequence file转换为文本格式并输出

        

$HADOOP_HOME/hadoop fs -text /sorted/part-00000 | head

 

hadoop-example.*.jar

1、使用Hadoop自带示例JAR中的排序进行排序测试。下面示例中设定了输入格式为SequenceFile格式

$HADOOP_HOME/hadoop jar /home/conkeyn/hadoop-1.2.1/hadoop-examples-1.2.1.jar sort -r 1 -inFormat org.apache.hadoop.mapred.SequenceFileInputFormat -outFormat org.apache.hadoop.mapred.SequenceFileOutputFormat -outKey org.apache.hadoop.io.IntWritable -outValue org.apache.hadoop.io.Text /test-sequence.seq /sorted

 

分享到:
评论

相关推荐

    Hadoop shell常用命令

    该文档记录了在linux的shell环境下执行的hadoop的相关操作命令,包括多hafs文件的相关操作

    Hadoop实战中文版

    3.1 HDFS 文件操作 3.1.1 基本文件命令 3.1.2 编程读写HDFS 3.2 剖析MapReduce 程序 3.2.1 Hadoop数据类型 3.2.2 Mapper 3.2.3 Reducer 3.2.4 Partitioner:重定向Mapper输出 3.2.5 Combiner:本地reduce ...

    hadoop-管理

    (2)hadoop dfsadmin -safemode leave命令强制离开 用户可以通过dfsadmin -safemode $value来操作安全模式,参数$value的说明如下: enter – 进入安全模式 leave – 强制NameNode离开安全模式 get – 返回安全模式...

    Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计

    本系统是以Django作为基础框架,采用MTV模式,数据库使用MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签,并使用Hadoop、Spark大数据...

    Hadoop实战中文版.PDF

    30第3章 Hadoop组件 313.1 HDFS文件操作 313.1.1 基本文件命令 323.1.2 编程读写HDFS 353.2 剖析MapReduce程序 373.2.1 Hadoop数据类型 393.2.2 Mapper 403.2.3 Reducer 413.2.4 Partitioner:...

    实验一Hadoop大数据集群搭建

    【实验一】Ubuntu/Centos通用的hadoop集群搭建实验(来自OUC) 具体内容和步骤: 1. 成功创建Linux的虚拟机操作系统(Ubuntu或Centos)...以上实验要求均完美实现,且对每一步操作做了详细的截图和文字记录,细致入微。

    Hadoop实战

    313.1 HDFS文件操作 313.1.1 基本文件命令 323.1.2 编程读写HDFS 353.2 剖析MapReduce程序 373.2.1 Hadoop数据类型 393.2.2 Mapper 403.2.3 Reducer 413.2.4 Partitioner:重定向Mapper输出 413.2.5 Combiner:本地...

    大数据技术原理及应用课实验3 熟悉常用的HBase操作 林子雨实验

    在本次实验中,我更加进一步理解了HDFS在Hadoop体系结构中的角色并能使用HDFS操作常用的Shell命令以及HDFS操作常用的Java API。 在本次实验的第一题是用编程Java API实现指定功能,并用Hadoop提供的HBase Shell命令...

    Hadoop实战(陆嘉恒)译

    Hadoop组件3.1 HDFS 文件操作3.1.1 基本文件命令3.1.2 编程读写HDFS3.2 剖析MapReduce 程序3.2.1 Hadoop数据类型3.2.2 Mapper3.2.3 Reducer3.2.4 Partitioner:重定向Mapper输出3.2.5 Combiner:本地reduce3.2.6 ...

    毕业设计 - 基于Python+Spark+Hadoop大数据基于用户画像电影推荐系统

    本系统是以Django作为基础框架,采用MTV模式,数据库使用MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签,并使用Hadoop、Spark大数据组件...

    Python+Spark+Hadoop大数据基于用户画像电影推荐系统设计+sql数据库(毕设源码).zip

    本系统是以Django作为基础框架,采用MTV模式,数据库使用MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签,并使用Hadoop、Spark大数据...

    Python+Spark+Hadoop实现的大数据基于用户画像电影推荐系统+源代码+文档说明+sql文件

    本系统是以Django作为基础框架,采用MTV模式,数据库使用MySQL和Redis,以从豆瓣平台爬取的电影数据作为基础数据源,主要基于用户的基本信息和使用操作记录等行为信息来开发用户标签,并使用Hadoop、Spark大数据组件...

    基于CentOS的Hadoop分布式环境的搭建开发

    如果想要搭建Hadoop环境,网上有很多详细的步骤和命令代码,我不想再重复记录。 其次,我要说的是我也是新手,对于Hadoop也不是很熟悉。但是就是想实际搭建好环境,看看他的庐山真面目,还好,还好,最好看到了。当...

    HDFS文件系统基本文件命令、编程读写HDFS

    本文档时Hadoop云计算平台下运用Hadoop API对HDFS进行相关的操作,详细的记录了程序在eclipse中的应用,代码内容和运行结果,是学习Hadoop非常有用的资料。

    大数据应用测试经验总结.pdf

    ⼆、Hadoop运⾏: mapreduce机制: 常⽤命令: 功能 功能 命令 命令 查看⽬录 hadoop fs -ls dir 上传⽂件 hadoop fs -put ${local file} ${hdfs file} 创建⽬录 hadoop fs -mkdir ${dirname} 获取⽂件 hadoop fs -...

    Java及大数据学习路线.pdf

    命令解析器Shell 2.3Hadoop⽣态体系 ⼤数据存储框架Hadoop 分布式服务管理框架zookeeper hadoop⾼可⽤HA 数据仓库hive 数据查询框架impala+kudu+clouderManager ⽇志采集传输框架flume/idea 分布式发布-订阅消息系统...

    大数据技术原理与应用.docx

    12. 12单选(2分)在设计词频统计的MapReduce程序时,对于文本行"hello bigdata hello hadoop",经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作)() [单选题] * 大数据技术原理与应用全文共10...

    linux用户创建

     此命令删除用户sam在系统文件中(主要是/etc/passwd, /etc/shadow, /etc/group等)的记录,同时删除用户的主目录。  修改用户账号就是根据实际情况更改用户的有关属性,如用户号、主目录、用户组、登录Shell等。...

    MapReduceVsSpark

    该项目将MapReduce和Spark在两个操作上进行了比较-单记录查找和过滤 spark和mapreduce jar分别编译,并部署在EC2实例上 分析是在5GB数据集上完成的,并从S3下载 使用的命令 SPARK COMMAND spark2-submit --class ...

    4399大数据笔试题.pdf

    4399⼤数据笔试题 今天晚上参加了厦门 今天晚上参加了厦门4399公司的⼤数据笔试,⾃⼰没有拍下题⽬,⼀下是根据⾃⼰在草稿纸上简要记录回忆下 公司的⼤数据笔试,⾃⼰没有拍下题⽬,⼀下是根据⾃⼰在草稿纸上简要...

Global site tag (gtag.js) - Google Analytics