`
seandeng888
  • 浏览: 154834 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

大数据框架hadoop的文件系统(HDFS)命令大全

阅读更多

    HDFS(Hadoop Distributed File System)Hadoop应用用到的一个最主要的分布式存储系统。一个HDFS集群主要由一个NameNode和多个Datanode组成:Namenode管理文件系统的元数据,而Datanode存储了实际的数据。基本上,客户端是通过联系Namenode以获取文件的元数据或修饰属性,而真正的文件I/O操作是Namenode直接和Datanode进行交互的。   

    调用文件系统命令应使用bin/hadoop fs <args>的形式。所有的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,schemehdfs,对本地文件系统,schemefile。其中schemeauthority参数都是可选的,如果未加指定,就会使用配置中指定的默认scheme(core-site.xml配置文件的fs.default.name属性)。一个HDFS文件或目录比如/user/myuser可以表示成hdfs://namenode:namenodeport/user/myuser,或者更简单的/user/myuser(假设你配置文件中的默认值是namenode:namenodeport)。接下来从查询类、新增类、删除类及修改类四个角度来列举HDFS命令。

1       查询类

1.1              查看指定目录下内容

hadoop dfs –ls /user/myuser

1.2              lsr

hadoop fs -lsr <args>

ls命令的递归版本。

1.3              打开某个已存在文件

hadoop fs -cat URI [URI ...]

hadoop dfs -cat /user/myuser/data.txt file:///file hdfs://host:port/user/myuser

1.4              hadoop上某个文件down至本地已有目录下

hadoop fs –get /user/test/bqh/in.txt /home/test/

1.5              hadoop指定目录下所有内容保存为一个文件,同时down至本地

hadoop dfs –getmerge /user /home/t

1.6              copyToLocal

hadoop fs -copyToLocal URI <localdst>

除了限定目标路径是一个本地文件外,和get命令类似

1.7              du

hadoop fs -du URI [URI ...]

显示目录中所有文件的大小,或者当只指定一个文件时,显示此文件的大小。

1.8              dus

hadoop fs -dus <args>

显示文件的大小。

1.9              stat

hadoop fs -stat URI [URI ...]

返回指定路径的统计信息。

1.10        tail

hadoop fs -tail URI

将文件尾部的内容输出到stdout

1.11        test

hadoop fs -test -[ezd] URI

-e  检查文件是否存在。如果存在则返回0

-z  检查文件是否是0字节。如果是则返回0.

-d  检查路径是个目录,则返回1,否则返回0.

1.12        text

hadoop fs -text <src>

将源文件输出为文本格式。

2       新增类

2.1              mkdir

hadoop fs -mkdir <paths>

接受路径指定的URI作为参数,创建这些目录。类似于Unixmkdir -p,它会创建路径中的各级父目录。

2.2              将本地文件存储至hadoop

hadoop fs –put /home/myuser/file.txt  /user/t   

2.3              将本地文件夹存储至hadoop

hadoop fs –put /home/t/dir_name /user/t

2.4              hadoop指定目录内创建新目录

hadoop fs –mkdir /user/myuser/t

2.5              hadoop指定目录下新建一个空文件

hadoop  fs  -touchz  /user/myuser/new.txt

2.6              copyFromLocal

hadoop fs -copyFromLocal <localsrc> URI除了限定资源路径是一个本地文件外,和put命令相似。

2.7              moveFromLocal

hadoop dfs -moveFromLocal <src> <dsr>

3       删除类

3.1              删除hadoop上指定文件

hadoop fs –rm /user/myuser/ok.txt

hadoop fs –rmr /user/myuser/ok.txt

3.2              删除hadoop上指定文件夹(包含子目录等)

hadoop fs –rmr /user/myuser/t

3.3              Expunge

hadoop fs -expunge

清空回收站

4       修改类

4.1              hadoop上某个文件重命名

hadoop fs  –mv  /user/test.txt  /user/ok.txt 

4.2    改变文件必属的组。

hadoop fs -chgrp [-R] GROUP [URI ...]

使用-R将使改变在目录结构下递归进行。

4.3              改变文件的权限

hadoop fs -chmod [-R] <MODE[,MODE]> URI [URI ...]

使用-R将使改变在目录结构下递归进行。

4.4              改变文件的拥有者

hadoop fs -chown [-R] [OWNER][:[GROUP]] URI [URI]

使用-R将使改变在目录结构下递归进行。

4.5              cp

hadoop fs -cp URI [URI ...] <dest>

将文件从源路径复制到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。

 

 

 

1
0
分享到:
评论

相关推荐

    大数据与Hadoop.doc

    Hadoop Distributed File System(HDFS):Hadoop分布式文件系统,提供高吞吐量应用程序数据访问,并具有高 容错性。对外部客户机而言,HDFS就像一个传统的分级文件系统,可以进行增删改查或 重命名等常规文件操作...

    云计算与大数据技术-Hadoop分布式大数据系统.ppt

    6.2.1 HDFS文件系统的原型GFS 6.2.2 HDFS文件的基本结构 6.2.3 HDFS的存储过程 6.3 MapReduce编程框架 6.3.1 MapReduce的发展历史 6.3.2 MapReduce的基本工作过程 6.3.3 LISP中的MapReduce 6.3.4 MapReduce...

    大数据及Hadoop简介.docx

    随着近来计算机技术和互联网的发展,大数据 这个名词越来越多地进入到...1、分布式文件系统——HDFS 2、分布式计算框架——MapReduce 3、集群资源管理器——YARN 四、Hadoop 常用组件 五、Hadoop 在国内外的应用情况

    精品课程推荐 大数据与云计算教程课件 优质大数据课程 07.HDFS Shell命令(共21页).pptx

    大数据与云计算教程课件 优质大数据课程 07.HDFS Shell命令(共21页).pptx 大数据与云计算教程课件 优质大数据课程 08.HDFS文件接口(共41页).pptx 大数据与云计算教程课件 优质大数据课程 09.MapReduce序列化(共...

    大数据教程Hadoop系列

    Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据...

    hadoop大数据课程设计

    hadoop大数据课程设计,爬虫项目,python

    Hadoop大数据开发实战-教学大纲.pdf

    Hadoop作为处理大数据的分布式存储和计算框架,得到了国内外大小型企业广泛的应用。Hadoop是一个可以搭建在廉价服务器上的分布式集群系统架构,它具有可用性高、容错性高和可扩展性高等优点。由于它提供了一个开放式...

    流程图+方框图剖析大数据技术(HDFS&Hadoop; MapReduce)

    大数据技术的两个基本要点是分布式存储和多点并行运算,Hadoop的分布式文件系统HDFS和并行运算框架Hadoop MapReduce分别予以了实现。计算机集群中的每个节点既是存储节点,也是运算节点,HDFS将大数据文件分布存储在...

    大数据学习指南合集(Hadoop、Spark、Flink等)

    大数据框架组件 含Hadoop、Spark、Flink等大数据书籍 一、Hadoop   1. Hadoop——分布式文件管理系统HDFS   2. Hadoop——HDFS的Shell操作   3. Hadoop——HDFS的Java API操作   4. Hadoop——分布式计算框架...

    大数据hadoop视频教程

    Hadoop分布式文件系统(HDFS):用于存储大规模数据集的分布式文件系统,具有高容错性和高可靠性。 Hadoop YARN(Yet Another Resource Negotiator):用于集群资源管理和作业调度的框架,可以有效地管理集群中的...

    hadoop分布式云平台基础视频.zip

    01_hadoop_hdfs1分布式文件系统01.mp4 02_hadoop_hdfs1分布式文件系统02.mp4 03_hadoop_hdfs1分布式文件系统03.mp4 04_hadoop_hdfs1分布式文件系统04.mp4 05_hadoop_hdfs1分布式文件系统05.mp4 06_hadoop_hdfs1...

    精品课程推荐 大数据与云计算教程课件 优质大数据课程 06.HDFS(共38页).pptx

    大数据与云计算教程课件 优质大数据课程 07.HDFS Shell命令(共21页).pptx 大数据与云计算教程课件 优质大数据课程 08.HDFS文件接口(共41页).pptx 大数据与云计算教程课件 优质大数据课程 09.MapReduce序列化(共...

    大数据与云计算技术 Hadoop概论和快速入门 共40页.ppt

    HDFS (Hadoop Distributed File System),Hadoop 分布式文件系统。 NameNode,HDFS命名服务器,负责与DataNode文件元信息保存。 DataNode,HDFS数据节点,负责存储数据存储并汇报给NameNode。 SecondaryNamenode,...

    大数据技术 + Hadoop + 分布式文件系统 + 大规模数据存储

    内容概要:介绍了Hadoop这一大数据技术,包括其分布式文件系统HDFS,用于存储和管理大规模数据集。 适用人群:大数据工程师、数据分析师、IT从业者。 使用场景及目标:适用于需要高可靠性和高吞吐量的应用场景,如...

    人工智能-hadoop-基于hdfs spark的视频非结构化数据计算

    现有的大数据平台Hadoop、Spark等都在处理文本数据方面具有很好的支持,并且效率也经过了各种优化,所以在利用分布式框架来处理日志类数据,工作难度往往是如何对这些数据进行逻辑上的处理。但是对于非结构化数据,...

    论文研究-支持Hadoop大数据访问的pNFS框架研究与实现.pdf

    随着大数据时代到来,分布式文件系统支持Hadoop大数据访问已成为一种趋势。以研究支持Hadoop大数据访问的pNFS框架为目的,采用在Hadoop与pNFS之间添加pNFS shim layer模块的方法,实现了pNFS支持Hadoop大数据访问的...

    Hadoop中HDFS和MapReduce框架介绍pdf

    Hadoop中HDFS和MapReduce框架介绍pdf

    大数据Hadoop开发基础

    从理论着手介绍Hadoop的概念...再通过介绍Hadoop的HDFS、MapReduce和YARN三大主要的核心框架,深入地了解Hadoop的整体架构,掌握Hadoop核心架构HDFS和MapReduce;并对Hadoop框架中的其他组件和应用场景进行概要性介绍。

    hadoop-3.3.4 版本(最新版)

    Hadoop 架构有两个主要的组件:分布式文件系统 HDFS 和 MapReduce 引擎。 在 Hadoop 中,MapReduce 底层的分布式文件系统是独文模块,用户可按照约定 的一套接口实现自己的分布式文件系统,然后经过简单的配置后,...

    HDFS源码剖析带书签目录高清.zip

    第2章介绍了Hadoop RPC框架的实现,Hadoop RPC是HDFS各个组件间通信所依赖的底层框架,可以理解为HDFS的神经系统。第3~5章分别介绍了Namenode、Datanode以及HDFS客户端这三个组件的实现细节,同时穿插介绍了HDFS 2.X...

Global site tag (gtag.js) - Google Analytics