build from source code
1. download from http://tez.apache.org/install.html
if you want to get the lattest codes through this command
#git clone https://git-wip-us.apache.org/repos/asf/tez.git
#tar xvf apache-tez-0.5.1-src.tar.gz
#cd apache-tez-0.5.1-src
#mvn package -Dhadoop.version=2.3.0 -P\!hadoop24 -DskipTests
error:
DAGClientTimelineImpl.java:[38,33] package com.sun.jersey.api.client does not exist
solution: modify tez-api/pom.xml
<dependencies> <dependency> <groupId>com.sun.jersey</groupId> <artifactId>jersey-client</artifactId> <version>1.9</version> </dependency> ......
rerun
#mvn clean package -Dhadoop.version=2.3.0 -P\!hadoop24 -DskipTests
all build jars in tez-dist/target/ dir.
-------------------------------------------
Depoly tez to hadoop clusters
1. make TEZ_HOME
#mkdir -p /home/inok/tez
#cp tez-dist/target/tez-0.5.1-minimal.tar.gz /home/inok/tez/
#cp tez-dist/target/tez-0.5.1.tar.gz /home/inok/tez/
#cd /home/inok/tez
#mkdir conf
#mkdir jars
#cd conf
#vi tez-site.xml
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> <property> <name>tez.lib.uris</name> <value>${fs.defaultFS}/apps/tez-0.5.1/tez-0.5.1.tar.gz</value> </property> <property> <name>tez.use.cluster.hadoop-libs</name> <value>false</value> </property> </configuration>
#cd ../
#tar xf tez-0.5.1-minimal.tar.gz -C jars/
distribute tez dir to all cluster nodes /home/inok/
2. upload tez-0.5.1.tar.gz to hdfs
#hdfs dfs -mkdir -p /apps/tez-0.5.1
#hdfs dfs -put tez-0.5.1.tar.gz /apps/tez-0.5.1/
3. configure hadoop
# modify hadoop-2.3.0/etc/hadoop/mapred-site.xml
<property>
<name>mapreduce.framework.name</name>
<value>yarn-tez</value>
</property>
# modify hadoop-2.3.0/etc/hadoop/hadoop-env.sh
export TEZ_CONF_DIR=/home/inok/tez/conf
export TEZ_JARS=/home/inok/tez/jars
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$TEZ_CONF_DIR:$TEZ_JARS/*:$TEZ_JARS/lib/*
update mapred-site.xml and hadoop-env.sh in all hadoop cluster nodes
4. restart hadoop clusters
#stop-all.sh
#start-all.sh
5. test tez
#hdfs dfs -mkdir test
# vi words
good morning good afternoon thanks my boy
#hdfs dfs -put words test/
#hadoop jar hadoop-2.3.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.3.0.jar wordcount test/words test/output
IF you see the following reds words, congratuations, tez works.
14/11/13 09:58:58 INFO client.RMProxy: Connecting to ResourceManager at /192.168.0.131:2015
14/11/13 09:58:58 INFO client.TezClient: Submitting DAG application with id: application_1415843888183_0002
14/11/13 09:58:58 INFO client.TezClient: Tez system stage directory hdfs://192.168.0.131:2014/mr-history/am/staging/inok/.staging/job_1415843888183_0002/.tez/application_1415843888183_0002 doesn't exist and is created
14/11/13 09:58:58 INFO client.TezClient: Submitting DAG to YARN, applicationId=application_1415843888183_0002, dagName=word count
14/11/13 09:58:58 INFO impl.YarnClientImpl: Submitted application application_1415843888183_0002
14/11/13 09:58:58 INFO client.TezClient: The url to track the Tez AM: http://inok-c0:2019/proxy/application_1415843888183_0002/
14/11/13 09:58:58 INFO client.RMProxy: Connecting to ResourceManager at /192.168.0.131:2015
14/11/13 09:58:58 INFO client.RMProxy: Connecting to ResourceManager at /192.168.0.131:2015
-----------------
When I submit a common mapreduce job in hue through oozie, there is an error
Cannot initialize Cluster. Please check your configuration for mapreduce.framework.name and the correspond server addresses
#oozie job --oozie http://localhost:11000/oozie --config examples/apps/java-main/job.properties -run
job: 0000003-141113143744303-oozie-inok-W
http://qnalist.com/questions/5187496/failing-to-run-hive-action-using-mapreduce-framework-name-yarn-tez
<property>
<name>mapreduce.framework.name</name>
<value>yarn-tez</value>
</property>
but in mapred-default.xml in hadoop-mapreduce-client-core-2.3.0.jar
<property>
<name>mapreduce.framework.name</name>
<value>local</value>
<description>The runtime framework for executing MapReduce jobs.
Can be one of local, classic or yarn.
</description>
</property>
----
try these mothods
1. cp tez-site.xml to etc/hadoop
2. cp all tez relavant jars to oozie share lib 's oozie dir and update to hdfs
3. check tez's example
References
http://blog.woopi.org/wordpress/?p=96
http://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.1.2/bk_installing_manually_book/content/rpm-chap-tez.html
相关推荐
tez:训练pytorch模型fastrrrr ....... tez:训练pytorch模型fastrrrr .......注意:当前,我们不接受任何拉取请求! 所有公共关系将被关闭。 如果您需要某个功能或某些功能不起作用,请创建一个问题。 意思是“锐利...
阿帕奇·特兹(Apache Tez) Apache Tez是一个通用的数据处理管道引擎,被设想为用于更高抽象的低级引擎,例如Apache Hadoop Map-Reduce,Apache Pig,Apache Hive等。 从本质上讲,tez非常简单,只有两个组成部分...
Tez:简单的pytorch培训师 注意:当前,我们不接受任何拉取请求! 所有公共关系将被关闭。 如果您需要某个功能或某些功能不起作用,请创建一个问题。 意思是“锐利,快速,活跃”。 这是一个简单的要点库,使您的...
在 Tez 上运行 Apache Hive 的 Docker 镜像此存储库包含一个 docker 文件,用于构建 docker 映像以在 Tez 上运行 Apache Hive。 这个 docker 文件依赖于我的其他包含和 基础镜像的存储库。当前版本Apache Hive(主干...
Storm-tez 使用TEZ在纱线POC上进行风暴
audioholic.tez 建立在Tezos区块链上的音乐流/购买平台。
阿托斯 (ATOS)数字式位置控制器Z-RI-TEZpdf,阿托斯 (ATOS)数字式位置控制器Z-RI-TEZ:数字式,与阀集成,适用于轴运动控制
包括pom修改的每个截图和配置,该文档从有道云笔记到处略加修改,其中pom内容格式需要你手动调整一下. 富含 大量截图帮助定位和配置. 含hive on tez 常见报错的解决方法. tez比spark更省心. spark容易出现内存问题.
1)Failing because I am unlikely to write too. 2)Caused by: java.lang.OutOfMemoryError: Java heap space ...5)hive on tez 最终insert的表如果使用到union all 时会导致直接查询结果表数据为空的
Apache TEZ 部署手册 的各个步骤,包括打包等步骤说明
源码使用的是apache-tez-0.8.3,对应的hadoop版本2.7.3,源码包中的nodejs的版本是v0.12.3,很难编译通过,最后把nodejs改成了v4.0.0才编译通过tez-ui2模块。
源码使用的是apache-tez-0.8.3,对应的hadoop版本2.8.3,源码包中的nodejs的版本是v0.12.3,很难编译通过,最后把nodejs改成了v4.0.0才编译通过tez-ui2模块。
最新版本tez-ui war包,可以解决tez编译问题出现tez-ui编译不进去的问题,现在可以吧这个拿出来自己配置到hadoop和tez上
学习大数据的小白用得到的apache tez源码,通过源码可以感受大牛们的代码风格和思维逻辑
apache tez 安装
tez-0.9.1.tar.gz(CDH6.3.2编译版)已安装测试
基于github tez最新版本编译,编译日期为2021-03-22,压缩包带有tar包和tez-ui的war包
基于hadoop 3.2.1和 TEZ 0.9.2 最新版本比编译的tar包 ,欢迎下载,欢迎使用,希望好用
apache-hive-2.3.6-bin.tar.gz & apache-tez-0.9.1-bin.tar.gz
Tez是一个Hive的运行引擎,性能优于MR.Tez可以将多个有依赖的作业转换为一个作业,这样只需写一次HDFS,且中间节点较少,从而大大提升作业的计算性能。