`

开放数据处理服务ODPS

    博客分类:
  • ODPS
阅读更多
操作手册下载
http://help.aliyun.com/view/11108327_13494938.html

快速操作手册

1,请登录 aliyun.com 官网 后在 “产 品服 务” 中选 择 “数据 处理 服务 ODPS”输入邀请码即可开通,更多的操作请在odpscmd中进行(类似mysql和oracle的客户端)
2,通过客户端管理使用 ODPS(请下载最新的客 户端),类似mysql的客户端程序, ODPS 客户端是一个 ODPS 程序,需要 JRE 环境才能运行,请下载并安装 JRE 1.6 以上版本。

下载ODPS的客户端

wget http://imgs-storage.cdn.aliyuncs.com/help/odps/odps-console.tar.gz



上传到某台本地服务器(支持linux和windows,建议最好使用linux服务器),并解压
2.1,tar zxvf odps-console.tar.gz
2.2,把Project名 称、相关云账号的accessId 和 accessKey的 值配置到clt的conf/odps_config.ini中, 如下:

project_name=xxxx
access_id=******
access_key=******
end_point=http://service.odps.aliyun.com/api  (注意:去掉"-inc”)


如何获得ID和key:
登陆www.aliyun.com  进入“我的阿里云”-->用户中心-->我的服务-->安全认证
或者登陆后直接访问:http://i.aliyun.com /access_key?spm=5176.7034181.0.0.vhx8wP

3,配置数据上传通道
plugins/tunnel/plugin.ini

command=com.aliyun.openservices.odps.console.tunnel.TunnelCommand

endpoint=http://dt.odps.aliyun.com(如果是阿里云的服务器,可以使用内网的endpoint=http://dt- ext.odps.aliyun-inc.com)
col.delimiter=44(分隔符的asc码,你可以使用其他的分隔符) 
row.delimiter=10 null.indicator=NULL
date.format=yyyyMMddHHmmss


说明:
endpoint=http://dt.odps.aliyun.com  :指定tunnel的endpoint 
col.delimiter=44             : 指定列分隔符,默认为44 "," 
row.delimiter=10             : 指定列分隔符,默认为10 "\n" 
null.indicator=NULL          : 指定空字符串,默认为空串。如果指定空值,可以把 此行删除掉 
date.format=yyyyMMddHHmmss   : 指定日期的format格式,默认为yyyyMMddHHmmss  
bad.discard=false            :指定脏数据是还丢弃,默认为false[目前只支持多列、少列是否忽略]


4,登陆ODPS
bin/odpscmd

执行help查看命令

5,上传和下载数据
上传: upload <tablename> [partition(spec)] from <filepath>;  如:upload pt_test partition(ds=nnnn,pt=2345) from data/pt1.txt;
下载:download <tablename> [partition(spec)] to <filepath>;


按照分区上传和下载数据
建表和partition 
create table tunnel_test (s string, i int, d datetime) partitioned by(ds string, pt string); 
alter table  tunnel_test add  partition(ds='d1',pt='p1'); 


编辑上传文件,如:
s1,11,20130910010101 
s2,22,20130911010101 
s3,33,20120911010101 

上传文件
upload tunnel_test partition (ds='d1',pt='p1') from data/upfile; 

下载文件
download tunnel_test partition (ds='d1',pt='p1') to data/downfile; 


也可使用SDK来上传数据。SDK的下载地址:
http://imgs-storage.cdn.aliyuncs.com/help/odps/odps_tunnel_ODPS_sdk.tar.gz



祝你好运!!
1
2
分享到:
评论

相关推荐

    阿里开放数据处理服务ODPS介绍.pptx

    阿里开放数据处理服务ODPS介绍.pptx

    阿里巴巴开放数据处理服务odps

    开放数据处理服务(Open Data Processing Service,ODPS)是基于飞天分布式系统构建的海 量数据处理和分析的服务平台,具有 PB 级别的数据处理能力, 主要适用于实时性要求不高 的海量数据处理,如数据分析、海量数据...

    阿里巴巴大数据与云计算技术分享 阿里云ODPS云计算产品介绍简介 阿里云开放数据处理服务ODPS介绍 共33页.pptx

    阿里云开放数据处理服务(Open Data Processing Service,简称ODPS) 是构建在飞 天系统上的大规模分布式数据处理服务。 ODPS以REST API的形式,支持用户提交 类SQL的查询语言,对海量数据进行处理。 在API之上,还...

    杨少华:阿里开放数据处理服务

    该文档来自2013中国大数据技术大会上,阿里巴巴公司杨少华关于阿里开放数据处理服务(ODPS)主题的演讲。

    odps操作手册

    开放数据处理服务(Open Data Processing Service,ODPS)是基于飞天内核构建的海量数据处理和分析的服务平台,它以RESTful API 形式提供服务,具有PB级别的数据处理能力,适用于数据分析、海量数据统计和挖掘等领域...

    ODPS权威指南-阿里大数据(63.34M)网盘链接

    ODPS(Open Data Processing Service)是阿里巴巴自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很...

    解析阿里云大数据服务——ODPS

    基于飞天的ODPS,对内是阿里集团30多个事业部唯一的大数据处理平台;对外,以RESTfulAPI对外提供数据仓库、数据挖掘和其他数据应用服务。阿里云总裁王文彬为之站场,称其为“中国进入大数据时代的里程碑”。阿里云有...

    大数据在金融业的应用-22.pptx

    十、ODPS:Open Data Processing Service,阿里云开放数据处理服务,可以处理来自淘宝、天猫、B2B、支付宝的交易数据、日志、聊天记录以及评价等各个方面的数据。 十一、事件式营销:将改变生活的事件(换工作、...

    云计算赋能互联网金融.pptx

    业务原始数据能力:10PB 时效:T+1业务:决策支持 平台: GP来源:单 BU 数据能力:100PB平台:ODPS 来源:外部开放 合作机构 外部商户20092010201220132014未来注:蚂蚁金服的数据处理能力示例能力:亿条 /m时效: ...

    复杂网络分析

    网络大数据挖掘中的正问题、反问题及其复杂性问题怎么处理? 如何表述和仿真陆海空天一体化的信息网络和通信网络? 如何借助复杂网络理论发掘、分析和解决行业、企业、城市的问题;如何借助复杂网络理论,...

Global site tag (gtag.js) - Google Analytics