`
derlang
  • 浏览: 33761 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论

云存储浅析

阅读更多
GFS/BigTable/App Engine
HDFS/HBase/
Dynamo/S3/SimpleDB/EC2

比较Google和Amazon各自的存储模型,是很有趣的事情,他们的这些工作是目前云计算圈子里技术灵感的源泉,也是几十年来分布式系统理论研究应用的一个集大成之作。

存储虚拟化

文件系统抽象
数据库系统抽象

分布式存储系统

分布式文件系统
分布式数据库系统

key-value存储是更抽象的接口,或者叫对象存储系统,对象OID索引到对象
比较BigTable/HBase/Dynamo???

问题的关键在于:

功能性要求
性能要求(high throughput, low latency).
非功能性要求(容错,伸缩性,存储系统暂不考虑信息安全性)

解决思路在于大规模集群技术。
replication cluster
load balance cluster

由replication自然引起consistency模型的问题,这是整个存储系统中最困难的一个地方。再加上concurrency control的考虑,整个问题的复杂度倍增,这是个组合问题。

replication * concurrency = consistency.

相比于传统数据库ACID的要求,云存储主要是加入了replication的因素。

进一步的考虑,需要对数据进行partition,或者说hash.一个大文件划分成多个数据块,一个大表划分成几个部分。系统需要维护这种映射关系。在google和hadoop架构下,是通过中心服务器来管理的,master server,这就导致系统单点问题。amazon则通过分布式dht来做,节点是虚拟的,所有虚拟节点构成ring。

replication同步机制
GFS是同步模型
Dynamo是异步模型

同步模型的一致性易于做到些(考虑到容错,其实也不那么直接),异步模型必然要引出多版本的概念

failure detector

Google chubby闪亮登场
解决分布式系统中必须解决的一个全局状态问题。
SPOF问题
集群配置

API和协议

NFS
Fuse
CIFS

key-value存储系统接口

SOAP
RESTful

云存储解决了数据存储的问题,如何在如此大量的数据里面,进行必要的分析,挖掘到有用的信息,就进入并行计算的领域,这方面Map/Reduce独领风骚。这个思想是受FP的启发而出现的。FP在并行计算领域有独特优势(?),现在许多FPL的社区慢慢的热闹起来,这是一个重要原因。





分享到:
评论

相关推荐

    浅析基于Web的云存储技术

    云存储是一种新兴的网络存储服务,本文介绍存储的定义,分析云存储的种类,结构模型,相关技术支持,总结云存储的优势

    分布式云存储系统的数据迁移优化策略浅析.pdf

    #资源达人分享计划#

    浅析私有云存储技术在数据中心中的应用

    随着社会的日益发展,云存储技术在数据中心中的应用越来越广泛,人们对于数据与信息的需求日益增大,旧方式的单纯固定化的数据存储方式,在一定程度上已经无法满足当前数据中心信息数据的存储与扩展。具体介绍了数据...

    高清智能“云”安防 监控云存储技术浅析

    高清和智能应用于安防行业越发广泛,业界就已经把如何存储解决大数据量的问题提到了研发攻关重点。由于IT行业云技术的较快发展与应用,很多企业为了对数据进行有效的管理,于是就引入了云的概念,云储存便开启了它...

    浅析Docker私有镜像库与阿里云对象存储 OSS

    在本篇文章中我们给大家分享了关于Docker私有镜像库与阿里云对象存储 OSS的相关知识点内容,有需要的朋友们参考下。

    云计算介绍和应用资料合集33篇.zip

    农业云计算及云存储设计 虚拟化与云计算 迎接云计算时代 云分布与动态云计算 云计算:Google云计算原理 云计算“云” 云计算7 微软云计算 云计算ACA题库 云计算PIG的使用 云计算简史 云计算课件—云存储 云计算课件...

    [详细完整版]浅析云计算.pdf

    计 算 机 与 网 络 网 事 林 琳 浅析云计算 互联网自 1960 年开始兴起, 最初主要用于军方、 大型企 业等之间的纯文字电子邮件或新闻集群组服务。 直到 1990 年 才开始进入普通家庭,随着 Web 网站与电子商务的发展...

    浅析大数据的重要性.doc

    然而大数据整合功能的实现,必须依托 云计算分布式的处理、公布式的数据库、云存储或虚拟化的技术,方能实现对海量数据 的挖掘。[1] 互联网技术的突飞猛进,引发了数据信息以磅礴之势发展,反过来作用于互联网,促 ...

    浅析发票识别.docx

    2、财务发票扫描影像:将所有票据进行图像扫描,存储在电脑系统中,以便于资料保存及查看,同时防止票据丢失及信息篡改。。 3、会计人工录入:手动将发票信息手工录入进电脑里,或者直接录入到财务系统中; 4、凭证...

    云端下媒介组织层面的变革 (2012年)

    云计算和云存储的实质是通过集群的方式进行分布式计算和存储从而提供高效的计算能力和大量的存储空间“.云端”为媒介融合提供了一个更宽广的平台,在实现情境中受到组织架构、业务流程等限制而难以实现的“媒介融合”...

    云计算技术在通信运营商的应用浅析

    云计算(CloudComputing)就是将大量用网络连接的计算、I/O、存储及网络资源统一管理和调度,构成一个资源池向用户提供按需服务。提供资源的网络系统被称为“云”,“云”中的资源在使用者看来可以轻松扩展、随时获取...

    Postgresql中国用户大会 2016(PG大象会)所有PPT汇总.zip

    范孝剑-阿里云-PG优化器浅析.pdf 张广舟-阿里云-ApsaraDB for Greenplum介绍.pdf 高金芳-平安科技-PostgreSQL反向代理redis.pdf 张文杰-阿里云-PostgreSQL流复制优化.pdf 何祖文-贵州云飞-PG与智慧物流....

    大数据环境下mongoDB为何要加索引浅析

    mongodb在存储大数据时,对查询的字段需要添加索引,我测试的是阿里云30多万的数据量,不加索引查询已经到8秒,而添加索引之后是毫秒级! 为集合加索引 mongodb支持内嵌属性添加索引 db.agencyTotal.createIndex...

    Gdevops广州 2021年全球敏捷运维峰会PPT合集(17份).zip

    浅析数字化转型与产业互联网 低成本全链路监控实战与SRE稳定性运营 面向终态的应用交付管理实践 企业一站式DevOps平台建设实践 维稳618和双11:数据库海量运维的生态体系建设与实践 银行复杂架构下的数据库敏捷运维 ...

    Gdevops广州站 2021年全球敏捷运维峰会PPT合集(17份).zip

    浅析数字化转型与产业互联网 低成本全链路监控实战与SRE稳定性运营 面向终态的应用交付管理实践 企业一站式DevOps平台建设实践 维稳618和双11:数据库海量运维的生态体系建设与实践 银行复杂架构下的数据库敏捷运维 ...

    2021 Gdevops全球敏捷运维峰会(广州站)4个专题共17份.zip

    浅析数字化转型与产业互联网.pdf 数据库专场 ABC场景驱动下,如何制定数据库与存储技术规划.pdf TDengine的创新与最佳应用场景.pdf 基于ClickHouse+StarRocks构建支撑千亿级数据量的高可用查询引擎.pdf 如何打造...

    物联网+云计算+大数据+人工智能的关系.pdf

    物联网+云计算+大数据+人工智能 之间关系浅析 通过物联网产生、收集海量的数据存储于云平台,在通过大数据分析,甚至更高形式的人工智 能为人类的生产活动,生产所需提供更好的服务。这必将是第四次工业革命的方向。...

    大型分布式网站架构设计与实践.带目录书签.完整版.rar

    陈康贤,淘宝花名龙隆,淘宝技术部研发工程师,2011年加入淘宝网,参与了阿里云手机商城、口碑网迁移、店铺建站、offer、支付宝卡宝、生活商城、淘宝同学等项目,在分布式系统架构设计、高并发系统设计、系统稳定性...

Global site tag (gtag.js) - Google Analytics