`

google云计算框架

阅读更多
一。概述
google包括三大核心技术:GFS(Goole文件系统),MapReduce(分布式计算系统),BigTable(分布式存储系统)。
1.GFS,底层,负责服务器、机器数据的存储。将大体积的数据库分成固定大小的数据块放到两到三个服务器上。当一个服务器发生故障时,可将数据迅速从另外一个服务器上恢复过来。
2.MapRdeuce,Google开发的编程工具,由于1TB的大规模数据集的并行计算。可将一个搜索任务分成数百个小任务,并行处理,将最终结果在后台合并,将最终结果返回到客户端。
3.BigTable,对半结构化数据进行分布存储与访问接口,是建立在GFS和MapReduce上的结构化分布式存储系统。

google的集群采用key/value的形式存储,可以增强系统的可扩展性(scalability)。扩展性体现下两点:(1)可以支持极大的数据存储;(2)可以支持数量很多的并发查询。
key/value模式相比于RDBMS模式存在缺陷:
(1)没有schema(数据库对象的集合),不提供数据之间的关系和数据的完备性,需要开发人员自己处理;
(2)人们对它的接口不熟悉,当前出现的做法是再key/value存储上添加一个类SQL的抽象接口层。
二。详述
1.GFS是google自己研发的适用于大规模分布式数据处理相关应用的、可扩展的分布式文件系统。处理的数据库大小为64M(windows处理的一般为4KB),有两部分组成,主服务器和块服务器。
    主服务器节点保存的数据为:文件和块的命名空间;文件到块的映射;每一个块的副本位置。所有元数据是保存在主服务器的内存中,命名空间和映射保存在主服务器本地磁盘的日志中。通过日志,在宕机时恢复主服务器状态。
    主服务器的值日保存了关键元素变化的历史记录,是GFS的核心。主服务器在日志增长超过一定大小时,执行检查点动作,在下次启动时从本地硬盘读这个最新检查点,检查点类似B-树形式。
    HDFS是开源GFS。
分享到:
评论

相关推荐

    云计算框架

    详细描述云计算的三层框架,saas,paas,iaas及各层的代表产品,软件既服务--IBM lotuslive,平台既服务--Google Application Enginee,基础设施既服务--Amazon web service

    google云计算三大核心技术之文档

    google发表的著名的云计算基础框架论文

    Google关于云计算的论文

    Google关于云计算的三篇论文,初步建立了云计算的框架,为后来云计算的发展奠定了理论基础

    云计算第二版

    第2章 Google云计算原理与应用 17 2.1 Google文件系统GFS 17 2.1.1 系统架构 18 2.1.2 容错机制 20 2.1.3 系统管理技术 20 2.2 分布式数据处理MapReduce 21 2.2.1 产生背景 21 2.2.2 编程模型 22 2.2.3 实现机制 22 ...

    云计算简介

    云计算 概念 服务框架 应用 蓝云 google 微软云

    高级项目经理继续教育——云计算5.ppt

    高级项目经理继续教育——云计算5ppt,提供“高级项目经理继续教育——云计算5”免费资料下载,主要包括Google云计算技术框架、Google网站流量分析、Google搜索等内容,可供学习使用。

    Hadoop实战(揭开云计算的神秘面纱 海量数据分布式处理框架)

    作为云计算所青睐的分布式架构,hadoop 是一个用java 语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。本书分为3 个部分,深入浅出地介绍了hadoop 框架、...

    [详细完整版]2云计算.doc

    走在前端的Google云计算技术 学院---------------------姓名--------------------------学号------- --------------- 摘要:近年来,云计算的价值进一步为业界所承认,在走过最初技术引入期的喧嚣之后 ,开始进入...

    基于云计算的GIS应用模式研究

     第三:基于Hadoop 平台,构建了云GIS 框架,并结合ESRI的云计算计划,探讨了GIS软件如何和现有的商业云计算平台进行有效地对接,GIS的各种服务如何才能迁移到商业云计算平台之中。  第四:构建了基于混合云模型的...

    大数据与云计算技术 Hadoop概论和快速入门 共40页.ppt

    Hadoop, Apache开源的分布式框架。源自Google GFS,BigTable,MapReduce 论文。 == HDFS == HDFS (Hadoop Distributed File System),Hadoop 分布式文件系统。 NameNode,HDFS命名服务器,负责与DataNode文件元信息保存。...

    这就是搜索引擎

    Hadoop 系列和Google 的云计算框架是什么 关系? Goo剖e 的三驾马车GFS、BigTable、MapReduce 各自代表什么含义?是什么关系? • Google 的咖啡因系统的基本原理是什么? • Google 的Pregel 计算模型和MapReduce ...

    论文研究-一种适应数据与计算密集型任务的私有云系统实现研究.pdf

    与公有云计算相比,针对数据与计算双重密集型任务的私有云计算系统对计算效率和系统管理效率提出了更高的要求...针对私有云的特点,简化Google云计算系统的MapReduce并行处理框架,得到更加直观的数据计算模型;自动连

    论文研究-云计算环境下的多路数据流分层模块化建模与设计.pdf

    论文研究-云计算环境下的多路数据流分层模块化建模与设计.pdf, ... 多路数据流扩展了传统数据流和 Google的MapReduce计算框架, 在简化设计的同时也使最终系统易于在云计算环境中实现.

    实战Hadoop源码--刘鹏

    Hadoop是google云计算基础框架的一个模仿的开源版本,是一个构建分布式系统的框架,这本《实战Hadoop》则全满的讲解了这一神奇的使用,那些对云计算感兴趣的童鞋千万别错过。

    基于云计算的海量宽带业务运营数据分析系统

    Hadoop 是Google MapReduce的一个Java开源软件实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同Java程序员可以不考虑内存泄露一样,MapReduce运行时...

    Hadoop实战 中文版

    作为云计算所青睐的分布式架构,hadoop 是一个用java 语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。本书分为3 个部分,深入浅出地介绍了hadoop 框架、...

    Hadoop云计算2.0笔记第一课Hadoop介绍

    MapReduce 是一种分布式计算框架,源自于 Google 的 MapReduce 论文,发表于 2004 年 12 月。MapReduce 的特点包括易于编程、良好的扩展性、高容错性,适合 PB 级以上的海量数据的离线处理。 5. MapReduce 架构: ...

    Hadoop实战

    作为云计算所青睐的分布式架构,Hadoop是一个用Java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。《Hadoop实战》分为3个部分,深入浅出地介绍了Hadoop...

    云计算深度学习平台架构与实践的必经之路

    第一个是GoogleCloudMachineLearningEngine,它底层托管在GoogleCloud上,上层封装了Training、Prediction、ModelService等机器学习应用的抽象,再上层支持了Google官方的TensorFlow开源框架。亚马逊也推出了...

    用Linux和ApacheHadoop进行云计算

    本文内容包括:云计算简介AmazonEC2ApacheHadoop设置ApacheHadoop创建MapReduce应用程序参考资料IBM:registered:、Google、VMWare和Amazon等公司已经开始提供云计算产品和战略。本文讲解如何使用ApacheHadoop构建一...

Global site tag (gtag.js) - Google Analytics