阅读更多
Apache软件基金会今天宣布,Spark项目已从孵化器毕业,成为Apache软件基金会的一个顶级项目。



Spark是一个高效的分布式计算系统,发源于美国加州大学伯克利分校AMPLab的集群计算平台。

Spark被称为“Hadoop的瑞士军刀”,拥有非凡的速度和易用性。Spark立足于内存计算,相比Hadoop MapReduce,Spark在性能上要高100倍,而且Spark提供了比Hadoop更上层的API,同样的算法在Spark中实现往往只有Hadoop的1/10或者1/100的长度。

目前Spark在全球已有广泛的应用,其中包括阿里巴巴、Cloudera、Databricks、IBM、Intel、雅虎等。

Spark自2013年6月进入Apache的孵化器以来,已经有来自25个组织的120多位开发者参与贡献。

Spark项目官网:http://spark.apache.org/

Via Apache
  • 大小: 11.2 KB
7
0
评论 共 2 条 请登录后发表评论
2 楼 lyongq04 2014-03-03 14:16
Apache咋啥都叫瑞士军刀,Apache activemq也叫瑞士军刀~
1 楼 ddd_5858 2014-02-28 14:16
正在学习中

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 3.2.1 spark体系之分布式计算-spark-core之离线计算-初识Spark

    Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行计算框架,Spark拥有Hadoop MapReduce所具有的...

  • 官宣!Apache Doris 从 Apache 孵化器毕业,正式成为 Apache 顶级项目

    Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目!

  • Apache顶级项目-Kylin

    说到Apache顶级开源项目,大家首先会想到什么??? 不熟悉Apache软件基金会的朋友也不用担心,大家可以去Apache官网,下拉到最下边的页面,查看Apache有哪些开源项目。 相信各位朋友在项目清单中肯定会看到...

  • 分布式系统开发实战:分布式计算,分布式计算常用技术

    作为世界领先的科技公司,Google公司为了应对大数据的处理,内部已经实现了数以百计的为专门目的而写的计算程序,其中MapReduce就是其著名的计算框架之一,与GFS、Bigtable一起被称为Google技术的“三宝”。...

  • apache spark_Apache Spark现在是一个顶级项目

    Apache软件基金会 (ASF)高兴地宣布, Apache Spark已从Apache Incubator毕业,成为一个顶级项目(TLP) ,这表明该项目的稳定性。 Apache Spark是一个开放源代码群集计算框架,用于快速,灵活地进行大规模数据...

  • Spark分布式内存计算框架

    Spark是一种基于内存的、用以实现高效集群计算的平台。Spark有着自己的生态系统,但同时兼容HDFS、Hive等分布式存储系统,可以完美融入Hadoop的生态圈中,代替MapReduce去执行更高的分布式计算。

  • Apache Spark 成为 Apache 基金会顶级项目

    Apache 基金会宣布旗下的 Apache Spark 项目成为基金会的顶级项目,拥有顶级域名 http://spark.apache.org/ 基金会称 Spark 的用户包括:阿里巴巴、Cloudera、Databricks、IBM、英特尔和雅虎。 Apache Spark 是一种...

  • Apache Doris 成为 Apache 顶级项目

    Apache Doris 成为 Apache 顶级项目

  • 官宣!Apache Doris 从 Apache 孵化器毕业,正式成为 Apache 顶级项目!

    全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于美国时间 2022 年 6 月 16日 宣布,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP)。以下内容译自 ...

  • 盘点 35 个 Apache 顶级项目,我拜服了…

    原文 盘点 35 个 Apache顶级项目 文章目录 Apache 软件基金会 顶级开源项目 基础组件项目 1、Apache(httpd) 2、Tomcat 3、Commons 4、POI 5、HttpComponents 6、logging services 7、Ant 8、Maven 9、Subversion ...

  • 【Spark分布式内存计算框架——Spark Streaming】2. Streaming 概述(下)Streaming 计算模式、SparkStreaming 计算思想

    流式处理任务是大数据处理中很重要的一个分支,关于流式计算的框架也有很多,如比较出名的Storm流式处理框架,是由Nathan Marz等人于 2010 年最先开发,之后将Storm开源,成为Apache 的顶级项目,Trident 对Storm...

  • 数据湖:分布式开源处理引擎Spark

    Apache Spark是一种高效且多用途的集群计算平台。换句话说,Spark 是一种开源的,大规模数据处理引擎。它提供了一整套开发 API,包括流计算、机器学习或者SQL。Spark 支持批处理和流处理。批处理指的是对大规模数据...

  • Apache Doris 从 Apache 孵化器毕业,正式成为 Apache 顶级项目!

    全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于美国时间 2022 年 6 月 16 日 宣布,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP)。以下内容译至...

  • 基于Kafka和Spark实现实时计算系统

    它最初是由LinkedIn开发并开源的,现在已经成为Apache软件基金会旗下的顶级项目之一。Kafka主要用于实时流数据的高吞吐量传输、存储和处理,例如日志收集、流式的ETL以及实时的Web日志等。Apache Spark是一个用于大...

  • Apache Spark现在是一个顶级项目

    Apache软件基金会 (ASF)高兴地宣布, Apache Spark从Apache Incubator毕业,成为一个顶级项目(TLP) ,这表明该项目的稳定性。 Apache Spark是一个开放源代码群集计算框架,用于快速,灵活地进行大规模数据分析...

  • 【分布式计算框架】Spark 集群搭建与示例运行 | RDD算子入门

    Apache Spark 是一个快速的, 多用途的集群计算系统, 相对于 Hadoop MapReduce 将中间结果保存在磁盘中, Spark 使用了内存保存中间结果, 能在数据尚未写入硬盘时在内存中进行运算 Spark 只是一个计算框架, 不像 ...

  • 盘点Apache的11个顶级项目

      自1999年成立至今,Apache 软件基金会已成功建立起自己强大的生态...从孵化器里毕业的项目,要么独立成为顶级项目,要么成为其他顶级项目的子项目。 为便于大家了解 Apache 孵化的标准,本文盘点了 A...

  • 从事大数据岗位,个人常用的Apache顶级项目

    02 频繁打交道的几个Apache顶级项目 个人目前从事工作内容包括大数据分析、大数据算法以及部分大数据开发相关,所用到的技术栈主要包括: 1)Hadoop:提起大数据想必人人皆知Hadoop,狭义的讲,hadoop是yarn资源调度...

  • 盘点2021年Apache年报中出现的国产项目

    盘点2021年Apache年报中出现的国产项目1、引言2、项目盘点2.1 ShardingSphere2.2 IoTDB2.3 Carbon Data 1、引言 2021年8 月 31 日,Apache 软件基金会发布 2021 财年(2020 年 5 月 1 日 - 2021 年 4 月 30 日)年度...

  • Mysql 教程(Markd格式 经典全面 看这一个资料就够了)

    Mysql 教程(Markd格式 经典全面 看这一个资料就够了)涵盖了mysql工作流、事务、锁、索引、性能优化、运维和配置等各个方面。

Global site tag (gtag.js) - Google Analytics