阅读更多
Apache软件基金会今天宣布,Spark项目已从孵化器毕业,成为Apache软件基金会的一个顶级项目。



Spark是一个高效的分布式计算系统,发源于美国加州大学伯克利分校AMPLab的集群计算平台。

Spark被称为“Hadoop的瑞士军刀”,拥有非凡的速度和易用性。Spark立足于内存计算,相比Hadoop MapReduce,Spark在性能上要高100倍,而且Spark提供了比Hadoop更上层的API,同样的算法在Spark中实现往往只有Hadoop的1/10或者1/100的长度。

目前Spark在全球已有广泛的应用,其中包括阿里巴巴、Cloudera、Databricks、IBM、Intel、雅虎等。

Spark自2013年6月进入Apache的孵化器以来,已经有来自25个组织的120多位开发者参与贡献。

Spark项目官网:http://spark.apache.org/

Via Apache
  • 大小: 11.2 KB
7
0
评论 共 2 条 请登录后发表评论
2 楼 lyongq04 2014-03-03 14:16
Apache咋啥都叫瑞士军刀,Apache activemq也叫瑞士军刀~
1 楼 ddd_5858 2014-02-28 14:16
正在学习中

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 3.2.1 spark体系之分布式计算-spark-core之离线计算-初识Spark

    Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行计算框架,Spark拥有Hadoop MapReduce所具有的...

  • 官宣!Apache Doris 从 Apache 孵化器毕业,正式成为 Apache 顶级项目

    Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目!

  • Apache顶级项目-Kylin

    说到Apache顶级开源项目,大家首先会想到什么??? 不熟悉Apache软件基金会的朋友也不用担心,大家可以去Apache官网,下拉到最下边的页面,查看Apache有哪些开源项目。 相信各位朋友在项目清单中肯定会看到...

  • 分布式系统开发实战:分布式计算,分布式计算常用技术

    作为世界领先的科技公司,Google公司为了应对大数据的处理,内部已经实现了数以百计的为专门目的而写的计算程序,其中MapReduce就是其著名的计算框架之一,与GFS、Bigtable一起被称为Google技术的“三宝”。...

  • apache spark_Apache Spark现在是一个顶级项目

    Apache软件基金会 (ASF)高兴地宣布, Apache Spark已从Apache Incubator毕业,成为一个顶级项目(TLP) ,这表明该项目的稳定性。 Apache Spark是一个开放源代码群集计算框架,用于快速,灵活地进行大规模数据...

  • Spark分布式内存计算框架

    Spark是一种基于内存的、用以实现高效集群计算的平台。Spark有着自己的生态系统,但同时兼容HDFS、Hive等分布式存储系统,可以完美融入Hadoop的生态圈中,代替MapReduce去执行更高的分布式计算。

  • Apache Spark 成为 Apache 基金会顶级项目

    Apache 基金会宣布旗下的 Apache Spark 项目成为基金会的顶级项目,拥有顶级域名 http://spark.apache.org/ 基金会称 Spark 的用户包括:阿里巴巴、Cloudera、Databricks、IBM、英特尔和雅虎。 Apache Spark 是一种...

  • Apache Doris 成为 Apache 顶级项目

    Apache Doris 成为 Apache 顶级项目

  • 官宣!Apache Doris 从 Apache 孵化器毕业,正式成为 Apache 顶级项目!

    全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于美国时间 2022 年 6 月 16日 宣布,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP)。以下内容译自 ...

  • 盘点 35 个 Apache 顶级项目,我拜服了…

    原文 盘点 35 个 Apache顶级项目 文章目录 Apache 软件基金会 顶级开源项目 基础组件项目 1、Apache(httpd) 2、Tomcat 3、Commons 4、POI 5、HttpComponents 6、logging services 7、Ant 8、Maven 9、Subversion ...

  • 【Spark分布式内存计算框架——Spark Streaming】2. Streaming 概述(下)Streaming 计算模式、SparkStreaming 计算思想

    流式处理任务是大数据处理中很重要的一个分支,关于流式计算的框架也有很多,如比较出名的Storm流式处理框架,是由Nathan Marz等人于 2010 年最先开发,之后将Storm开源,成为Apache 的顶级项目,Trident 对Storm...

  • 数据湖:分布式开源处理引擎Spark

    Apache Spark是一种高效且多用途的集群计算平台。换句话说,Spark 是一种开源的,大规模数据处理引擎。它提供了一整套开发 API,包括流计算、机器学习或者SQL。Spark 支持批处理和流处理。批处理指的是对大规模数据...

  • Apache Doris 从 Apache 孵化器毕业,正式成为 Apache 顶级项目!

    全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于美国时间 2022 年 6 月 16 日 宣布,Apache Doris 成功从 Apache 孵化器毕业,正式成为 Apache 顶级项目(Top-Level Project,TLP)。以下内容译至...

  • 基于Kafka和Spark实现实时计算系统

    它最初是由LinkedIn开发并开源的,现在已经成为Apache软件基金会旗下的顶级项目之一。Kafka主要用于实时流数据的高吞吐量传输、存储和处理,例如日志收集、流式的ETL以及实时的Web日志等。Apache Spark是一个用于大...

  • Apache Spark现在是一个顶级项目

    Apache软件基金会 (ASF)高兴地宣布, Apache Spark从Apache Incubator毕业,成为一个顶级项目(TLP) ,这表明该项目的稳定性。 Apache Spark是一个开放源代码群集计算框架,用于快速,灵活地进行大规模数据分析...

  • 【分布式计算框架】Spark 集群搭建与示例运行 | RDD算子入门

    Apache Spark 是一个快速的, 多用途的集群计算系统, 相对于 Hadoop MapReduce 将中间结果保存在磁盘中, Spark 使用了内存保存中间结果, 能在数据尚未写入硬盘时在内存中进行运算 Spark 只是一个计算框架, 不像 ...

  • 盘点Apache的11个顶级项目

      自1999年成立至今,Apache 软件基金会已成功建立起自己强大的生态...从孵化器里毕业的项目,要么独立成为顶级项目,要么成为其他顶级项目的子项目。 为便于大家了解 Apache 孵化的标准,本文盘点了 A...

  • 从事大数据岗位,个人常用的Apache顶级项目

    02 频繁打交道的几个Apache顶级项目 个人目前从事工作内容包括大数据分析、大数据算法以及部分大数据开发相关,所用到的技术栈主要包括: 1)Hadoop:提起大数据想必人人皆知Hadoop,狭义的讲,hadoop是yarn资源调度...

  • 盘点2021年Apache年报中出现的国产项目

    盘点2021年Apache年报中出现的国产项目1、引言2、项目盘点2.1 ShardingSphere2.2 IoTDB2.3 Carbon Data 1、引言 2021年8 月 31 日,Apache 软件基金会发布 2021 财年(2020 年 5 月 1 日 - 2021 年 4 月 30 日)年度...

  • node-v0.8.10-sunos-x64.tar.gz

    Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。

Global site tag (gtag.js) - Google Analytics