资讯月刊下载

第121期(18-03)

2018年03月 - 总第121期
  • Java程序员开发常用的工具
  • 3月全球数据库排名:PostgreSQL 再迎暴涨
点击下载>>

第120期(18-02)

2018年02月 - 总第120期
  • 开源巨献:2017 年 Google 开源了这些超赞的项目
  • 关于区块链,程序员需要了解什么
点击下载>>

第119期(18-01)

2018年01月 - 总第119期
  • 编写高性能Java代码的最佳实践
  • 从15000个Python开源项目中精选的Top30,Github平均star为3707,赶紧收藏!
点击下载>>

更多月刊下载

活跃编辑

资讯编辑

转载新闻 [数据库] 别老扯什么Hadoop了,你的数据根本不够大

本文原名“Don't use Hadoop when your data isn't that big ”,出自有着多年从业经验的数据科学家Chris Stucchio,纽约大学柯朗研究所博士后,搞过高频交易平台,当过创业公司的CTO,更习惯称自己为统计学者。对了,他现在自己创业,提供数据分析、推荐优化咨询服务,他的邮件是:stucchio@gmail.com 。 “你有多少大数据和Hadoop的 ...
WnouM 评论(14) 有32415人浏览 2013-09-18 17 6

原创新闻 [开源软件] Hadoop 2.1.0 beta 版发布,HDFS SnapShot 特性一览

Hadoop 2.1.0 Beta 版 HDFS 提供了SnapShot 模块。用于数据备份、回滚,以防止因用户的失误操作导致集群出现问题。本文先做一个简单的介绍,其他的文章在来介绍Snapshot 本身的实现机制。 HDFS Snapshot有以下几个特性: Snapshot 创建的时间 复杂度为O(1),但是不包括INode 的寻找时间 只有当修改SnapShot时,才会有额外的内存 ...
jackchan 评论(9) 有10465人浏览 2013-08-28 4 0

转载新闻 [开源软件] 微软开源大数据框架 REEF

微软开发了一个名为REEF(Retainable Evaluator Execution Framework)的大数据框架,并计划在一个月左右将其开源。 8月12日上午,在芝加哥举行的Knowledge Mining and Data Discovery国际会议上,微软技术研究员兼信息服务CTO Raghu Ramakrishnan介绍了REEF框架和微软的开源计划。 REEF运行在YARN的 ...
WnouM 评论(0) 有6547人浏览 2013-08-14 1 2

原创新闻 [数据库] Mongo-Hadoop 1.1发布,利用Hadoop并行处理MongoDB中 ...

Hadoop擅长分析和处理大型数据集,而MongoDB擅长存储应用程序的大型数据集,这两者结合到一起,就诞生了Mongo-Hadoop——MongoDB主要负责存储和查询,Hadoop主要负责批处理。 今天Mongo开发团队发布了Mongo-Hadoop 1.1版本。 项目地址:https://github.com/mongodb/mongo-hadoop Mongo-Hadoop可以很容易地 ...
wangguo 评论(1) 有17491人浏览 2013-08-09 6 0

原创新闻 [互联网] 开源力量公开课第26期:大数据的实时分析与应用案例分 ...

开源力量公开课第26期课程题目:大数据的实时分析与应用案例分享 线下参课(¥30,简餐或饮料):上海市张江高科技园区碧波路635号(传奇广场三楼)IC咖啡 ,地铁二号线张江高科站 线上直播:发姓名+公司+职位+电话到osf@osforce.cn获取直播网址,邮件标题:开源力量公开课第26期 课程背景: 大数据已经从之前的”大“,慢慢转变为现在的”快“ 讲师介绍: 吴朱华,专注于云计算和 ...
开源力量公开课 评论(2) 有6346人浏览 2013-08-02 1 0

原创新闻 [开源软件] 开源力量公开课第24期 - 如何掌握Hadoop?

开源力量公开课第二十四期 - 为何Hadoop是分布式大数据处理的未来&如何掌握Hadoop? 开课时间:2013年07月30日 18:30 - 21:30 授课形式:现场 + 线上直播互动 报名热链(开放免费):http://www.osforce.cn/?p=1216 课程背景: 如果变庞大的Data为Money?Hadoop给出了很好的答案并在不断的完善这个答案。通过经典的 ...
fat1 评论(3) 有6561人浏览 2013-07-22 2 0

原创新闻 [数据库] MongoDB MapReduce 性能提升20倍的优化宝典

自从MongoDB被越来越多的大型关键项目采用后,数据分析也成为了越来越重要的话题。人们似乎已经厌倦了使用不同的软件来进行分析(这都利用到了Hadoop),因为这些方法往往需要大规模的数据传输,而这些成本相当昂贵。 MongoDB提供了2种方式来对数据进行分析:Map Reduce(以下简称MR)和聚合框架(Aggregation Framework)。MR非常灵活且易于使用,它可以很好地与分片( ...
wangguo 评论(3) 有32306人浏览 2013-07-09 13 8

原创新闻 [数据库] Hortonworks正式推出Windows版Hadoop数据平台

Apache Hadoop的主要贡献者Hortonworks近日正式发布了Windows平台版本的Hortonworks数据平台(HDP),这是一个100%开源的由Apache Hadoop驱动的数据平台。 Hadoop大多运行于Linux平台,此次HDP for Windows的发布,为Windows用户带来了与Linux平台一致的体验。 HDP for Windows允许企业组织能够获取、 ...
wangguo 评论(2) 有12257人浏览 2013-05-28 3 0

原创新闻 [互联网] 国内首套免费的大数据技术(Hadoop)视频教程上线

Hadoop作为Nutch的重要组成部分,在《Nutch相关框架视频教程》中具有举足轻重的地位。 目前Hadoop部分已经上线的内容为第9-16共8讲,主要内容有: cygwin下使用hadoop运行nutch、Hadoop单机本地模式 Ubuntu上的Hadoop单机伪分布式模式 Windows上的HADOOP单机伪分布式模式 Ubuntu上的Hadoop多机完全分布式模式 Hadoop分散 ...
yangshangchuan 评论(6) 有15195人浏览 2013-04-15 16 2

原创新闻 [互联网] Intel 推出优化版 Hadoop

Intel近日发布了一个Apache Hadoop的优化版本,该版本在原有Hadoop的基础上,针对Intel的Xeon(至强)处理器、SSD驱动器和10GbE网络进行了优化。 Intel版Hadoop致力于提高原框架的性能和安全性。据Intel称,通过框架和硬件的改善,之前分析1TB数据需要4个小时,现在只需7分钟。 Intel版Hadoop还包括该公司开发的一些部署、配置和监控工具,帮助 ...
wangguo 评论(3) 有8473人浏览 2013-02-28 8 1

转载新闻 [开源软件] RedHat开源其Hadoop存储系统

作为大数据+混合云业务战略的一部分,Red Hat没有选择推出自己的hadoop商业版本或者收购一家Hadoop发行厂商,而是推出了首个Hadoop HDFS文件存储系统的开源替代产品。 Red Hat本周三宣布开源其Red Hat Storage Hadoop插件,作为HDFS的替代产品。RedHat Storage hadoop插件基于Gluster文件系统——Red Hat于2011年以1. ...
WnouM 评论(2) 有8490人浏览 2013-02-22 6 0

转载新闻 [互联网] Facebook技术总监:如何管理10亿用户的数据?

Facebook用户数量,已经突破10亿大关。Facebook在发展期间,所实现的技术成就,成为了IT行业工程师关注的话题。究竟Facebook取得了哪些技术成就呢?Facebook前工程部门总监,在问答网站Quora上,对这一问题作出回答。无论对于IT行业的投资者还是使用者,这些回答都有着指导意义。 以下是文章全文: 我在Facebook的基础架构软件开发团队,工作了5年,并且参与了多数项目 ...
WnouM 评论(11) 有8656人浏览 2013-01-28 6 1

转载新闻 [行业应用] 2013云计算热门话题:大数据分析和CloudStack

随着云计算从测试进入到生产环境中,现实世界中围绕着云计算的细节的探讨愈演愈烈。我们找到了新年中云计算呈现的趋势。这些热门话题可能还不是最热的,但是2012年已经技术,兴趣点开始升温,一些云计算问题和主旨我们将要在2013年来面对。 大数据分析 今年已经证实了大数据的能量以及其能为企业带来的具有竞争力的优势。根据Gartner的内容,通过对于Web的研究,看到在2013年大数据的影响是唯一扩大 ...
openstack 评论(0) 有5738人浏览 2013-01-10 2 0

原创新闻 [数据库] Intel开源GraphBuilder,大数据图形化工具

Intel近日开源了GraphBuilder测试版本的源码。 GraphBuilder由英特尔研究院(Intel Labs)开发,是首个针对大数据的可扩展的开源Java库,可以将大数据集构建成图形——能够反映数据之间关系的网络状结构图,帮助行业和学术界的科学家或数据分析师快速分析大型数据集。 GraphBuilder使用MapReduce并行编程模型进行扩展,其主要组件及与Hadoop MapR ...
wangguo 评论(1) 有6618人浏览 2012-12-10 4 0

原创新闻 [开源软件] Apache Hadoop 2.0 Alpha 版发布

Apache Hadoop社区近日发布了最新的Apache Hadoop 2.0 Alpha版本,这标志着Apache Hadoop进入了一个新的分支。 Hadoop是Apache的顶级开源项目,由前雅虎开发者Doug Cutting(也是Nutch和Lucene的创始人)开发的分布式计算平台,是一个能够对大量数据进行分布式处理的框架。用户可以在不了解分布式底层细节的情况下开发分布式程序,充分利 ...
wangguo 评论(3) 有7491人浏览 2012-05-29 8 0

原创新闻 [数据库] Pentaho开源部分大数据产品,移植Kettle项目到Apache ...

据国外媒体报道,Pentaho开发商近日开源了部分数据集成软件,并将整个Kettle数据集成平台移植到Apache 2.0许可证下,以便从目前蓬勃发展的Hadoop和NoSQL业务中得到更多的份额,从而奠定其在大数据市场的地位。 Pentaho是目前世界上最流行的开源商务智能(Business Intelligence,BI)解决方案。它是一个基于Java平台的BI套件,包括一个Web Serv ...
wangguo 评论(6) 有8856人浏览 2012-02-10 5 0

最近热门TAG

Java(1854) Google(1441) Android(1244) JavaScript(842) Web(669) Linux(648) 框架(605) Windows(591) 浏览器(540) HTML5(533) Firefox(483) jQuery(480) iOS(479) Ruby(427) Chrome(386) HTML(380) 编程(365) 工作(349) Apache(346) Python(328)

热门资讯

Global site tag (gtag.js) - Google Analytics