`
coderplay
  • 浏览: 571360 次
  • 性别: Icon_minigender_1
  • 来自: 广州杭州
社区版块
存档分类
最新评论

演讲: Hadoop与数据分析

阅读更多
前些天受金山软件公司西山居朋友的邀请, 去了趟珠海与金山的朋友们分享Hadoop与数据分析的相关经验.
附件是此次分享的ppt, 里面有一些图是来自网上。
5
2
分享到:
评论
4 楼 asiacomeon 2013-01-02  
非常感谢,现在搞研究做工程都要用map/reduce,刚上手比较纠结....
3 楼 danfeihao 2011-04-22  
下载学习了,多谢
2 楼 sealbird 2010-07-02  
敏敏,越来越看不清你了 
1 楼 mryufeng 2010-05-31  
写的很不错哦 会讲故事了。

相关推荐

    大数据时代下金融数据分析变革

    活动现场,文思海辉副总裁符海鹏做了 《大数据时代下的金融数据分析变革》主题演讲 ,并与大家分享了中国金融服务业所面临的挑战,“利率市场化加剧市场竞争”的内忧;“传统金融业务遭遇互联网金融冲击”的外患;金融...

    利用Impala+Kudu构建准实时分析应用

    解决了传统Lamda架构处理Hadoop上快速变化数据的存储和处理技术过于复杂的问题,同时Kudu能够与Hadoop生态的其他组件比如Impala、Spark、Flume和Kafka等组件集成,大大降低了对快速变化的数据进行准实时分析的架构...

    2015 Spark技术峰会-Spark驱动智能大数据分析应用-Phil Tian(田凤占)

    Cloudera高级架构师Phil Tian(田凤占)在OpenCloud 2015大会Spark专场的演讲PPT:Spark驱动智能大数据分析应用,谈到了在与Hadoop社区良好集成的同时,Spark当下已经得到更广泛社区和提供商的支持,还通过多个公司...

    2012年数据库技术大会演讲PPT.zip

    黄志洪—大数据分析的案例、方法与挑战 韩卿——eBay 商务智能平台架构实践 专场5:SQL Server应用专场—演讲嘉宾及主题 王翔——ORACLE SQL平滑退出方案 王成辉—高并发性的设计和优化 朱海峰—新数据时代的微软...

    Tim Tully:集成Spark/Shark到雅虎数据分析平台

    该文档来自Spark Summit 2013峰会上Yahoo高级工程师Tim Tully的主题演讲。Tim Tully从Hadoop架构的问题出发,反思其中的不足,通过对比雅虎以往架构,解释雅虎未来的架构模式为什么集成Spark/Shark,以及Shark的硬件...

    构建近实时分析系统

    解决了传统Lamda架构处理Hadoop上快速变化数据的存储和处理技术过于复杂的问题,同时Kudu能够与Hadoop生态的其他组件比如Impala、Spark、Flume和Kafka等组件集成,大大降低了对快速变化的数据进行准实时分析的架构...

    张晓东:解析并行处理在大数据分析中所面对的挑战

    张晓东教授主要就并行计算在云计算和大数据的时代的挑战做了演讲。他指出我们遇到的挑战首先是数据量大,如今的应用对处理性能要求高,需求非常低的处理延迟,而这些是传统数据库系统不能做到的地方。其次的挑战是在...

    林仕鼎:数据中心计算、互联网与云

    林仕鼎带来了《数据中心计算、互联网与云》主题演讲,他首先分析了三者演进过程,帮助我们找出了其中的规律,同时也对云这种新形态带来的设计原则的变革进行深入分析。他指出用公共存储打通互联网服务,将搜索引擎...

    大数据、数据挖掘与智慧运营.pptx

    大数据、数据挖掘与智慧运营 演讲人 2025-11-11 大数据、数据挖掘与智慧运营全文共64页,当前为第1页。 1 大数据、数据挖掘与智慧运营综述 01 Part One 大数据、数据挖掘与智慧运营全文共64页,当前为第2页。 1 ...

    2014中国大数据技术大会32位核心专家演讲PDF下载汇总(重磅资料)

    内容涵盖Hadoop、YARN、Spark、HBase、Impala、Tez等开源软件的最新进展,NoSQL/NewSQL、内存计算、流计算和图计算技术的发展趋势,以及大数据下的可视化、图计算、机器学习/深度学习、商业智能、数据分析等的最新...

    刘佳:全面分析HBase用例

    在12月1日“Hadoop生态系统”主题分论坛,普泽天玑技术总监刘佳发表了题为“HBase用例分析”的演讲。刘佳主要分享了3个案例:第一个是数据魔方,他从新旧系统的原理对比入手,详细介绍了他们如何对流程进行重新规划...

    Python大数据之Spark编程基础与提升视频课程课件PPT模板.pptx

    04/ 第4章spark机器学习之核心应用 03/ 第3章spark机器学习之特征提取 02/ 第2章spark数据预处理与分析 01/ 第1章spark入门 06/ 第6章附:使用spark完成hadoop作业 05/ 第5章企业项目实战:使用spark机器学习库构建...

    OSTC2015-王涛-NoSQL数据库在中国的开源分析与实践

    主题:NoSQL数据库在中国的开源分析与实践 演讲人:王涛,SequoiaDB巨杉数据库...SequoiaDB既可作为Hadoop与Spark的数据源以满足实时查询和分析的混合负载,也可独立作为高性能、灵活易用的数据库被应用程序直接使用。

    李婷婷:百度的内网安全监控体系建设

    李婷婷在演讲中表示,百度内网安全分析平台是基于Hadoop+MySQL搭建的,之所以采用这种方式是为了更好地...从数据采集到数据分析和展示,最后通过报警系统及时掌握内网安全状况,百度的内网安全平台架构打造的十分强大。

    滴滴出行实时计算系统架构及实践

    滴滴出行作为全球最大的移动出行平台,每天收集和需要分析处理的数据量非常大。这些数据形式多样:既包括存储于数据库中的业务数据,也包括各种API请求所记录的文本日志。此外,更大的挑战在于业务上需要我们实时的...

    谈学习大数据的感想.doc

    这也是大数据分析与传统BI之间最 大的区别。 今天的大数据技术还处于战国时期,未来几年,随着企业间的兼并和新产品的不断推 出,BI厂商们将能推出完善的,让CEO感到满意的"大数据套件",但这并不意味着企业I T经理...

    Apache Kylin 2.0 之Spark构建引擎

    Apache Kylin 作为领先的大数据OLAP分析平台步入了2.0时代,正逐渐从Hadoop上的传统OLAP演变为一个实时数据仓库,新的版本支持灵活的雪花模型和更加全面的SQL语法,引入了更加先进的Spark Cubing构建引擎,更好地...

    大数据项目组人员配置.pptx

    大数据项目组人员配置 演讲人 2021-08-08 大数据项目组人员配置全文共27页,当前为第1页。 目录 01. 背景 07. 产品设计类 03. 出发点 05. 基础平台类 02. 目标分析 04. 人员配置结构 06. 技术研发类 08. 实施项目...

    big-data-w-r

    大数据与R在2018年数据科学与统计(SDSS)研讨会上的演讲摘要:回顾了有助于使用R进行大数据分析成功的技术和R包。中心思想是使用R与远程Spark,Hadoop和/或数据库的计算能力进行接口,而不是导入和导入。在R内部的...

Global site tag (gtag.js) - Google Analytics