`

BIG DATA 大数据时代来临

阅读更多

 

“大数据时代”已经来临,并对各个领域都产生了深远的影响。在商业、经济及其他领域中,决策行为将日益基于数据和分析而作出,而并非基于经验和直觉;而在公共卫生、经济发展和经济预测等领域中,“大数据”的预见能力也已经崭露头角。

 

数据聚类找出霍乱病因

 

一种重要的数据汇总形式是聚类,在聚类中,数据被看成是多维空间下的点,空间中相互邻近的点将被赋予相同的类别。这些类别本身也会被概括表示,比如通过类别质心及类别中的点到质心的平均距离来描述。这些类别的概括信息综合在一起形成了全体数据集合的数据汇总结果。

 

一个利用聚类来解决问题的著名实例发生在很久以前的伦敦,在整个问题的解决中并没有使用计算机 。内科医生John Snow在处理霍乱爆发时在城市地图上标出了病例的发生地点。图1-1给出了该图的一个小片段,展示了病例的传播情况。

 

enter image description here

图1-1 在伦敦市地图上标出的霍乱病例的传播情况示意图

 

图中显示,病例聚集在某些交叉路口。这些路口的水井已经被污染,离这些水井最近的居民染上了疾病,而清洁的水井附近的居民则没有染病。如果没对这些数据进行聚类,霍乱的病因就难以揭开。

——摘自《大数据:互联网大规模数据挖掘与分布式处理》

 

enter image description here

 

书中分析了海量数据集数据挖掘常用的算法,介绍了目前Web应用的许多重要话题。主要内容包括:

  • 分布式文件系统以及Map-Reduce工具;
  • 相似性搜索;
  • 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
  • 搜索引擎技术,如谷歌的PageRank;
  • 频繁项集挖掘;
  • 大规模高维数据集的聚类算法;
  • Web应用中的关键问题:广告管理和推荐系统。

作者简介

 

Anand Rajaraman 数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。

 

Jeffrey David Ullman 美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人Sergey Brin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

分享到:
评论

相关推荐

    大数据时代,要了解大数据数据分析师CPDA.docx

     [2] 随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会...

    《大数据时代》读后感(通用10篇).docx

    查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。...

    大数据分析PPT.pptx

    随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费...

    浅谈电子商务的大数据时代.docx

    所以大数据的核心是数据处理分析能力,其数据容量、分析加工、数据真实性、数据特性是Big Data的关键要素,即经常被提及的4V:Volume(数据量)、Velocity(分析速度)、Variety(特性)、Veracity(真实性)。 2 大数据在...

    大数据详细介绍..doc

    一、大数据时代产生的背景 进入2012年以来,大数据(Big Data)一词越来越多地被提及与使用,人们用它来描述和定义信息爆炸时代产生的海量 数,它已经出现过在《纽约时报》、《华尔街时报》的专栏封面,进入美国...

    大数据论文++.docx

    .................1 Abstract……………………………………………………………………….2 引言……………………………………………………………………………..3 大数据时代的来临………………………………………....

    大数据PPT.pptx

    大数据简介模板,随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于...

    大数据时代数据管理方式研究.pdf

    2⼤数据时代的数据管理技术 ⼤数据(big data),或称巨量资料,指的是所涉及的资料量规模巨⼤到⽆法透过⽬前主流软件⼯具,在合理时间内达到撷取、管理、处 理、并整理成为帮助企业经营决策更积极⽬的的资讯。...

    大数据开题报告.doc

    本科生毕业设计(论文)开题报告 题 目: 大数据时代下微博广告的互动营销策略分析 学 号 1007080128 姓 名指 导 教 师 院(系)专业 日 期 2014年3月23日 一、研究的背景及意义 近年来,近年来大数据(big data)一...

    数据分析-大数据

    随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多...

    大数据演讲[精华].pptx

    大数据的4V 2 Big data's4V 大数据演讲[精华]全文共23页,当前为第5页。 大数据作用 大数据能干什么? 3 GOALS 大数据演讲[精华]全文共23页,当前为第6页。 2004年,沃尔玛对过去交易的庞大的数据库进行了观察,这...

    [详细完整版]大数据演讲.pptx

    大数据的4V 2 Big data's4V 大数据演讲全文共17页,当前为第5页。 大数据作用 大数据能干什么? 3 GOALS 大数据演讲全文共17页,当前为第6页。 2004年,沃尔玛对过去交易的庞大的数据库进行了观察,这个数据库记录...

    大数据与云计算(论文).doc

    秉承"按需服务"理 念的"云计算(Cloud computing)"正高速发展,"数据即资源"的"大数据(big data)"时代已经来临[1]。大数据利用对数据处理的实时性、有效性提出了更高要求,需 要根据大数据特点对传统的常规数据...

    大数据-关键词.txt

    2、随着云时代的来临,大数据(Big data)吸引了越来越多的关注。大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,大数据分析常和云计算联系到一起,用于挖掘各种各样非常有价值的信息。...

    大数据初探.docx

    1 何为大数据 大数据(Big Data)并非新生事物,2008年9月4日《自然》推出了名为"大数据"的专刊,其实它在物理学、生物学、环境生态学、自动控制等科学领域,以及军事、通讯、金融等行业已存在多年。近年来,随着互联网...

    架构大数据_挑战_现状与展望

    引领未来的走向 大数据的时代即将来临 你做好准备了吗 很好的学习资料

    大数据网络营销.pptx

    What is big data 大数据或称海量数据,指的是所涉及的数据量规模巨大到无法通过传统数据处理方式,在合理时间内处理为人类所能解读的信息。 如何从海量数据里快速挖掘出有价值的信息,是大数据研究的核心课题 5 ...

    大数据专题.pptx

    Big Data, it's more than what you think 大数据专题全文共25页,当前为第2页。 大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并...

    大数据的国内外研究现状与发展动态分析报告.doc

    大数据的国内外研究现状及发展动态分析 大数据的概念 产生的背景与意义 上世纪60年代到80年代早期,企业在大型...2008年9月《科学》 (Science)杂志发表了一篇文章"BigData: Science in the Petabyte Era"。"大数据"这

    大数据英文论文.docx

    随着大数据时代的来临,大数据分析也应运而生。 大数据应用与案例分析 1. 大数据应用案例之:医疗行业 Seton Healthcare是采用IBM最新沃森技术医疗保健内容分析预测的首个客户。该技术允许企业找到大量病人相关的...

Global site tag (gtag.js) - Google Analytics