`
hugh.wangp
  • 浏览: 289766 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
阅读更多

1.数据规模
这个是最基本的要求,数据规模不到一定级别,你就不好意思说你是大数据。但数据规模多大才算大,我给不出来一个通用的数字去界定大数据。虽然很多公司的数据量都会上P,但这个不能作为大数据的标准。自我感觉,能称自己公司已经进入大数据时代,这个公司就需要考虑如下几点去应对自己的数据:1.独立的离线历史数据存储;2.数据保密管理策略;3.数据仓库+数据分析;4.成熟的基于数据的商业模式或者产品。

2.数据结构
我们不能武断的认为一个日产百T数据的公司就是大数据公司,一个日产几T数据的公司就不是大数据公司。如果新浪微博是web1.0的产品,那就假设所有的微博是新浪公司员工编写,我们这些用户只有一种操作:只能阅读,顶多把信息做个归类,不能写微博、评论、转发。那对微博产生的数据只需要简单的分析就能搞定,说不定根本就不会涉及到数据挖掘。这样的算不算大数据公司。庆幸的是,新浪微博是web2.0的产物,他上面的写手和读者五花八门,人们的交互方式千变万化,上面的应用纷繁冗杂,这些数据的结构复杂太多了吧。数据分析、数据挖掘技术可以发挥无穷的作用,像这样的数据规模+数据结构才算大数据。

3.数据内容
网络丰富了我们的生活,同时也丰富了公司的数据。哪家互联网公司提供的服务不是丰富多彩,用户在网络上得到他自己想要的资讯、知识、物质产品、兴趣和虚拟关系等等的同时,也留下来他的行为数据。这些数据如果是千万人,上亿人甚至更多人的行为数据,分析用户与用户、用户与行为、行为与行为,对网站的长期运营、用户粘度、用户服务、战略决策,甚至经济发展都有非常大的价值。但是实际上,这些价值不是这么容易得到的,因为数据大部分是碎片化的:一方面,唯一不变的就是变化,人的行为在特定时间、特定环境、特定经历、特定人生阶段下都是变化的,就算同一个人在连续两天访问一个网站的行为和目的都可能不一样,我们很难串联起用户行为数据。这个难题不是不能克服的,现在数据分析和挖掘手段这么多,总能找到有价值的信息;另一方面,网站的结构碎片化,提供的服务之间互相独立,或者关联度不强,虽然一个用户使用了网站提供的5个服务,但是这5个服务的行为数据无法关联起来。就是因为这种数据内容的不可关联性,导致了数据的可利用性大大降低,也是因为数据内容不具备关联性,其实整个网站的数据结构是很简单的。国内很多互联网公司都在强调平台,就是要把整个网站给串起来,业务逻辑清晰,服务要么是闭环,要么星形、要么总线,总之是有拓扑结构的,数据就可以这么关联起来发挥大作用。数据驱动业务的事情会越来越多。

4.数据使用
如上3点好像更多的是和数据本身相关:数据量、数据结构、数据关联性。但就是这些特性给了大数据提出了更高的要求,就是如何使用大数据。从数据管理、数据集成、信息管理、数据分析到数据价值都要想,都要做。这里不再展开说明,只说明如何利用数据是多么重要的一件事情。

0
1
分享到:
评论

相关推荐

    何为大数据.docx

    何为大数据全文共2页,当前为第1页。何为大数据全文共2页,当前为第1页。何为大数据 何为大数据全文共2页,当前为第1页。 何为大数据全文共2页,当前为第1页。 如何透过"大数据"的一般性数据,瞄准最有用的信息,并...

    浅谈大数据生态圈.pptx

    何为大数据 大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 大数据的特点: 一是数据体量巨大。至少是PB级别以上量级的数据 二是数据类型多样。现在的数据类型不仅是文本形式...

    大数据基础实战理论知识总结

    了解并识出何为大数据,于构建适合大数据处理和分析的解决方案至关要。 其次,数据存储与管理是大数据战中的重要环节。面海量数据的存储需求和管理挑战,分布式文件系统、NoSQL数据库以数据湖等技术被提出和广应用...

    Oracle大数据你准备好了吗

    1)有关大数据的讨论 2)何为大数据 3)大数据面临挑战 4)大数据应用:捕获、组织、分析 5)HDFS架构

    大数据初探.docx

    1 何为大数据 大数据(Big Data)并非新生事物,2008年9月4日《自然》推出了名为"大数据"的专刊,其实它在物理学、生物学、环境生态学、自动控制等科学领域,以及军事、通讯、金融等行业已存在多年。近年来,随着互联网...

    大数据开题报告.doc

    三:文献综述 人们对大数据时代下的定义中比较通俗一点是指"描述和定义信息爆炸时代产生的海量大 数据时代",何为大数据?大数据是以云计算为支撑,从各种各样类型的数据中,快速获 得有价值信息的一种前沿技术。在...

    大数据时代营销.doc

    何为大数据? 数据是是消息和信息的载体,是对可以存储、处理的实体的描述,可以是语言、文字 、图形、表格、视频、多媒体等形式。维基百科给出的定义是:大数据是指利用常用软 件工具捕获、管理和处理数据所耗时间...

    《大数据时代》读书心得.docx

    何为大数据?大数据作用何在?《大数据时代》一书很清晰的描写着大数据时代中普通百姓的日常起居、生活学习和思想动向等方面的重大变化。一个例子是2009年H1N1流行流感病毒的背景下谷歌通过检测检索词条,处理了4.5...

    云计算期末复习

    1.何为大数据? 海量数据或巨量数据,其规模巨大到无法通过目前主流的计算机系统在合理时间内获取、存储、管理、处理并提炼以帮助使用者决策。 2.大数据具有4V+1C的特征 (1)数据量大:存储的数据量巨大,PB级是...

    大数据的应用

    统计学与大数据我们所处的时代决定了未来的发展,而如今的时代形成就是过去眼中的未来。数据,一个陌生而又熟悉的词汇,从我们过去的几十年看去,仿佛仅仅处在数学层次上,均值,标准差,方差研究他们的性质原理加之...

    大数据时代心得.doc

    数据的用途意在何为,与数据本身无关,而与数据的解读 者有关,而相关关系更有利于预测未来。大数据更多的体现在海量非结构化数据本身与 处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化...

    信息安全_10.开源大数据平台安全实践v8.pptx

    概念 - 何为”大数据安全” 大数据安全与隐私保护 - “隐私泄露”是大数据安全首要风险 大数据安全策略 - “大数据安全”的关注点 大数据安全策略 - 边界安全( Walled Garden ) 大数据安全策略 - 边界安全:Data ...

    大数据时代心得体会感想.docx

    笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。3、结构。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐头并进,理论来...

    大数据与我们的生活.pptx

    大数据与我们的生活 大数据与我们的生活全文共14页,当前为第1页。 大数据与我们的生活全文共14页,当前为第2页。 云计算Cloud Computing 分布式处理 Distributed Computing 并行处理 Parallel Computing 网格计算 ...

    大数据时代心得体会.doc

    数据的用途意在何为,与数据本身无关,而与数据的解读 者有关,而相关关系更有利于预测未来。大数据更多的体现在海量非结构化数据本身与 处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化...

    2015互联网大数据时代个人信息保护状况调查报告.pdf

    调查结果显示,近三成受访者不知何为“大数据”,而对于“个人信息在大数据时代是否更容易泄露”这个问题,有76%的受访者认为“是”。 在大数据时代,个人信息泄露风险日益增加。调查显示,只有44%的受访者知道智能...

    大数据时代心得体会.docx

    数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐大数据时代心得体会全文共8页,当前...

    如何挑选合适的大数据或Hadoop平台?

    虽然没有一个标准的定义来解释何为“大数据”,但在处理大数据上,Hadoop已经成为事实上的标准。IBM、Oracle、SAP、甚至Microsoft等几乎所有的大型软件提供商都采用了Hadoop。然而,当你已经决定要使用Hadoop来处理...

Global site tag (gtag.js) - Google Analytics