`
ynduanlian
  • 浏览: 35390 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

大数据的数据体系、采集、存储技术总结

 
阅读更多

大数据的数据体系,自底向上包括四个层次:

1 数据采集与清洗层

2 数据加工与汇聚层

3 数据能力与开放层(体现平台即服务PAAS的概念)

4 数据价值与应用层

 

大数据采集技术:实时与离线采集

实时流处理模式:通过K-V查询接口,以流处理模式,逐条传输、ETL,融合并入库至业务平台。

离线批处理模式:通过SFTP传输接口,将数据离线批量采集至业务平台缓存中,再进行批量ETL、融合并入库到业务平台。

 

大数据的采集:基于开源爬虫Webmagic与内存数据库Redis的分布式爬虫技术

 

分布式存储技术:

使用大量普通PC服务器通过Internet互联,对外作为一个整体提供存储服务,以较低的成本满足大规模的存储需求

 

分布式块存储:将分布式的大量服务器硬盘经过分布式块存储变成统一的逻辑硬盘,再按逻辑卷分给虚拟机。适合于作为云主机资源池共享存储,IO要求高。

 

分布式文件存储:将大文件切分成多个小文件块。并将小文件块分布存储在服和器节点上,基于元数据服务器控制各个数据节点,适合于大数据文件的存储和处理,存储与计算一体化,例如作为Hadoop Spark的底层文件系统。

 

分布式对象存储:扁平化,文件之间没有层级或类型关系,适合于各种大小的海量文件基于互联网在线存储,访问和备份,如云存储服务等。

分享到:
评论

相关推荐

    大数据技术体系图谱.pptx

    数据存储 分布式文件/对象存储 02 物理存储 01 分布式关系型数据库 03 分析型数据库 04 搜索引擎 05 K-V存储 06 大数据技术体系图谱全文共96页,当前为第15页。 数据存储 图数据库 列存储数据库 文档数据库 时序...

    《数据科学与大数据技术导论》数据的采集.pptx

    目录 大数据的采集 4.1 4.2 大数据的预处理 4.3 联机分析处理 01 大数据的采集 PART ONE 引言 大数据采集是大数据技术体系中至关重要的一项技术,涉及不同的采集来源、方法和质量评估。互联网数据是数据采集的主要...

    京东大数据技术白皮书.pdf

    京东大数据的技术体系主要包括数据采集和预处理、流量数据采集、数据存储体系、离线计算环境、实时计算环境、机器学习环境、任务管理和调度、资源监控和运维等八个方面。 2.1 数据采集和预处理 数据采集和预处理是...

    大数据资源体系解决方案.docx

    综上所述,大数据资源体系解决方案涵盖了数据集成与管理、数据处理与分析、数据安全与隐私保护、数据服务与应用以及技术支撑与运维管理等多个方面。通过该解决方案的实施,可以为企业、政府等组织提供一个高效、安全...

    一网统管大数据治理体系建设方案.docx

    数据资源整合:制定统一的数据采集、清洗、存储和管理标准,整合城市各部门的数据资源,打破数据孤岛,实现数据的共享和互通。 数据安全保护:建立全面的数据安全保护体系,包括物理安全、网络安全、访问控制、数据...

    一网统管大数据治理体系建设方案.pptx

    数据资源整合:制定统一的数据采集、清洗、存储和管理标准,整合城市各部门的数据资源,打破数据孤岛,实现数据的共享和互通。 数据安全保护:建立全面的数据安全保护体系,包括物理安全、网络安全、访问控制、数据...

    高职院校大数据专业岗位技能分析与课程体系建设的研究.pdf

    * 数据存储技术课程:学习数据存储技术,包括关系数据库技术、NoSQL 数据库技术和分布式数据库技术。 * 数据分析技术课程:学习数据分析技术,包括数据挖掘技术、数据可视化技术和商业智能技术。 * 数据安全技术课程...

    大数据关键技术.doc

    大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数 据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据 安全等)。 一、大数据采集技术 数据是指通过...

    水火风光多源发电调度系统大数据平台架构及关键技术_申建建.pdf

    存储技术、面向发电调度分析场景的大数据融合处理技术以 及面向发电计划编制场景的大数据分析决策技术,实现电力 大数据的采集、存储、分析及知识提取等一体化功能。以云 南省调400 余座大中型电站为工程背景,应用...

    大数据与数据挖掘.doc

    根据大数据处理的生命周期,大数据的技术体系有大数据的采集与预处理、大 数据存储与管理、大数据计算模式与系统、大数据分析与挖掘、大数据分析与挖掘、大 数据可视化分析及大数据隐私与安全等几个方面,如图2所示...

    XX能源云数据平台建设项目_投标书_技术部分_V1.0.doc

    通过大数据技术平台产品和技术服务,开展大数据平台建设。逐步实现由SAP BW单一数据分析环境,向以分布式数据库为支撑的大数据平台数据架构演进。主要方案内容包括: (一)大数据分析平台: 数据采集:  支持从...

    大数据技术知识体系.png

    主要介绍大数据领域从数据采集、存储到高级分析等方面常用的技术。

    大数据课堂测验.doc

    大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大 数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数 据安全等)。 7、新一代数据体系的分类 新一代数据...

    1大数据课堂测验.doc

    大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、开 发大数据安全大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大 数据应用、大数据安全等)。 7、新一代数据体系的...

    阿里巴巴大数据智能技术.pdf

    阿里巴巴大数据智能技术是指通过大数据技术和智能技术来解决数据相关问题的技术体系。该技术体系主要包括数据工作者台、数据智能化、数据服务、数据资产管理、数据安全等方面。 数据工作者台 数据工作者台是指将...

    大数据关键技术(1).doc

    大数据采集一般分为大数据智能感知层:主要包括数据传感体系、网络通信体系、 传感适配体系、智能识别体系及软硬件资源接入系统,实现对结构化、半结构化、非结 构化的海量数据的智能化识别、定位、跟踪、接入、...

    基于大数据的数据分析系统架构.doc

    二、基于大数据的数据分析系统架构 (一)传统的大数据数据分析架构 传统的大数据数据分析架构,传统的BI数据分析,由于数据量和系统性能不能 满足大数据,所以基于此类的数据分析技术上是使用了大数据的数据分析...

    基于大数据的数据服务应用研究

    具有并行、分布、稳定、高效等技术特点,研究大数据存储与处理技术、大数据查询与分析技术以及大数据可视化技术,建立数据分类目录体系标准与信息交换共享机制,确保多数据采集渠道的大规模数据能够有效整合、有序组织,...

    大数据导论课件,第一章什么是大数据

    第三章 数据采集与预处理 第四章 大数据存储与管理 第五章 大数据计算框架 第六章 数据挖掘 第七章 数据可视化  第八章 大数据与云计算  第九章 大数据与人工智能 第一章主要内容: 大数据时代的到来(第三次信息...

Global site tag (gtag.js) - Google Analytics