内存引擎：SanssouciDB

jiezhu2007

浏览: 242530 次
性别:
来自: 深圳

最近访客更多访客>>

tory7108121

Marln

taowanli

jiangchao419

博主相关

博客

微博

相册

留言

关于我

博客专栏

: hadoop技术学习
浏览量：142472

: 大数据产业分析
浏览量：2949

文章分类

社区版块

存档分类

博客分类：

数据库和存储技术

SanssouciDB

1、内存计算，每台节点都选择高端机器，典型的配置有2TB内存，64个CPU

主要原因是同等处理能力下，减少集群规模，这样可以减少网络的消耗。

2、SanssouciDB是一个 shared-nothing 和shared-memroy的混合结构，每个实例和每个节点负责固定分区的数据。所以从整个集群来看，整个集群式shared-nothing的结构，从单个节点来看，多个核访问共享的存储。所有节点连接共享存储，可以使NAS,或者SAN，主要是用来存放日志和恢复。

3、并行无所不在：

节点之间分布式查询引擎

节点内部CPU之间并行查询算法

处理器级别使用SIMD(Single Instruction Multiple Data)

4.为提高性能使用FLASH存储，而不是使用硬盘。

5、IMDB解决了传统磁盘数据的读取性能瓶颈。

6、每个节点一个进程，一个进程管理多个线程，每个物理核心一个线程。一个专门的调度器负责给线程分配任务。

７、框架：

最上层提供ＳＱＬ和存储过程接口，也提供ＡＰＩ给程序直接调用。

分布层，负责分布元数据的协调，分布式事务和分布式查询引擎。

Server进程负责元数据的负责和同步。元数据包含存储表和分区的信息。

主数据存放在内存中，主要包括（main store,differential store和索引）

8.列式存储

为了解决列式存储的弊端（更新性能较差），允许经常作为一个组查询的列，存放在一起。叫做混合列。这样就同时具备了较好的读和写的性能。

9.数据是经过字典压缩的

新值加到字典中，可能会导致整个列需要重新压缩，为了解决写性能差的问题。专门使用了叫做 differential store的结构，这里存储还没有被集成到main store的数据。只存储references到字典。Differential store会定期被合并到main store。

10.如果只是少量数据被查询，会使用到反向索引。

11．Insert-only模式，减少锁争用。

12.为了避免数据库毁坏，在非易失性内存中写日志和快照。

13.FLASH卡只能写 1万到十万次，磁盘可以写10^15次。

14. Phase Change Memory (PCM)

15、字节序对齐

16、自动并发，将一个查询分成多个流处理。数据库系统可以处理内联和外联。

实现自动并发依赖两个基础技术，pipeline并发和数据并发。

Pipeline并发效果非常有限，数据并发效果非常好。

17、数据分区的几种方式：

按照数据在表中位置分区

按照表的值分区

哈希的方式分区

罗宾环

18.并行数据处理引擎：

启动时，一个进程绑定一个核，启动时减少消耗。

一个机器上，通过多路内存控制器，减少同一台集群的竞争。

19.充分利用SIMD(Single Instruction Multiple Data ,单指令多数据量)多个部分的执行时间不一致，单个部分执行时间长会拖慢整体速度，因为每部分执行都很快，所以影响不是很明显。

复制多个操作数，并把他们打包在大型寄存器的一组指令集。

以同步方式，在同一时间执行同一条指令。

20.通过压缩缩小数据量，增加查询性能。

通过压缩提升性能，必须压缩所消耗的CPU获得的好处要大于本地内存带宽消耗所有获得的好处。

查看图片附件

0
顶

0
踩

分享到：

大数据和虚拟化结合是方向 | spark overview

2013-07-28 19:30
浏览 2032
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

数据预处理之基于统计的异常值检测: matlab+数据预处理+统计+异常值+检测+适用维度较小的数据基于统计的异常值检测是一种利用统计学原理和技术来识别数据集中异常值或离群点的方法。这种方法通过考察数据集的统计特性来发现与其他样本显著不同的观测值。我们可以利用几种常见的方法，包括3σ（sigma）准则、Z分数（Z-score）和Boxplot（箱线图）。

2021-2022中国中东欧智慧教育学术会议报告集-25页(1).pdf: 2021-2022中国中东欧智慧教育学术会议报告集-25页(1)

基于形态学的权重自适应图像去噪.zip: MATLAB是MathWorks公司出品的商业数学软件，用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人，控制系统等领域。【主页资源】遗传算法、免疫算法、退火算法、粒子群算法、鱼群算法、蚁群算法和神经网络算法等常用智能算法的MATLAB实现，包含TSP、LQR控制器、结合量子算法、多目标优化、粒子群等matlab程序。 MATLAB计算机视觉与深度学习实战项目：直方图优化去雾技术、基于形态学的权重自适应图像去噪、多尺度形态学提取眼前节组织、基于分水岭算法的肺癌分割诊断、基于harris 的角点检测（可以直接用matlab自带的函数）、基于K均值的据类算法分割（算法时间有点久）、区域生长算法进行肝部肿瘤分割（原始分割精度不高）、matlab编写的图像处理相关算法代码及算法原理等等。

基于STM32微控制器的数据采集系统的固件: 目前实现的功能：示波器伏特计逻辑分析仪（实验性） PWM测量 PWM输出基于DDS（直接数字合成）的发生器功能的选择取决于所选的目标。在小型器件上，由于外设约束或引脚排列有限，仅实现了功能子集。固件还可以在不同的配置之间切换。例如，和 .Voltmeter + PWMOscilloscope + PWM 固件通过虚拟 COM 端口（USB CDC 类）直接或使用 UART 转 USB 桥接器与 PC 应用程序通信。如何运行固件您可以在发布部分下载已编译的二进制文件，并通过 ST-Link（或任何其他调试器）或通过 USB 设备固件更新（DFU）下载

An open-source HDL register code generator fast enough to run in: vhdl

B2141 确定进制.cpp: B2141 确定进制

bootstrap模板-moban6820.rar: bootstrap模板

岗位管理体系5大要素全解读.pdf: 岗位管理体系5大要素全解读.pdf

php+mysql社区交流系统（系统）: 随着计算机网络的不断发展，网页逐渐融入人们的生活。快速及时的新闻浏览，五彩缤纷的网上信息，使网络与人们的生活息息相关，于是世界上又出现了第三媒体——Internet。它打破了地域限制，真正使信息得以共享，改变了人们的工作和生活方式。官方网页是企业和个人的宣传自己的重要手段，各大公司和个人主页包括演艺圈艺人，作家，大学生等，纷纷创建自己的主页和Web站点，向全世界宣告自己的存在，展示自己的产品、服务及个人爱好等等。我的系统由:会员登录、会员注册、论坛等之类的组合而成的。

【技巧】人才盘点体系构建最佳实践.docx: 【技巧】人才盘点体系构建最佳实践.docx

9471 - Uruk-hai Army.mpd: 9471 - Uruk-hai Army.mpd

编译原理大作业:类似C语言的编译器设计与实现-支持加减乘除转换 print 输出转换 if 条件转换赋值语句转换: 编译原理大作业基本功能：类 C 语言编译为汇编语言支持语法： 1. 加减乘除转换 2. print 3. 输出转换 4. if 条件转换 5. 赋值语句转换具体实现原理源文件——词法分析——语法分析——三元式生成——目标代码生成词法分析——预处理（识别）——分类——得到结果语法分析——基本转换——相关语法分析主要模块词法分析模块-词法分析.cpp 语法分析模块-语法分析.cpp 使用模块-源.cpp 函数声明-header.h

10240 - UCS Red Five X-wing Starfighter.mpd: 10240 - UCS Red Five X-wing Starfighter.mpd

7307 - Duel in the Air.mpd: 7307 - Duel in the Air.mpd

B2111 基因相关性.exe: B2111 基因相关性

6844 - Seismologic Vehicle.mpd: 6844 - Seismologic Vehicle.mpd

AUTOSAR-SRS-SecureOnboardCommunication.pdf: AUTOSAR_SRS_SecureOnboardCommunication.pdf

AUTOSAR-SWS-FlashEEPROMEmulation.pdf: AUTOSAR_SWS_FlashEEPROMEmulation.pdf

D068-两层-13.50&14.10米- 施工图-第二张.dwg: D068-两层-13.50&14.10米- 施工图-第二张.dwg

6613 - Telephone Booth.mpd: 6613 - Telephone Booth.mpd

最近访客 更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论