转：使用 Apache Spark 让 MySQL 查询速度提升 10 倍以上 - 堆蝶 - ITeye博客

`

suliran

浏览: 14543 次

最近访客更多访客>>

linziyuu

我武功这么高

kjk

qwe857359351

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

转：使用 Apache Spark 让 MySQL 查询速度提升 10 倍以上

博客分类：

数据库

mysql 数据库

阅读更多

http://my.oschina.net/lovejava/blog/738834

在这篇文章中我们将讨论如何利用 Apache Spark 来提升 MySQL 的查询性能。

在已有的 MySQL 服务器之上使用 Apache Spark （无需将数据导出到 Spark 或者 Hadoop 平台上），这样至少可以提升 10 倍的查询性能。使用多个 MySQL 服务器（复制或者 Percona XtraDB Cluster）可以让我们在某些查询上得到额外的性能提升。你也可以使用 Spark 的缓存功能来缓存整个 MySQL 查询结果表。

整个实验过程请阅读

https://coyee.com/a/11012

分享到：

@RequestMapping 用法详解之地址映射(转) | 转：MySQL 对 Uber 来说可能是最合适的，但 ...

2016-09-02 10:05
浏览 416
评论(0)
分类:数据库
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

spark-binlog:一个用于使用Apache Spark结构流查询Binlog的库，用于Spark SQL，DataFrames和[MLSQL]（https: Spark Binlog库一个用于使用Spark Spark，DataFrames和通过Apache Spark结构流查询Binlog的库。要求该库需要Spark 2.4+（已测试）。某些较旧版本的Spark可能也可以使用，但未得到官方支持。连结中您可以在程序中的...

基于Apache Spark的Netflix电影的离线与实时推荐系统.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

Pro.Docker.148421829: Chapter 10: Using Apache HBase Chapter 11: Using Apache Sqoop Chapter 12: Using Apache Kafka Chapter 13: Using Apache Solr Chapter 14: Using Apache Spark Appendix A: Using the Amazon EC2

Spark和TiDB (Spark on TiDB): SparkTI (Spark on TiDB)是TiDB基于Apache Spark的独立于原生系统的计算引擎。它将Spark和TiDB深度集成，在原有MySQL Workload之外借助Spark支持了更多样的用户场景和API。这个项目在SparkSQL和Catalyst引擎之外实现...

使用MySQL、SQLite、Tableau、Apache Spark的SQL数据分析和可视化项目仅供学习参考用代码.rar: mysql优化

Spark与Mysql的交互: 背景　Spark在对目标数据进行计算后，RDD格式的数据一般都会存在HDFS，Hive，HBase中，另一方面，对于非RDD格式的数据，可能会存放在像... 　- Using Apache Spark and MySQL for Data Analysis 　- spark 1.3.0 将d

spring-boot-spark-integration-demo:关于如何将Spring Data JPA，Apache Spark和GraphX与Java和Scala混合代码集成的演示: 有关如何将Spring，Apache Spark和GraphX与Java和Scala混合代码集成的演示特征当前项目包含以下功能：使用spring-data-jpa从mariadb或mysql加载数据弹簧靴支持大数据分析的火花 hadoop集成用于发布Spark作业...

基于Django2.2+MySQL+spark的在线电影推荐系统设计与实现.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

Apache Spark源码走读之4 -- DStream实时流数据处理: Apache Spark源码走读之4 -- DStream实时流数据处理

基于spark+drools+kafka+redis的大数据实时风控系统.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

SparkNETDemo:在.NET段或Apache Spark中使用API的示例。 Contémtanto uso de carga BatchQuanto Streaming Com Kafka e ML.NET: 可以使用C＃或Apache Spark进行演示。适用于Apache Spark的.NET组件。不下载任何Nuget（请下载Microsoft.Spark）。 Maiores取消了Podser ser encontrados的任何站点官方站点（）和GitHub上的任何存储库（）。 ...

spark课程设计作业：银行用户流式判断+垃圾邮件判断+电影推荐系统（三个spark实战项目）.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

基于Spark的实时推荐系统，使用MovieLens作为测试数据集.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

大型java电商项目源码-spark-piwik:使用Scala和ApacheSpark超越Piwik分析: 是领先的开源网络分析平台，可让您深入了解网站访问者、营销活动等，从而优化访问者的策略和在线体验。将 Piwik Analytics 与 Piwik 集成，可以通过关联分析、意图识别、建议和系列分析等评估来自 Piwik 的客户参与...

基于Spark的新闻推荐系统，包含爬虫项目、web网站以及spark推荐系统.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

Spark.for.Python.Developers.1784399: Apache Spark is your answer―an open source, fast, and general purpose cluster computing system. Spark's multi-stage memory primitives provide performance up to 100 times faster than Hadoop, and it ...

基于Spark的电影推荐系统，包含爬虫项目、web网站、后台管理系统以及spark推荐系统.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

基于Spark MLlib ALS的音乐推荐系统.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

基于spark的外卖大数据平台分析系统.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

基于Spark ML实现的豆瓣电影推荐系统.zip: 两种东西，其一是IBM微软数据产品为代表的，其二是Hadoop+Hive+Apache Hive数据仓库软件有助于使用SQL读取，写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已经存储的数据上。提供了命令行工具和...

Global site tag (gtag.js) - Google Analytics