Elasticsearch 2.4.2 低延迟使用记录

ShihLei

浏览: 334105 次
性别:
来自: 北京

最近访客更多访客>>

webinweb

xiaomabobo

我怀念的不过是镜花水月

meixianping

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Elasticsearch 2.4.2 ElasticSearch 低延迟优化

编写不易，转载请注明（ http://shihlei.iteye.com/blog/2423848 ）！

一概述

（一直没有升级ES版本，这里只记录使用这一年多的一些优化结论）

Elasticsearch2.4.2 做索引库，提供低延迟的查询需求。

业务规模：docuement 规模 90万，大概200M，不算大。
查询特点：都是terms查询，没有聚合查询。客户端使用的是jest 基于http查询es。
性能：3000qps 并不大，tp 999 暂未统计

二架构

（1）节点类型

master node：协调，存储元数据，负载和内存占用不高，但建议独立部署。
data node：计算，数据存储，主要负载节点，cpu，内存都要消耗。建议选好点的机器，内存大点的机器，并且机器配置尽量一样，方便负载均衡。
client node：请求转发，负载均衡节点，主要用于接入和分配查询合并。（我们的场景，没有合并查询，所以基本没有负载）

（2）架构建议：数据量小，查询少可以混合使用。但建议独立部署。

master node：3台，配置不用太高，但独立部署，重启维护方便。
data node：n 台，cpu ，内存都好点，有建议ssd，视情况吧。
client node：建议加入，统一入口，1~2台，cpu好点，有合并的话，内存大点。

三节点配置

（1）查询队列：threadpool.search

（a）master: 小集群数据量不大，添加修改频繁，基本不用改配置。

（b）datanode：计算，由于tcp同clientnode 连接，我们使用的是 fixed 类型，队列大小需要慎重

threadpool.search.type: fixed
threadpool.search.size: 100            # (核数 * 3)/2 +1 如果cpu使用率没有到 70% 以上，建议调大，提高系统的吞吐量  
threadpool.search.queue_size: 1000

（c）clinetnode：我们无合并结果需求，只提供接入和datanode负载均衡的能力。cpu内存消耗非常低，避免线程数成为系统瓶颈，所以选择cached类型。

# Cached threadpool
threadpool:  
	generic:  
		keep_alive: 200ms

（2）开启交换分区锁定：

bootstrap.mlockall: true

我们索引才几百M，最好都内存计算和fetch，同时避免内存不够是es的换出，性能确实有所提高，慢查询减少到原来的1/3;

（3）g1 gc :

查询请求多的时候，观察系统日志，出现gc 的警告，时间大于1s，这个暂停太长，我们在data node 上更换了g1 gc

要求: 需要高于JDK 8u40，版本，该版本之前改G1会造索引失效

修改方法：bin/elasticsearch.in.sh

调整为：

          # Add gc options. ES_GC_OPTS is unsupported, for internal testing

          if [ "x$ES_GC_OPTS" = "x" ]; then
          #  ES_GC_OPTS="$ES_GC_OPTS -XX:+UseParNewGC"
          #  ES_GC_OPTS="$ES_GC_OPTS -XX:+UseConcMarkSweepGC"
          #  ES_GC_OPTS="$ES_GC_OPTS -XX:CMSInitiatingOccupancyFraction=75"
          #  ES_GC_OPTS="$ES_GC_OPTS -XX:+UseCMSInitiatingOccupancyOnly"

 
          ES_GC_OPTS="$ES_GC_OPTS -XX:+UseG1GC"
          ES_GC_OPTS="$ES_GC_OPTS -XX:MaxGCPauseMillis=200"

          fi

（4）discover

discovery.zen.ping.unicast.hosts: 建议配置master ip，master单独部署，不常重启影响。

四索引库配置

1）shard 数据量在100万左右（多了没测），没有聚合的场景，单shard比多shard效果好。

2）preference查询参数可以将查询打在一个分配上，用于利用查询缓存，方便相似查询提升效率。

其他：

rountintKey：由于curd都需要携带，需要结合业务考虑是否适合使用。

其他：

（1）Jest：集群发现代码：

.discoveryEnabled(true)

.discoveryFrequency(10l, TimeUnit.SECONDS) // 需要设置好时间，es维护会影响这里的处理

.discoveryFilter("type:arbitrary")

   public static JestClient jestClient() {
        JestClientFactory factory = new JestClientFactory();
        factory.setHttpClientConfig(
                new HttpClientConfig
                        .Builder(Arrays.asList("http://localhost:9200"))
                        .multiThreaded(true)
                        //一个route 默认不超过2个连接  路由是指连接到某个远程注解的个数。总连接数=route个数 * defaultMaxTotalConnectionPerRoute
                        .defaultMaxTotalConnectionPerRoute(10)
                        // 默认总连接数不超过20， 我们没有并发问题
                        .maxTotalConnection(30)
                        .connTimeout(10000)
                        .readTimeout(10000)
                        //客户端发现
                        .discoveryEnabled(true)
                        .discoveryFrequency(10l, TimeUnit.SECONDS)
                        .discoveryFilter("type:arbitrary")
                        .build()
        );
        return factory.getObject();
    }

分享到：

numfmt 数字格式化命令 | MySQL5.7.22 编译安装Dockfile

2018-05-30 18:49
浏览 1877
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论