`

[转]com.danga.MemCached 中key的中文问题

阅读更多

 

在项目中用到了memcached 做缓存,在实际应用中发现spymemcached 客户端在网络状态比较差是(大概延迟60ms左右)时的读取超时现象比较严重,而且造成应用的内存被消耗尽了(用jmap 查看过,发现memcache 的客户端用到的异步线程类占用很大的内存,估计是由于超时不断创建的缘故)。于是便换了http://www.whalin.com/memcached 这个的客户端。。在更换过程中也出现了一些问题,由于是晚上才发现,害得我晚上因为这事睡都睡不着。。。想好一些调试的办法,然后在明早进行测试。。

 

问题一:当key 为中文的时候,value取错了。

   遇到这个问题时,由于对业务的理解,排除了是键重复的问题。由于是更换客户端后才出现的问题,也首选反应到是客户端的问题,但为了确定下,想在服务器端进行验证,然而在SecureCRT终端中输入不了中文,没办法在memcache服务器端进行测试。。在上线过程中也在测试机上测试,发现测试机上不会出现这个问题。。随后也反应到,中文经常是会涉及编码问题。。然后便查看了两边的操作系统默认编码,发现确实不一样。。线上服务器是默认的LANG=C,测试机是LANG=en_US.UTF-8。然后在测试机上也调成LANG=C,发现问题重现,大喜。。之后更加确定这个问题出现的原因。。然后便是对whalin memcache客户端源码进行研究了。

 

Java代码   收藏代码
  1.     private Object get(String cmd, String key, Integer hashCode, boolean asString) {  
  2.   
  3.         if (key == null) {  
  4.             log.error("key is null for get()");  
  5.             return null;  
  6.         }  
  7.   
  8.         try {  
  9. //注意这里,可以对key进行URLEncode  
  10.             key = sanitizeKey(key);  
  11.         } catch (UnsupportedEncodingException e) {  
  12.             log.error("failed to sanitize your key!", e);  
  13.             return null;  
  14.         }  
  15.   
  16.         // get SockIO obj using cache key  
  17.         SchoonerSockIO sock = pool.getSock(key, hashCode);  
  18.   
  19.         if (sock == null) {  
  20.             if (errorHandler != null)  
  21.                 errorHandler.handleErrorOnGet(thisnew IOException("no socket to server available"), key);  
  22.             return null;  
  23.         }  
  24.   
  25.         String cmdLine = cmd + " " + key;  
  26.   
  27.         try {  
  28.             sock.writeBuf.clear();  
  29. //cmdLine.getBytes()  这个是出错的关键  
  30.             sock.writeBuf.put(cmdLine.getBytes());  
  31.             sock.writeBuf.put(B_RETURN);  
  32.             // write buffer to server  
  33.             sock.flush();  
  34. //......  
  35. }  
  36.   
  37.     //可以看出这里对key做了URLEncode ,当然这里要进行设定才会  
  38.     private String sanitizeKey(String key) throws UnsupportedEncodingException {  
  39.         return (sanitizeKeys) ? URLEncoder.encode(key, "UTF-8") : key;  
  40.     }  

   由于我把key的编码给关了mcc1.setSanitizeKeys(false); 所以对中文不会进行URLEncode编码。。然后查看了Java API 发现了 cmdLine.getBytes()方法的描述是:

Java代码   收藏代码
  1. 使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。   
  2. 当此字符串不能使用默认的字符集编码时,此方法的行为没有指定。如果需要对编码过程进行更多控制,则应该使用 CharsetEncoder 类。  

 关键字在于平台默认编码。。假如当用户输入中文时,是utf8编码,然后在getBytes方法的时候,不是用utf8解码,那就会出现问题了。我也在memcache 客户端中加入了一些调试代码后,再进行测试,发现中文打印的是“??”,每个中文解码由于解码不对称问题都统一转成一样的二进制编码。。。这就是原因所在了。。

 

解决办法:mcc1.setSanitizeKeys(true).但这种解决办法的缺点是由于对key做了URLEncode编码,在memecache 服务器中测试就比较困难了,因为我们也要首先把key转成URLEncode编码,然后在测试。

 

 

问题二:key中间出现空字符串,客户端一直未结束

   这个问题是在问题一的测试中突然发现的。。经代码调试发现阻塞在下面的方法中。。

 

Sockinputstream代码   收藏代码
  1.     /**  
  2.      * Constructor.  
  3.      *   
  4.      * @param sock  
  5.      *            {@link SchoonerSockIO}, read from this socket.  
  6.      * @param limit  
  7.      *            limited length to read from specified socket.  
  8.      * @throws IOException  
  9.      *             error happened in reading.  
  10.      */  
  11.     public SockInputStream(final SchoonerSockIO sock, int limit) throws IOException {  
  12.         this.sock = sock;  
  13.         willRead(limit);  
  14.         sock.readBuf.clear();  
  15. //阻塞在这里。。这个通道处于阻塞模式  
  16.         sock.getChannel().read(sock.readBuf);  
  17.         sock.readBuf.flip();  
  18.     }  

 

SocketChannel.read(ByteBuffer des)的JavaDoc的描述是

Html代码   收藏代码
  1. public abstract int read(ByteBuffer dst)  
  2.                   throws IOException  
  3. 将字节序列从此通道中读入给定的缓冲区。   
  4. 尝试最多从该通道中读取 r 个字节,其中 r 是调用此方法时缓冲区中剩余的字节数,即 dst.remaining()。   
  5.   
  6. 假定读取的字节序列长度为 n,其中 0 <= n <= r。此字节序列将被传输到缓冲区中,序列中的第一个字节位于索引 p 处,最后一个字节则位于索引 p + n - 1 处,其中 p 是调用此方法时缓冲区的位置。返回时,该缓冲区的位置将等于 p + n;其限制不会更改。   
  7.   
  8. 读取操作可能不填充缓冲区,实际上它可能根本不读取任何字节。是否如此执行取决于通道的性质和状态。例如,处于非阻塞模式的套接字通道只能从该套接字的输入缓冲区中读取立即可用的字节;类似地,文件通道只能读取文件中剩余的字节。但是可以保证,如果某个通道处于阻塞模式,并且缓冲区中至少剩余一个字节,则在读取至少一个字节之前将阻塞此方法。   
  9.   
  10. 可在任意时间调用此方法。但是如果另一个线程已经在此通道上发起了一个读取操作,则在该操作完成前此方法的调用被阻塞。   

 

然后我在初始化memcache 这个客户端的时候已经设定了超时时间为3秒pool.setSocketTO(3000),但为什么到了3秒后依然没有报超时错误,这个我也纳闷,暂时也想不到原因。。不知道谁知道不。。

 

在调试中也发现了出现这个的读取一直阻塞的原因是memcache 命令的组装未检查key中带有特殊字符,下面是源码中key的组装

Java代码   收藏代码
  1. // build command  
  2. StringBuilder command = new StringBuilder("sync ").append(key);  
  3. command.append("\r\n");  

 memcache 服务器端的协议也表明了,key 中不能有制表符和空白字符,并且长度不能超高250个字符。不然服务器端不会响应任何数据。。这个我也确实试了下,发现真没反应。。对memcache 服务器端表示不解。。

 

解决办法:和问题一的一样mcc1.setSanitizeKeys(true),对key进行URLEncode编码。。

 

问题三:批量获取接口取值和单个接口取值不一致

   这个问题还是上去后不就发现的。。批量接口(getMutil())的应用比较少,所以才迟几天发现。。初始以为是我的程序问题,担心了一场,后来慢慢调试发现一些规律,就是key的Encoder的问题的,在getMutil()里竟然不会去判断key是否要编码,都按照未编码的key进行获取,当然获取不了了,晕死。。源码就不发了,想看的自己可以去下载看下,另外批量获取接口是用NIO来实现的和单个获取的方法不一样,暂时也没去深究了。。。没想到的是用了这么久的客户端,竟然有这样的bug存在。。不过在官网上还是挺给力的,最近才更新了2.5.3版本解决了这个问题。。

   解决办法:更换2.5.3版本包。

 

 

12.2 memcached的KEY长度问题  

 最近做机型适配经常适配失败,弄了很久都不行,经过一周的摸索,发现有可能是key值的长度问题,网上说最大250,但实验最大是206个字符,而我写的程序使用到的key值是标识符+UA截取前200个字符,原本想用6个标识符的,后来改为5个,但加载时总有加载失败或者获取不了的。后来干脆截取前190个字符串,再加5个标识字符,结果发现所有UA作为KEY值加载时加载成功,获取也全部成功。写了个程序连续加载和读取都成功。明天进行并发测试,如果没有问题,下周就可以重新部署了。


       实验证明key值最后不要接近最大长度,不知是否hash码问题,另外部分加载的UA只有几个字符,如F389这样,加上标识符也就十来个字符,但加载也失败,不知是否因为连续加载数据时引起的。

分享到:
评论

相关推荐

    memcached_net.spy_com.danga JAR

    Memcache java jar 包 java_memcached-release_2.5.1.jar import com.danga.MemCached.MemCachedClient; import net.spy.memcached.MemcachedClient;

    danga memcached使用

    NULL 博文链接:https://sharron5.iteye.com/blog/794600

    java-memcached-2.6.6.jar

    java-memcached-2.6.6.jar

    memcached在JAVA中调用的DEMO

    memcached在JAVA中调用的DEMO,直接导入项目,无需新建工程。前提是必须按安装memcached,并启动memcached server服务

    memcached.jar

    com.danga package 下的 memcached.jar

    memcached安装及java应用使用memcached

    NULL 博文链接:https://da-zhuang.iteye.com/blog/2234078

    memcached-2.4.2.jar memcached-2.4.2.jar

    import com.danga.MemCached.*; import java.util.Date; public class MemCached { protected static MemCachedClient mcc; protected static Logger log; protected static MemCached memCached = new ...

    java_memcached-release_2.5.1.jar Memcache java jar 包

    Memcache java jar 包 java_memcached-release_2.5.1.jar

    memcached-library, 一个与Memcached缓存系统接口的CodeIgniter库.zip

    library, 一个与Memcached缓存系统接口的CodeIgniter库 用于CodeIgniter的#Memcached 库##Description这个库是为了帮助一个基于CodeIgniter的项目与 1或者更多的Memcached服务器( http://www.danga.com/memcached

    memcached1

    首先到http://danga.com/memcached/下载memcached的windows版本和java客户端jar包,目前最新版本是memcached-1.2.1-win32.zip和java_memcached-release_1.6.zip,分别解压后即可!首先是安装运行memcached服务器,...

    Memcached缓存资料

    memcached是一套分布式的快取系统,当初是Danga Interactive为了LiveJournal所发展的,但被许多软件(如MediaWiki)所使用。这是一套开放源代码软件,以BSD license授权协议发布。[1] memcached缺乏认证以及安全...

    hibernate-memcached, 在Hibernate中,使用Memcached作为第二级分布式缓存的库.zip

    hibernate-memcached, 在Hibernate中,使用Memcached作为第二级分布式缓存的库 休眠 memcachedHibernate中使用Memcached作为第二级分布式缓存的库。基于优秀的spymemcached客户端包含对 Whalin ( danga ) memcached...

    xu_zhi-xuchen-feature-October-v1.rar

    memcached 所需的jar文件,相关的命令 mvn install:install-file -DgroupId=com.danga -DartifactId=memcached -Dversion=2.6.6 -Dpackaging=jar -Dfile=D:/memcached_2.6.6.jar

    memcached-win64-1.4.4-14.rar

    Memcached是以LiveJournal旗下Danga Interactive公司的Brad Fitzpatric为首开发的一款软件。现在已成为mixi、hatena、Facebook、Vox、LiveJournal等众多服务中提高Web应用扩展性的重要因素。 Memcached是一种基于...

    Memcached深度分析.docx

    Memcached是danga.com(运营LiveJournal的技术团队)开发的一套分布式内存对象缓存系统,用于在动态系统中减少数据库负载,提升性能。关于这个东西,相信很多人都用过,本文意在通过对memcached的实现及代码分析,...

    LiveJournal Backend(ppt)

    Inside LiveJournal\'s Backend. or,. “holy hell that\'s a lot of hits!” April 2004. Brad Fitzpatrick.... danga.com / livejournal.com. This work is licensed under the Creative Commons ...

    集中式缓存系统 memcached.zip

    集中式缓存系统 memcached ,memcached是一套分布式的快取系统,当初是Danga Interactive为了LiveJou...

    C#使用memCached实现缓存

     Memcached由Danga Interactive开发,其最新版本发布于2010年,作者为Anatoly Vorobey和Brad Fitzpatrick。用于提升LiveJournal . com访问速度的。LJ每秒动态页面访问量几千次,用户700万。Memcached将数据库负载大...

    完整的.net Memcache实例项目

    由于memcached高性能,所以可以同时服务于更多的连接,大大提高了系统的并发处理的能力。另外,memcached通常部署在业务逻辑层(前台应用)和存储层(主指数据库)之间,...官方网站:http://www.danga.com/memcached/

    Danga Socket

    memcached的官方客户端,就是基于这个Socket组件的

Global site tag (gtag.js) - Google Analytics