`
andrew.yulong
  • 浏览: 166698 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

正则只替换URL字符串里面的汉字部分(转载CSDN)

    博客分类:
  • java
阅读更多

URL为 http://192.168.1.1:8080/resources/电话.xls
如果使用 URLEncoder.encode 将会把冒号等一块给替换了
http%3A%2F%2F192.168.1.1%3A8080%2Fresources%2F%E7%94%B5%E8%AF%9D.xls

这并不是我们需要的,我们只希望替换编码里面中文的部分,这里给出了解决方法,很简单

package log;

import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 正则替换字符串里面的汉字部分。
 * 
 * @author 赵学庆 www.java2000.net
 */
public class URLEncoderHZ {
  public static void main(String[] args) throws Exception {
    String str = "http://192.168.1.1:8080/resources/电话.xls";
    System.out.println(encode(str, "UTF-8"));
  }

  private static String zhPattern = "[\u4e00-\u9fa5]+";

  /**
   * 替换字符串卷
   * 
   * @param str 被替换的字符串
   * @param charset 字符集
   * @return 替换好的
   * @throws UnsupportedEncodingException 不支持的字符集
   */
  public static String encode(String str, String charset) throws UnsupportedEncodingException {
    Pattern p = Pattern.compile(zhPattern);
    Matcher m = p.matcher(str);
    StringBuffer b = new StringBuffer();
    while (m.find()) {
      m.appendReplacement(b, URLEncoder.encode(m.group(0), charset));
    }
    m.appendTail(b);
    return b.toString();
  }
}

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics