`

字符串截取

阅读更多
写一个方法,获得一个字符串的子串,比如第一个参数“AB汉字CDEF”,第二个参数是4,5,那么返回的结果应该是“AB汉”。如果第二个参数是3的话,那么输出应该是“AB”,即汉字不能只取半个

答:完整的方法如下:public static String getSubString(String str, int subStrLen) {
if (str == null || subStrLen <= 0) {
   return "";
}       
byte[] strBytes = str.getBytes(); // 字节码数组

if ( subStrLen > strBytes.length) {
   subStrLen = strBytes.length;
}    
String subStr = new String(strBytes, 0, subStrLen);
// 最后一个如果只取到汉字低字节(它也占一个字符长度),那么最后的字符肯定与原来的不同,那么就放弃最后一个字符
if (subStr.charAt(subStr.length() - 1) != str.charAt(subStr.length() - 1)) {
   subStr = subStr.substring(0, subStr.length() - 1);
}
return subStr;
}
总之,JAVA字符使用的是Unicode码,不论是否汉字或字母长度都为一,如果要求是汉字占两个字节长度,可以先转换为byte数组,再取得长度,即str.getBytes().length;



<script> 
//截取字符串 包含中文处理
//(串,长度,增加...)
function subString(str, len, hasDot)
{
    var newLength = 0;
    var newStr = "";
    var chineseRegex = /[^\x00-\xff]/g;
    var singleChar = "";
    var strLength = str.replace(chineseRegex,"**").length;
    for(var i = 0;i < strLength;i++)
    {
        singleChar = str.charAt(i).toString();
        if(singleChar.match(chineseRegex) != null)
        {
            newLength += 2;
        }    
        else
        {
            newLength++;
        }
        if(newLength > len)
        {
            break;
        }
        newStr += singleChar;
    }
    
    if(hasDot && strLength > len)
    {
        newStr += "...";
    }
    return newStr;
}
alert(subString("字符串截取测试 www.jb51.net 是一个收藏精品学习资料的网站",4,true));
</script>
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics