概要
在介绍StdExt的时候,我曾经提到,STL设计精良,但是以下几块仍然设计不足(或缺失):
关于内存管理,我们已经说得很多了。这里我们重点谈的是字符串处理/文本处理相关的问题。本篇是《字符串处理完整参考》这个系列的第一篇。
历史
字符串处理/文本处理是一个历史悠久,并且相当复杂的一个话题。从简单到字符串的比较(compare)、连接(concat),到复杂的文本编辑、正则表达式、HTML文本内容的解析,都属于相关的范畴。
在C语言时代,C库提供了基于char*数据类型的字符串处理函数,典型代表如strlen,strcpy,strcat等。原始、容易出错,是这类字符串处理方法的典型特征。另外,strcat的效率并不高(Borland引入了strecpy来解决这个问题。其实这个strecpy的泛化版本,就是后来STL中的std::copy),而字符串查找(strstr)也是用了最原始的方式。
STL的string(basic_string)的出现,一定程度上改善了这种情况。至少C++程序员有一个使用界面“友善”的string(字符串)类了。然而,string类可以说是STL中最受争议的类(下文我们详细解释)。这些争议至少证明,STL的string类存在设计缺陷。
在SGI STL中,引入了rope类。这是一个重量级的字符串类。rope英文本意是绳子。string英文本意是线。所以rope是重量级的string,这个名字取得很形象,非常到位。
在StdExt库开始考虑字符串处理支持的时候,我引入了以下四个类:std::String / std::StringBuilder / std::TextPool / std::Rope。其中,std::String/std::StringBuilder其实是STL string类的功能分拆。std::String是一个常字符串,而std::StringBuilder负责字符串的修改操作。大家很清楚,String/StringBuilder的概念从Java中引入,我一直认为Java的字符串处理类的设计比C++这样把两者揉在一起的string实现要合理很多。std::TextPool / std::Rope则是字符串类的重量级实现,用来处理巨型的字符串。
STL的string(basic_string)的缺陷
归纳起来,STL的string类主要有以下这些争议点:
- 接口过多且规格和其他STL容器没有达成很好的一致性。例如,string::find使用下标,而不是以iterator作为迭代位置,这和其他容器不太一样。
- 内存碎片。由于过于频繁的字符串构造、析构,导致系统的内存碎片现象严重。
- Copy -On-Write与多线程安全。string(basic_string)基于Copy-On-Write技术的原因,是因为 string的赋值被设计成为低开销的。但是一旦考虑到多线程安全问题,Copy-On-Write会把大量的时间花在锁的开销上。一些新的STL实现 (如SGI STL)放弃了基于Copy-On-Write的string实现。
盘点StdExt的字符串类:String/StringBuilder/TextPool/Rope
为什么我们需要这么多的字符串类?一个原因:字符串处理的应用环境很复杂,需要因地制宜,指望一个string类行遍天下是不可能的。
从支持的串的规模来讲,String/StringBuilder重点解决小字符串的问题(特别是StringBuilder,在大字符串情形下,一定会有性能瓶颈)。而TextPool, Rope重点解决巨型字符串的问题。
从实现上来讲,String/StringBuilder是线性内存的。而TextPool, Rope的字符串并不物理连续,它们是逻辑字符串。
从支持的操作来讲,String是常字符串;StringBuilder/TextPool主要支持改写(set)、添加(append)操作,但不推荐插入(insert)操作,从伸缩性来讲,TextPool好要好于StringBuilder;而Rope的操作侧重点在于优化字符串级的复杂操作,如取子字符串、插入、删除等,但是单个字符的修改和获取代价略高(相比于String/StringBuilder/TextPool)。
后文我们将展开来介绍这些组件。
分享到:
相关推荐
1. **丰富的字符串处理方法**:C#提供了丰富的字符串处理方法,如 `Substring`、`Contains`、`Replace`、`Split` 等,可以轻松地截取子串、查找特定字符、替换文本、分割字符串等操作。 2. **字符串插值**:C# 6...
String,StringBuffer,StringBuilder区别。几乎所有的应用开发都离不开操作字符串,理解字符串的设计和实现以及相关 工具如拼接类的使用,对写出高质量代码是非常有帮助的
String:字符串常量 StringBuffer:字符创变量 StringBuilder:字符创变量 从上面的名字可以看到,String是“字符创常量”,也就是不可改变的对象。对于这句话的理解你可能会产生这样一个疑问 ,比如这段...
String ,StringBuffer与StringBuilder的区别
String类的应用 ””,null和string.Empty的区别 Stringbuilder方法 StringBuilder 和 String 的区别?
day13-String和StringBuilder 1.String类 1.1字符串的比较【理解】 1.1.1==号的作用 比较基本数据类型:比较的是具体的值 比较引用数据类型:比较的是对象地址值 1.1.2equals方法的作用 方法介绍 示例代码 ...
package api.util; //Util public class StringUtil { //判断一个字符串中是否包含一个数字 public static boolean isDigit(String s){ //0--9; char c[]=s.toCharArray... /**字符串解析(将字符串解析为数组)*/
StringBuilder 字符串生成器 举例说明: SELECT * FROM dbo.Pub_User WHERE ID = 1001 以上这段Sql语句,利用此工具,一键生成以下StringBuilder字符串变量,支持翻转生成,内含VS2010源码,是.Net程序员必备工具 sb....
C# StringBuilder 拼接字符串 字符串转换工具 StringBuilder比StringBuffer运行速度要快,因为StringBuilder是针对于单线程的,所这它是非线程安全的。普通情况下建议使用StringBuilder。
String StringBuffer和StringBuilder 区别之源码解析 从源码角度简单对它们之间的区别进行了验证
js实现StringBuilder ,相关知识点:原型模式、原型对象、原型链 //字符串连接类: var html=new iStringBuilder(); html.append("...");
简单的介绍了String、StringBuffer和StringBuilder的区别
该源码资源的目标是提供一组功能丰富、高效可靠的字符串操作方法,以便开发者可以轻松地进行字符串处理。它的设计目标是简单易用、可扩展性强,并且能够处理各种复杂的字符串情况。 该源码资源会包含以下示例代码,...
String及StringBuffer和StringBuilder的区别
C# 字符串是使用 string 关键字声明的一个字符数组。字符串是使用引号声明的,如下例所示: string s = "Hello, World!"; 字符串对象是“不可变的”,即它们一旦创建就无法更改。对字符串进行操作的方法实际上返回...
介绍了String、StringBuffer、StringBuilder的使用方法,以及理论知识
String 声明的是不可变的对象,每次操作都会生成新的 String 对象,然后将指针指向新的 String 对象,而 StringBuffer、StringBuilder 可以在原有对象的基础上进行操作,所以在经常改变字符串内容的情况下最好不要...
* 将double形式的字符串(有两位小数或无小数)转换成人民币的大写格式 * @param doubleStr * @return String * @throws Exception */ public static String doChangeRMB(String doubleStr)throws ...
本文实例讲述了C#清除字符串内空格的方法,分享给大家供大家参考。具体如下: 关键代码如下: 代码如下:/// /// 清除字符串内空格 /// </summary> /// ”str”>需要处理的字符串</param> /// 处理好后的字符串</...
string,stringbuffer,stringbuilder