C++方式的文件操作

zhaohaolin

浏览: 984220 次
性别:
来自: 杭州

最近访客更多访客>>

bfs198

ymitxiavj

xuming_1980

bianrongxin

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

C/C++/C#

本文主要讨论C++标准I/O库，主要内容为控制台输入输出流、文件流、字符串流。

如果文中有错误或遗漏之处，敬请指出，谢谢！

流介绍
标准I/O类的头文件
<iostream> 包含istream、ostream、iostream这三个类。其中，iostream由istream和ostream派生而来。
<fstream> 包含ifstream、ofstream、fstream这三个类。其中，ifstream由istream派生，ofstream由ostream派生，fstream由iostream派生。
<sstream> 包含istringstream、ostringstream、stringstream这三个类。其中，istringstream由istream派生，ostringstream由ostream派生，stringstream由iostream派生。

注意：标准库I/O对象不允许拷贝或赋值。
C++标准库的流类完整关系图如下：（注意：我发现一个问题，下面的图在打开网页时有时显示模糊，显示的图比实际的小，有两种方法：一是多刷新几次就能刷出来；二是另外显示该图片^_^）

其中，typedef basic_ios<char, char_traits<char> > ios;
typedef basic_istream<char, char_traits<char> > istream;
typedef basic_ostream <char, char_traits<char> > ostream;
typedef basic_iostream <char, char_traits<char> > iostream;
typedef basic_istringstream <char> istringstream;
typedef basic_ostringstream <char> ostringstream;
typedef basic_stringstream <char> stringstream;

流状态

ios_base::iostate 机器相关的整型类型名，用于定义流状态。I/O标准库的基类ios中定义了四个为静态成员的该类型的标志位：
ios_base::badbit 该标志位表示该I/O流发生了严重错误（常指物理破坏，没法修正）
ios_base::eofbit 该标志位表示该I/O流已经到达文件尾
ios_base::failbit 该标志位表示该I/O流出现了失败的I/O操作
ios_base::goodbit 该标志位表示该I/O流状态正常

注意：各标志位可以用|运算符连接起来；为了方便，可以用ios代替ios_base来使用这些标志位（标志位是ios_base的静态常量成员），后面内容中出现的ios_base也可以这样。

检测流状态：
ios::bad() 如果流的badbit标志位被设置，则返回true；否则返回false
ios::eof() 如果流的eofbit标志位被设置，则返回true；否则返回false。如果eofbit被设置，那么failbit也将被设置。
ios::fail() 如果流的failbit标志位被设置，则返回true；否则返回false
ios::good() 如果流的goodbit标志位被设置，则返回true；否则返回false。仅当bad(),eof(),fail()都返回 false时，good()才返回true。

除了可以直接调用流的这些成员函数进行流状态检测外，很多时候我们还可以把流对象直接用于布尔表达式中进行测试。例如：
int i;
while (cin >> i)
cout << i << endl;
在这种情况下，流到void*类型的转换operator void*()被隐式调用，然后再隐式转换为bool型。

为什么流类不直接定义一个到bool类型的隐式转换呢？这是因为这样做可能会引起错误。因为bool型可以隐式转换到int型，从而使流类对象可以隐式转换到int型，这样极容易引用错误。例如，原本打算输入“cin >> i”，但实际上却输入了“cin > i”，漏掉了一个“>”，如果有流对象到bool的隐式转换，那么“cin > i”语法上就是正确的，相当于最终两个int型的比较。显然，我们不希望这种情况下发生。另外，由于历史原因，bool型在最先的C++中是不存在的，所以转换到了void*类型。

设置/获取流状态：
ios_base::clear(state) 将流s标志位设置为state，默认参数为goodbit
ios_base::setstate(state) 为流s添加指定的标志位state，原来的标志位仍然存在，相当于调用clear(state | rdstate())
ios_base::rdstate() 返回流s的当前标志位

输出缓冲区的管理

下面几种情况将导致输出缓冲区中的内容被刷新到输出设备或文件：
1) 程序正常结束。作为main返回工作的一部分，将清空所有输出缓冲区；
2) 在一些不确定的时候，缓冲区可能已经满了。在这种情况下，缓冲区将会在写下一个值之前刷新；
3) 用操作符(manipulator)显式地刷新缓冲区，例如 endl,flush等；
4) 在每次输出操作执行后，用unitbuf操纵符设置流的内部状态，从而清空缓冲区；
5) 可将输出流与输入流关联(tie) 起来。在这种情况下，在读输入流时将刷新其关联的输出流缓冲区。

下面列举用于刷新缓冲区的操纵符：
endl操纵符输出一个换行符，并刷新缓冲区
ends操纵符输出一个空字符null，然后刷新缓冲区
flush操纵符直接刷新缓冲区，不添加任何字符
unitbuf操纵符它在每次执行完写操作后都刷新缓冲区

例如：
cout<<unitbuf<<"first"<<" second"<<nounitbuf;
等价于：
cout <<"first"<<flush<<" second"<<flush;
其中，nounitbuf操纵符将流恢复为使用正常的、由系统管理的缓冲区刷新方式。

将输入和输出关联起来，用tie函数实现：
basic_ostream <E, T> *tie() const;
basic_ostream <E, T> *tie(basic_ostream<E, T> *str);

tie函数可以由istream或ostream对象调用，使用一个指向ostream对象的指针形参。第一个函数返回上次存储的被关联的ostream对象指针，第二个函数设置新的关联对象，并返回上次关联的对象的指针。如果第二个函数的参数为0，则断开两个对象之间的关联。例如：
cin.tie(&cout); // tie cin and cout
ostream* old_tie = cin.tie();
cin.tie(0); // break tie between cin and cout
cin.tie( &err); // a new tie
cin.tie(old_tie); // restablish tie between cin and cout

文件流

如果文件流已经与一个指定的文件相关联，若要把该文件流与另一个文件关联，则必须先关闭(close)现在的文件，再打开(open)另一个文件。open函数会检查是否已经有文件被打开；如果有，则设置failbit标志位，以指示错误，并且此时对文件流的任何读写操作都会失败。此时，可以清除该标志，然后可以继续对前面的文件进行操作。
文件模式

ios_base::in 读模式
ios_base::out 写模式
ios_base::app 追加模式
ios_base::ate 打开文件后立即定位到文件尾
ios_base::trunc 打开文件时清空文件内容（如果有的话）
ios_base::binary 以二进制模式打开文件

上面的标志位被声明为类ios_base的静态常量成员。其中，out、truc、app模式只能用于与ofstreamt和fstream对象关联的文件；in模式只能用于与ifstreamt和fstream对象关联的文件；ate和binary模式可以用于所有文件。

如果以binary模式打开文件，则文件流将以字节序列处理文件内容，不会对内容作任何解释；否则，默认用文本模式打开文件，不同的系统可能会对文件内容作一些解释转换。比如，在非UNIX系统如Windows系统中，换行符\n会被解释成回车换行\r\n到文件系统，\r\n会被解释成\n到内存。而在UNIX系统中，二进制模式和文本模式是没有区别的。

默认情况下，与ifstream流对象关联的文件将以in模式打开；与ofstream关联的文件则以out模式打开，并且以out模式打开的文件的内容会被清空（相当于同时也指定了trunc模式）；与fstream关联的文件则以in和out模式打开。

如果打开与fstream关联的文件时，只用了out模式，而不指定in模式，则文件内容会被清空；如果指定了trunc模式，不论是否指定in模式，文件内容都会被清空。

文件模式的有效组合
out 打开文件进行写操作，删除文件中已有数据；如果文件不存在，则创建文件。
app 打开文件进行写操作，在文件尾追加数据；若文件是与ofstream流关联，那么，当文件不存在时创建文件；若是与fstream流关联，那么，当文件不存在时操作失败。

out | app 追加数据；如果文件不存在，则创建文件。
out | trunc 与out模式相同
in 打开文件进行读操作

in | out 打开文件进行读、写操作，并定位于文件形头处
in | out | trunc 打开文件进行读、写操作，并且删除文件中已有数据

字符串流

字符串流(sstream)定义了一个以string对象为形参的构造函数。对sstream对象的读写操作实际上是对该对象中的string对象进行操作。

sstream类还定义了一个名为str()的成员，用来读取或设置sstream对象所操纵的string对象。
basic_string <E, T, A> str() const;
void str(basic_string <E, T, A>& x);

字符串流的通常用法

用来实现格式化数据输入输出，相当于C语言中的fscanf和fprintf函数的功能。例如：

int var1 = 5, var2 = 10;
stringstream ss;
ss<<"Var1: "<<var1<<" Var2: "<<var2;
cout<<"SS<<: "<<ss.str()<<endl;
var1 = var2 = 0;
string dump;
ss>>dump>>var1>>dump>>var2;
cout<<"SS>>: Var1: "<<var1<<", Var2: "<<var2<<endl;

--------------------------------------------------------------------------------

流的格式化I/O
操纵符

<iostream>中定义的操纵符（带*号的表示是默认使用的）
boolalpha 将真和假显示为字符串
*noboolalpha 将真和假显示为1，0
showbase 产生数的基数前缀
*noshowbase 不产生数的基数前缀
showpoint 总是显示小数噗
*noshowpoint 有小数部分才显示小数点
showpos 显示非负数中的+（0也显示+）
*noshowpos 不显示非负数中的+
uppercase 在十六进制中打印0X，科学记数法中打印E
*nouppercase 在十六进制中打印0x，科学记数法中打印e
*dec 用十进制显示
hex 用十六进制显示
oct 用八进制显示
left 在对齐，在值的右边增加填充字符
*right 右对齐，在值的左边增加填充字符
internal 两边对齐，在值和符号之间填充字符
fixed 用小数形式显示浮点数
scientific 用科学记数法显示浮点数
flush 刷新ostream缓冲区
ends 插入空字符，然后刷新ostream缓冲区
endl 插入换行符，然后刷新ostream缓冲区
unitbuf 在每个输出操作之后刷新缓冲区
*nounitbuf 恢复常规缓冲区刷新
*skipws 为输入操作符>>跳过空白字符(空格、制表位、换行）
noskipws 不为输入操作符跳过空白
ws “吃掉”空白

默认情况下，用于显示浮点数的记数法取决于数的大小：如果数很大或者很少，将按科学记数法显示；否则，使用固定位数的小数显示。

如果设置了scientific或者fixed，由于不存在相应的操纵符来恢复默认值，只能通过调用unsetf成员来取消scientific或fixed所做的改变：unsetf(ios_base::floatfield);（函数原型：void unsetf(fmtflags mask);）

<iomanip>中定义的操纵符

setfill(char ch) 设置ch为空白填充字符
setprecision(int n) 将浮点精度设置为n
setw(int w) 读写w个字符的值
setbase(int b) 按基数b输出整数，n取值为8、10、16；若为其它值，则基数为10
setiosflags(ios_base::fmtflags n) 相当于调用setf(n)
resetiosflags(ios_base::fmtflags n) 清除由n代表的格式化标志

默认情况下，精度指定数字的总位数（小数点之前和之后），默认为6位。使用fixed或者scientific之后，精度指小数点之后的位数。

setw不改变流状态，只对后面的一个数据输出有效。其它操纵符改变流格式状态后，I/O流保留改变后的格式状态。

flag成员函数

ios类提供了flag成员函数用来设置和恢复流的格式状态（所有标志位），函数原型如下：
ios_base::fmtflags flags() const; // 返回流的当前格式状态
ios_base::fmtflags flags(ios_base::fmtflags fmtfl); // 设置流的格式状态

setf和unsetf成员函数

ios类提供了这两个成员函数用来设置或者取消某个标志位，其函数原型如下：
void setf(ios_base::fmtflags mask);
ios_base::fmtflags setf(ios_base::fmtflags fmtfl, fmtflags mask);
void unsetf(ios_base::fmtflags mask); // 清除指定标志位

其中，第一个setf版本适用于开关标志位，这些开关标志位有：
ios_base::boolalpha, ios_base::skipws, ios_base::showbase, ios_base::showpoint, ios_base::uppercase, ios_base::showpos, ios_base::unitbuf
第二个setf版本适用于格式化域标志位，一次只能设置这些标志中的一个。这些格式化域及其标志位如下：
ios_base::basefield: ios_base::dec, ios_base::hex, ios_base::oct
ios_base::floatfield: ios_base::scientific, ios_base::fixed
ios_base::adjustfield: ios_base::left, ios_base::right, ios_base::internal

例如，
s.setf(ios_base::boolalpha); // 设置布尔值显示为字符形式
s.seft(ios_base::scientific, ios_base::floatfield); // 设置小数输出形式为科学记数法
s.unsetf(ios_base::floatfield); // 清除floatfield域的标志位

其它成员函数

ios类还提供了其它几个成员函数来控制输出域格式，其函数原型如下：
int ios_base::width(); // 返回当前宽度，默认为0
int ios_base::width(int n); // 设置宽度
char ios::fill();
char ios::fill(char n);
int ios_base::precision();
int ios_base::precision(int n);

--------------------------------------------------------------------------------
流的未格式化的输入输出操作
单字节操作

is.get(ch) 将istream is的下一个字节放入字符ch中，返回is
os.put(ch) 将字节ch放入ostream os中，返回os
is.get() 返回is的下一字节作为一个int值
is.putback(ch) 将字符ch放回is，返回is
is.unget() 将is退回一个字节，返回is
is.peek() 将下一字节作为int值返回但不移出它（不移动流缓冲区指针）

一般而言，保证能够在下一次读之前放回最多一个值，也就是说，不保证能够连续调用putback或unget而恢复原来的流状态。

为什么get()和peek()要返回int型，而不是char型呢？原因是为了允许返回一个文件结束符。由于允许给定字符集使用char范围的每一个值来表示实际字符，因此，该范围中没有额外值用来表示文件结束符。相反，这些函数把字符转换为unsigned char，然后将那个值提升为int，因此，即使字符集有映射到负值的字符，从这些操作返回的值也将是一个正值。通过将文件结束符作为负值返回，标准库将保证文件结束符区别于任意合法字符值。文件结束符EOF定义于 <iostream>文件中，为一个为负值的const变量，用它来标志文件是否结束。例如：
int ch; // int, not char!
while ((ch = cin.get()) != EOF)
cout.put(ch);

多字节操作

is.get(buf, size, delim)，其函数原型为：
basic_istream& get(E *s, streamsize n, E delim = '\n'); 从is中读入size个字节并将它们存储到buf所指向的空间中，返回is。当读操作遇到delim字符、或者文件结束符、或者已经读入了size个字节，那么读操作结束。如果遇到delim，它将被留在输入流中。
is.getline(buf, size, delim)，其函数原型为：
basic_istream& getline(E *s, streamsize n, E delim = '\n'); 与上面的get行为相似，区别是读取并丢弃delim。
is.read(buf, size) 读取size个字节到buf中，返回is
is.gcount() 返回最后一个未格式化读操作从流is中读到的字节数
os.write(buf, size) 将size个字节从数组buf写到os，返回os
is.ignore(size, delim) 读并忽略size个字符，直到遇到delim，但不包括delim。size的默认参数为1，delim默认参数为文件结束符。

由于将字符放回流中的单字符操作也是未格式化输入操作，如果在调用gcount之前调用了peek、unget或者putback，则返回值是0。

举例：当输入缓冲区发生错误时，需要清空缓冲区时，可以这样做：
if (!cin) {
cin.clear();
cin.ignore(numeric_limits<int>::max(), '\n');
}
另外，需要注意的是使用低级I/O操作容易出错，提倡使用标准库的高级抽象。例如，返回int值的I/O操作就是一个很好的例子。

将get或其它返回int值的函数的返回值赋给char对象而不是int对象，是一个常见的错误。至于这种错误，具体在机器上发生什么行为，取决于机器和输入数据。例如，在将char实现为unsigned char的机器上，这是一个死循环：
char ch;
while ((ch = cin.get()) != EOF)
cou.put(ch);
这是因为，当get返回EOF的时候，那个值将被转换为unsigned char值，转换后的值不再等于EOF的整型值，形成死循环。

--------------------------------------------------------------------------------
流的随机访问
I/O流提供了两个成员函数来实现随机访问：定位函数(seek)和查询函数(tell)。如下表所示：
seekg 重新定位输入流中的读指针 tellg 返回输入流中读指针的当前位置 seekp 重新定位输出流中的写指针 tellp 返回输出流中写指针的当前位置
注意：在每个流中（即使是可同时输入输出的流，如fstream），只有一个读（写）指针，标准库将g位置和p位置都映射到这个指针。所以，在读和写之间切换时，必须进行seek来重新定位标记。

另外，由于istream和ostream类型一般不支持随机访问，所以，流的随机访问只适用于fstream和sstream类型。

seekg和seekp均有两个重载版本，一个使用绝对地址，另一个使用相对偏移。其函数原型如下：
basic_istream & seekg(pos_type pos);
basic_istream & seekg(off_type off, ios_base::seek_dir way);
basic_ostream & seekp(pos_type pos);
basic_ostream & seekp(off_type off, ios_base::seek_dir way);

在上面的函数中，way参数有几个预定义取值：
ios_base::beg 表示流的开头
ios_base::cur 表示流的当前位置
ios_base::end 表示流的末尾
另外，seek_dir、pos_type和off_type均是ios_base类里面的类型。

下面是两个tell的函数原型：
pos_type tellg()
pos_type tellp();
--------------------------------------------------------------------------------

流类和异常
除了手工检查流状态外，还可以利用异常机制来解决流类错误问题。流的成员函数exceptions()接受一个参数，这个参数用于表示程序员希望在哪个流状态标志位出现时抛出异常。当流遇到这样的状态时，就抛出一个std::ios_base::failure类型的异常，其继承自std::exception。函数原型如下：
iostate exceptions() const;
iostate exceptions(iostate except);

分享到：

高位字节优先低位字节优先 | 【JAVA实用工具】JNA-通过它调用C++的方法 ...

2011-08-24 16:05
浏览 1815
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论