每个进程在PCB(Process Control Block)中都保存着一份文件描述符表,文件描述符就是这个表的索引,每个表项都有一个指向已打开文件的指针,现在我们明确一下:已打开的文件在内核中用file
结构体表示,文件描述符表中的指针指向file
结构体。
在file
结构体中维护File Status Flag(file
结构体的成员f_flags
)和当前读写位置(file
结构体的成员f_pos
)。在上图中,进程1和进程2都打开同一文件,但是对应不同的file
结构体,因此可以有不同的File Status Flag和读写位置。file
结构体中比较重要的成员还有f_count
,表示引用计数(Reference Count),后面我们会讲到,dup
、fork
等系统调用会导致多个文件描述符指向同一个file
结构体,例如有fd1
和fd2
都引用同一个file
结构体,那么它的引用计数就是2,当close(fd1)
时并不会释放file
结构体,而只是把引用计数减到1,如果再close(fd2)
,引用计数就会减到0同时释放file
结构体,这才真的关闭了文件。
每个file
结构体都指向一个file_operations
结构体,这个结构体的成员都是函数指针,指向实现各种文件操作的内核函数。比如在用户程序中read
一个文件描述符,read
通过系统调用进入内核,然后找到这个文件描述符所指向的file
结构体,找到file
结构体所指向的file_operations
结构体,调用它的read
成员所指向的内核函数以完成用户请求。在用户程序中调用lseek
、read
、write
、ioctl
、open
等函数,最终都由内核调用file_operations
的各成员所指向的内核函数完成用户请求。file_operations
结构体中的release
成员用于完成用户程序的close
请求,之所以叫release
而不叫close
是因为它不一定真的关闭文件,而是减少引用计数,只有引用计数减到0才关闭文件。对于同一个文件系统上打开的常规文件来说,read
、write
等文件操作的步骤和方法应该是一样的,调用的函数应该是相同的,所以图中的三个打开文件的file
结构体指向同一个file_operations
结构体。如果打开一个字符设备文件,那么它的read
、write
操作肯定和常规文件不一样,不是读写磁盘的数据块而是读写硬件设备,所以file
结构体应该指向不同的file_operations
结构体,其中的各种文件操作函数由该设备的驱动程序实现。
每个file
结构体都有一个指向dentry
结构体的指针,“dentry”是directory entry(目录项)的缩写。我们传给open
、stat
等函数的参数的是一个路径,例如/home/akaedu/a
,需要根据路径找到文件的inode。为了减少读盘次数,内核缓存了目录的树状结构,称为dentry cache,其中每个节点是一个dentry
结构体,只要沿着路径各部分的dentry搜索即可,从根目录/
找到home
目录,然后找到akaedu
目录,然后找到文件a
。dentry cache只保存最近访问过的目录项,如果要找的目录项在cache中没有,就要从磁盘读到内存中。
每个dentry
结构体都有一个指针指向inode
结构体。inode
结构体保存着从磁盘inode读上来的信息。在上图的例子中,有两个dentry,分别表示/home/akaedu/a
和/home/akaedu/b
,它们都指向同一个inode,说明这两个文件互为硬链接。inode
结构体中保存着从磁盘分区的inode读上来信息,例如所有者、文件大小、文件类型和权限位等。每个inode
结构体都有一个指向inode_operations
结构体的指针,后者也是一组函数指针指向一些完成文件目录操作的内核函数。和file_operations
不同,inode_operations
所指向的不是针对某一个文件进行操作的函数,而是影响文件和目录布局的函数,例如添加删除文件和目录、跟踪符号链接等等,属于同一文件系统的各inode
结构体可以指向同一个inode_operations
结构体。
inode
结构体有一个指向super_block
结构体的指针。super_block
结构体保存着从磁盘分区的超级块读上来的信息,例如文件系统类型、块大小等。super_block
结构体的s_root
成员是一个指向dentry
的指针,表示这个文件系统的根目录被mount
到哪里,在上图的例子中这个分区被mount
到/home
目录下。
file
、dentry
、inode
、super_block
这几个结构体组成了VFS的核心概念。对于ext2文件系统来说,在磁盘存储布局上也有inode和超级块的概念,所以很容易和VFS中的概念建立对应关系。而另外一些文件系统格式来自非UNIX系统(例如Windows的FAT32、NTFS),可能没有inode或超级块这样的概念,但为了能mount
到Linux系统,也只好在驱动程序中硬凑一下,在Linux下看FAT32和NTFS分区会发现权限位是错的,所有文件都是rwxrwxrwx
,因为它们本来就没有inode和权限位的概念,这是硬凑出来的。
补充:
在这个图上没有反应file_operations与inode的关系,特去查看了源码(/usr/include/fs.h)知
/*
* Note that nosuid etc flags are inode-specific: setting some file-system
* flags just means all the inodes inherit those flags by default. It might be
* possible to override it selectively if you really wanted to with some
* ioctl() that is not currently implemented.
*
* Exception: MS_RDONLY is always applied to the entire file system.
*
* Unfortunately, it is possible to change a filesystems flags with it mounted
* with files in use. This means that all of the inodes will not have their
* i_flags updated. Hence, i_flags no longer inherit the superblock mount
* flags, so these have to be checked separately. -- rmk@arm.uk.linux.org
*/
#define __IS_FLG(inode,flg) ((inode)->i_sb->s_flags & (flg))
#define IS_RDONLY(inode) ((inode)->i_sb->s_flags & MS_RDONLY)
#define IS_SYNC(inode) (__IS_FLG(inode, MS_SYNCHRONOUS) || \
((inode)->i_flags & S_SYNC))
#define IS_DIRSYNC(inode) (__IS_FLG(inode, MS_SYNCHRONOUS|MS_DIRSYNC) || \
((inode)->i_flags & (S_SYNC|S_DIRSYNC)))
#define IS_MANDLOCK(inode) __IS_FLG(inode, MS_MANDLOCK)
#define IS_NOATIME(inode) __IS_FLG(inode, MS_RDONLY|MS_NOATIME)
#define IS_I_VERSION(inode) __IS_FLG(inode, MS_I_VERSION)
#define IS_NOQUOTA(inode) ((inode)->i_flags & S_NOQUOTA)
#define IS_APPEND(inode) ((inode)->i_flags & S_APPEND)
#define IS_IMMUTABLE(inode) ((inode)->i_flags & S_IMMUTABLE)
#define IS_POSIXACL(inode) __IS_FLG(inode, MS_POSIXACL)
#define IS_DEADDIR(inode) ((inode)->i_flags & S_DEAD)
#define IS_NOCMTIME(inode) ((inode)->i_flags & S_NOCMTIME)
#define IS_SWAPFILE(inode) ((inode)->i_flags & S_SWAPFILE)
#define IS_PRIVATE(inode) ((inode)->i_flags & S_PRIVATE)
#define IS_IMA(inode) ((inode)->i_flags & S_IMA)
#define IS_AUTOMOUNT(inode) ((inode)->i_flags & S_AUTOMOUNT)
#define IS_NOSEC(inode) ((inode)->i_flags & S_NOSEC)
file_operations结构体中每个函数指针所指向的操作函数都是需要传进一个inode表项结构体的.
分享到:
相关推荐
解析Linux VFS文件系统机制,对Linux文件系统有详细介绍,欢迎大家下载
5、文件结构采用索引结构,规定每个文件最多占用16个磁盘块,文件索引表存放在文件目录项中,采用直接索引结构。 6、打开文件结构采用文件控制块和系统打开文件表结构。 7、实现文件创建、打开、关闭、读、写和显示...
linux 的 VFS 文件系统说明
vfs_fonts大全
This file contians vfs file ops for 9P2000 for Linux.
This file contians vfs file ops for 9P2000.
吉普汽车,汽车电子整车电子架构以及相关功能描述,vehicle function
(我是在引用jspdf插件时,出现中文乱码的时候,引用文件default_vfs.js解决中文乱码后由于文件过大,导致页面卡顿,后制作的default_vfs-normal.js字体文件,大概2M左右解决了加载慢的问题)jspdf中引入js后,加入...
linux yaffs配置问题解决办法,曾采用
通过代码,详细分析了Linux的VFS机制,有利于初学者了解
vfs global data structvnode root pointer to root vnode Device Driver for linux.
Overview of the Linux Virtual File System.
关于Linux文件系统VFS的ppt, 内容丰富, 可做参考
This memory can be externally, globally, or otherwise allocated. @ingroup allocators Source Code for Linux v2.13.6.
Called nfsd_lookup and encode_dirent. Check if we have crossed a mount point.
深入剖析了linuxVFS文件系统和 底层的各种文件系统
pdfmake 中使用的vfs_fonts.js 包含微软雅黑字体,编译采用的是node.js编译,对msyh.TTF进行诠释,对中文有较为好的支持。