深入解析Linux文件接口,掌握文件操作技能 (linux文件接口)

Linux作为一种主流的操作系统,广泛应用于各种领域,其中文件操作是Linux系统中经常使用的重要功能之一。了解和掌握Linux文件接口,能够更加方便、高效地进行文件读写和管理操作。在本文中,我们将,从而让读者更加熟练地使用Linux系统。

一、 Linux 文件接口概述

在Linux系统中,内核对文件的操作通过系统调用(syscall)来实现,文件接口便是系统调用的。文件接口定义的系统调用提供了对文件的打开、读写、关闭、创建、删除、重命名等操作。这些系统调用通过C库中的封装函数达到了用户空间的程序调用。

常用的文件接口包括:

1. open:打开一个文件

2. close:关闭一个文件

3. read:从一个文件中读取数据

4. write:往一个文件中写入数据

5. lseek:移动文件读写位置

6. ioctl:设备控制

7. mkdir:创建目录

8. rmdir:删除目录

9. rename:重命名文件名

10. unlink:删除文件

11. access:检查文件访问权限

12. stat:获取文件属性

13. fcntl:文件控制操作

14. chown:修改文件拥有者

15. chmod:修改文件权限

16. exec:启动新进程

二、 文件描述符处理

在Linux系统中,系统调用返回的句柄被称为文件描述符,我们需要对文件描述符进行处理。

1. 打开文件

我们通过调用open函数来打开文件,并获得文件描述符。 open的常用参数如下:

“`C

#include

int open(const char *pathname, int flags, mode_t mode);

//pathname:文件名,可以是相对路径或绝对路径

//flags:文件打开方式,只读、只写、读写等

//mode:指定该文件的权限,当文件不存在时,会创建该文件并设置该权限

“`

2. 关闭文件

文件使用完毕后,需要关闭文件,即释放文件句柄。关闭文件使用close函数:

“`C

#include

int close(int fd);

“`

当我们使用open函数打开一个文件时,会返回该文件的文件描述符fd。因此,当我们对文件操作结束后,应该使用close函数关闭该文件。

3. 文件读写

Linux文件操作中最频繁的操作,是从文件中读取数据和向文件中写入数据。

(1)读取数据

使用read函数从文件中读取数据,函数定义如下:

“`C

#include

ssize_t read(int fd, void *buf, size_t count);

//fd:文件描述符

//buf:保存读取数据的缓存区

//count:要读取的字节数

//返回值:成功读取的字节数,失败返回-1

“`

(2)写入数据

使用write函数从数据写入文件,函数定义如下:

“`C

#include

ssize_t write(int fd, const void *buf, size_t count);

//fd:文件描述符

//buf:要写入的数据缓存区

//count:要写入的字节数

//返回值:成功写入的字节数,失败返回-1

“`

4. 文件读写位置控制

在文件读写过程中,我们需要控制读写的位置,lseek函数提供了这个功能。lseek函数定义如下:

“`C

#include

off_t lseek(int fd, off_t offset, int whence);

//fd:文件描述符

//offset:偏移量

//whence:基准位置,SEEK_SET(文件开头)、SEEK_CUR(当前位置)、SEEK_END(文件结尾)

//返回值:如果成功,则返回文件指针相对于文件首地址 SEEK_SET 的位移量,否则返回-1

“`

5. 文件属性操作

Linux系统中通过stat函数可以获取文件的属性信息,包括文件的大小、访问权限、修改时间等。函数定义如下:

“`C

#include

#include

#include

int stat(const char *path, struct stat *buf);

//path:文件路径

//buf:存放文件属性的结构体指针

//返回值:成功返回0,出错返回-1

“`

此外,还可以使用chmod函数修改文件权限、chown函数修改文件的所有者。

三、 文件操作实例

我们以实际案例,使用Linux文件操作接口实现文件读写和操作。代码如下:

“`C++

#include

#include

#include

#include

#include

#include

#include

#include

#define BUFFER_SIZE (1024)

int mn(int argc, char* argv[])

{

int ret;

int fd;

char buffer[BUFFER_SIZE] = {0};

const char* filename_in = “input.txt”;

const char* filename_out = “output.txt”;

struct stat filestat;

// 打开一个文件,获取文件描述符fd

fd = open(filename_in, O_RDON);

if(fd

{

fprintf(stderr, “open %s fled: %s\n”, filename_in, strerror(errno));

return -1;

}

//获取文件属性,文件大小等

ret = stat(filename_in, &filestat);

if (ret

{

fprintf(stderr, “Fled to get file attribute, errno:%d, strerror:%s\n”, errno, strerror(errno));

close(fd);

return -1;

}

// 打开一个文件,获取文件描述符fd

int fd_out = open(filename_out, O_WRON|O_CREAT|O_TRUNC, 0666);

if(fd_out

{

fprintf(stderr, “open %s fled: %s\n”, filename_in, strerror(errno));

close(fd);

return -1;

}

//读取文件

while(true)

{

ret = read(fd, buffer, BUFFER_SIZE-1);

if(ret == 0)

{

break;

}

if(ret

{

fprintf(stderr, “Fled to read data, errno:%d, strerror:%s\n”, errno, strerror(errno));

break;

}

//把读取到的数据写到另一个文件中

ret = write(fd_out, buffer, ret);

if(ret

{

fprintf(stderr, “Fled to write data to file, errno:%d, strerror:%s\n”, errno, strerror(errno));

break;

}

}

close(fd);

close(fd_out);

return 0;

}

“`

该程序可以将文件input.txt中的内容读取出来,并写入到文件output.txt中。程序先通过open函数打开input.txt文件,打开成功后,再通过read函数循环读取文件内容,循环结束后,关闭input.txt文件,并以写入方式打开文件output.txt,通过write函数将读取到的内容写入该文件,在完成写入后关闭output.txt文件。

四、

相关问题拓展阅读:

linux文件系统基础知识

linux文件系统基础知识汇总

  1、linux文件系统分配策略

  块分配( block allocation ) 和 扩展分配 ( extent allocation )

  块分配:磁盘上的文件块根据需要分配给文件,避免了存储空间的浪升团费。但当文件扩充时,会造成文件中文件块的不连续,从而导致过多的磁盘寻道时间。

  每一次文件扩展时,块分配算法就需要写入文件块的结构信息,也就是 meta-dada 。meta-data总是与文件一起写入存储设备,改变文件的操作要等到所有meta-data的操作都完成后才能进行,

  因此,meta-data的操作会明显降低整个文件系统的性能。

  扩展分配: 文件创建时,一次性分配一连串连续的块,当文件扩展时,也一次分配很多块。meta-data在文件创建时写入,当文件大小没有超过所有已分配文件块大小时,就不用写入meta-data,直到需要再分配文件块的时候。

  扩展分配采用成组分配块的方式,减少了SCSI设备写数据的时间,在读取顺序文件时具有良好的性能,但随机读取文件时,就和块分配类似了。

  文件块的组或块簇 ( block cluster) 的大小是在编译时确定的。簇的大小对文件系统的性能有很大的影响。

  注: meta-data 元信息:和文件有关的信息,比如权限、所有者以及创建、访问或更改时间等。

  2、文件的记录形式

  linux文家系统使用索引节点(inode)来记录文件信息。索引节点是一种数据结构,它包含了一个文件的长度、创建及修改时间、权限、所属关系、磁盘中的位置等信息。

  一个文件系统维护了一个索引节点的数组,每个文件或目录都与索引节点数组中的唯一的元素对应。每个索引节点在数组中的索引号,称为索引节点号。

  linux文件系统将文件索引节点号和文件名同时保存在目录中,所以,目录只是将文件的名称和它的索引节点号结合在一起的一张表,目录中每一对文件名称和索引节点号称为一个连接。

  对于一个文件来说,有一个索引节点号与之对应;而对于一个索引节点号,却可以对应多个文件名。

  连接分为软连接和硬连接,其中软吵信橘连接又叫符号连接。

  硬连接: 原文件名和连接文件名都指向相同的物理地址。目录不能有硬连接;硬连接不能跨文件系统(不能跨越不同的分区),文件在磁盘中只有一个拷贝。

  由于删除文件要在同一个索引节点属于唯一的连接时才能成功,因此硬连接可以防止不必要的误删除。

  软连接: 用 ln -s 命令建立文件的符号连接。符号连接是linux特殊文件的.一种,作为一个文件,它的数据是它所连接的文件的路径名。坦岁没有防止误删除的功能。

  3、文件系统类型:

  ext2 : 早期linux中常用的文件系统

  ext3 : ext2的升级版,带日志功能

  RAMFS : 内存文件系统,速度很快

  NFS : 网络文件系统,由SUN发明,主要用于远程文件共享

  MS-DOS : MS-DOS文件系统

  VFAT : Windows 95/98 操作系统采用的文件系统

  FAT : Windows XP 操作系统采用的文件系统

  NTFS : Windows NT/XP 操作系统采用的文件系统

  HPFS : OS/2 操作系统采用的文件系统

  PROC : 虚拟的进程文件系统

  ISO9660 : 大部分光盘所采用的文件系统

  ufsSun : OS 所采用的文件系统

  NCPFS : Novell 服务器所采用的文件系统

  BFS : Samba 的共享文件系统

  XFS : 由SGI开发的先进的日志文件系统,支持超大容量文件

  JFS :IBM的AIX使用的日志文件系统

  ReiserFS : 基于平衡树结构的文件系统

  udf: 可擦写的数据光盘文件系统

  4、虚拟文件系统VFS

  linux支持的所有文件系统称为逻辑文件系统,而linux在传统的逻辑文件系统的基础上增加料一个蓄念文件系统( Vitual File System ,VFS) 的接口层。

  虚拟文件系统(VFS) 位于文件系统的最上层,管理各种逻辑文件系统,并可以屏蔽各种逻辑文件系统之间的差异,提供统一文件和设备的访问接口。

  5、文件的逻辑结构

  文件的逻辑结构可分为两大类: 字节流式的无结构文件 和 记录式的有结构文件。

  由字节流(字节序列)组成的文件是一种无结构文件或流式文件 ,不考虑文件内部的逻辑结构,只是简单地看作是一系列字节的序列,便于在文件的任意位置添加内容。

  由记录组成的文件称为记录式文件 ,记录是这种文件类型的基本信息单位,记录式文件通用于信息管理。

  6、文件类型

  普通文件 : 通常是流式文件

  目录文件 : 用于表示和管理系统中的全部文件

  连接文件 : 用于不同目录下文件的共享

  设备文件 : 包括块设备文件和字符设备文件,块设备文件表示磁盘文件、光盘等,字符设备文件按照字符操作终端、键盘等设备。

  管道(FIFO)文件 : 提供进程建通信的一种方式

  套接字(socket) 文件: 该文件类型与网络通信有关

  7、文件结构: 包括索引节点和数据

  索引节点 : 又称 I 节点,在文件系统结构中,包含有关相应文件的信息的一个记录,这些信息包括文件权限、文件名、文件大小、存放位置、建立日期等。文件系统中所有文件的索引节点保存在索引节点表中。

  数据 : 文件的实际内容。可以是空的,也可以非常大,并且拥有自己的结构。

  8、ext2文件系统

  ext2文件系统的数据块大小一般为 1024B、2023B 或 4096B

  ext2文件系统采用的索引节点(inode):

  索引节点采用了多重索引结构,主要体现在直接指针和3个间接指针。直接指针包含12个直接指针块,它们直接指向包含文件数据的数据块,紧接在后面的3个间接指针是为了适应文件的大小变化而设计的。

  e.g: 假设数据块大小为1024B ,利用12个直接指针,可以保存更大为12KB的文件,当文件超过12KB时,则要利用单级间接指针,该指针指向的数据块保存有一组数据块指针,这些指针依次指向包含有实际数据的数据块,

  假如每个指针占用4B,则每个单级指针数据块可保存 1024/4=256 个数据指针,因此利用直接指针和单级间接指针可保存 1024*12+1024*256=268 KB的文件。当文件超过268KB时,再利用二级间接指针,直到使用三级间接指针。

  利用直接指针、单级间接指针、二级间接指针、三级间接指针可保存的更大文件大小为:

*12+1024*256+1024*256*256+1024*256*256*256=KB,约 16GB

  若数据块大小为2023B,指针占4B,则更大文件大小为: 2023*12+2023*512+2023*512*512+2023*512*512*512=268,960,792 KB 约 268GB

  若数据块大小为4096B,指针占4B,则更大文件大小为: 4096*12+4096*1024+4096*1024*1024+4096*1024*1024*1024=4,299,165,744 KB ,约 4TB

  注: 命令 tune2fs -l /dev/sda5 可查看文件系统

  ext2文件系统更大文件名长度: 255个字符

  ext2文件系统的缺点:

  ext2在写入文件内容的同时并没有同时写入文件meta-data, 其工作顺序是先写入文件的内容,然后等空闲时候才写入文件的meta-data。若发生意外,则文件系统就会处于不一致状态。

  在重新启动系统的时候,linux会启动 fsk ( file system check) 的程序,扫描整个文件系统并试图修复,但不提供保证。

  9、ext3文件系统:

  ext3基于ext2的代码,所以磁盘格式与ext2相同,使用相同的元数据。

  ext2文件系统无损转化为ext3文件系统: tune2fs -j /dev/sda6

  日志块设备( Journaling block device layer,JBD)完成ext3文件系统日志功能。JBD不是ext3文件系统所特有的,它的设计目标是为了向一个块设备添加日志功能。

  当一个文件修改执行时,ext3文件系统代码将通知JBD,称为一个事务(transaction)。发生意外时,日志功能具有的重放功能,能重新执行中断的事务。

  日志中的3种数据模式:

)、data=writeback :不处理任何形式的日志数据,给用户整体上的更高性能

)、data=odered :只记录元数据日志,但将元数据和数据组成一个单元称为事务(transaction) 。此模式保持所句句的可靠性与文件系统的一致性,性能远低于data=writeback模式,但比data=journal模式快

)、data=journal :提供完整的数据及元数据日志,所有新数据首先被写入日志,然后才被定位。意外发生过后,日志可以被重放,将数据与元数据带回一致状态。这种模式整体性能最慢,但数据需要从磁盘读取和写入磁盘时却是3种模式中最快的。

  ext3文件系统更大文件名长度: 255个字符

  ext3文件系统的优点:可用性、数据完整性、速度、兼容性

  10、ReiserFS文件系统

  ReiserFS文件系统是由Hans Reiser和他领导的开发小组共同开发的,整个文件系统完全是从头设计的,是一个非常优秀的文件系统。也是最早用于Linux的日志文件系统之一。

  ReiserFS的特点

  先进的日志机制

  ReiserFS有先进的日志(Journaling/logging)功能 机制。日志机制保证了在每个实际数据修改之前,相应的日志已经写入硬盘。文件与数据的安全性有了很大提高。

  高效的磁盘空间利用

  Reiserfs对一些小文件不分配inode。而是将这些文件打包,存放在同一个磁盘分块中。而其它文件系统则为每个小文件分别放置到一个磁盘分块中。

  独特的搜寻方式

  ReiserFS基于快速平衡树(balanced tree)搜索,平衡树在性能上非常卓越,这是一种非常高效的算法。ReiserFS搜索大量文件时,搜索速度要比ext2快得多。Reiserfs文件 系统使用B*Tree存储文件,而其它文件系统使用B+Tree树。B*Tree查询速度比B+Tree要快很多。Reiserfs在文件定位上速度非常 快。

  在实际运用中,ReiserFS 在处理小于 4k 的文件时,比ext2 快 5 倍;带尾文件压缩功能(默认)的ReiserFS 比ext2文件系统多存储6%的数据。

  支持海量磁盘

  ReiserFS是一个非常优秀的文件系统,一直被用在高端UNIX系统上,可轻松管理上百G的文件系统,ReiserFS文件系统更大支持的文件系统尺寸为16TB。这非常适合企业级应用中。

  优异的性能

  由于它的高效存储和快速小文件I/O特点,使用ReiserFs文件系统的PC,在启动X窗口系统时,所花的时间要比在同一台机器上使用ext2文 件系统少1/3。另外,ReiserFS文件系统支持单个文件尺寸为4G的文件,这为大型数据库系统在linux上的应用提供了更好的选择。

;

linux文件接口的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于linux文件接口,深入解析Linux文件接口,掌握文件操作技能,linux文件系统基础知识的信息别忘了在本站进行查找喔。


数据运维技术 » 深入解析Linux文件接口,掌握文件操作技能 (linux文件接口)