【Linux笔记】基础IO(上)

🔥个人主页🔥：孤寂大仙V
🌈收录专栏🌈：Linux
🌹往期回顾🌹：【Linux】进程控制
🔖流水不争，争的是滔滔不

一、理解文件

文件类型

普通文件：包含用户数据，如文本文件、二进制可执行文件、图像文件、音频文件等。文本文件可以用文本编辑器打开查看和编辑，二进制文件则包含了机器可执行的指令或特定格式的数据。
目录文件：用于组织和管理其他文件和目录，类似于 Windows 系统中的文件夹。它包含了指向其他文件和目录的索引信息。
设备文件：在Linux中，硬件设备也被视为文件，分为字符设备文件和块设备文件。字符设备文件通常用于像串口、终端这样以字符流方式进行数据传输的设备；块设备文件用于如硬盘、U盘等以块为单位进行数据读写的设备。
链接文件：类似于 Windows系统中的快捷方式，分为硬链接和软链接（符号链接）。硬链接是同一个文件的多个名称，它们共享相同的 inode号；软链接则是指向另一个文件的特殊文件，有自己独立的 inode 号。
管道文件：主要用于进程间通信，允许两个或多个进程之间进行数据的传递和共享。
套接字文件：用于网络通信或本地进程间通信，是网络编程和一些进程间通信机制的重要组成部分。

狭义理解

文件在磁盘里。
磁盘是永久性存储介质，因此⽂件在磁盘上的存储是永久性的。
磁盘是外设（即是输出设备也是输入设备）
磁盘上的文件本质是对文件的所有操作，都是对外设的输⼊和输出简称 IO 。

广义理解

• Linux 下⼀切皆文件（键盘、显示器、网卡、磁盘…… 这些都是抽象化的过程）

文件操作的归类认知

• 对于 0KB 的空文件是占用磁盘空间的
• 文件是文件属性（元数据）和文件内容的集合（文件 = 属性（元数据）+ 内容）
• 所有的文件操作本质是文件内容操作和文件属性操作

系统角度

对文件的操作本质是进程对文件的操作
磁盘的管理者是操作系统
文件的读写本质不是通过 C 语⾔ / C++ 的库函数来操作的（这些库函数只是为用户和提供方便），而是通过文件相关的系统调用接口来实现的

二、C语言文件接口

打开文件

 #include <stdio.h>
int main()
{
	FILE *fp = fopen("myfile", "w");
	if(!fp)
	{
	printf("fopen error!\n");
	}
	while(1);
    fclose(fp);
     return 0;
}复制

写文件

  
int main()
{
    FILE* fp=("myfile","w");
    if(!fp)
    {
        printf("perror\n");
    }
    const char* msg="gujidaxian"
    int count=5
    while(count--)
    {
        fwrite(msg,strlen(msg),1,fp);
 
    }
    fclose(fp);
    return 0;
}复制

读文件

 #include <stdio.h>
#include <string.h>
 
int main()
{
    // 以只读模式打开文件 "myfile"
    FILE *fp = fopen("myfile", "r");
    if (!fp) {
        // 若文件打开失败，输出错误信息并返回 1
        printf("fopen error!\n");
        return 1;
    }
 
    // 定义一个长度为 1024 的字符数组用于存储从文件中读取的数据
    char buf[1024];
    const char *msg = "hello bit!\n";
 
    while (1) {
        // 从文件中读取数据到 buf 数组，每次读取 strlen(msg) 个字节
        ssize_t s = fread(buf, 1, strlen(msg), fp);
        if (s > 0) {
            // 在读取的数据末尾添加字符串结束符
            buf[s] = '\0';
            // 输出读取的数据
            printf("%s", buf);
        }
        // 检查是否到达文件末尾，如果是则跳出循环
        if (feof(fp)) {
            break;
        }
    }
 
    // 关闭文件
    fclose(fp);
    return 0;
}复制

实现简单cat命令:

 #include <stdio.h>
#include <string.h>
 
int main(int argc, char* argv[]) {
    // 检查命令行参数数量是否为 2
    if (argc != 2) {
        printf("argv error!\n");
        return 1;
    }
 
    // 以只读模式打开命令行参数指定的文件
    FILE *fp = fopen(argv[1], "r");
    if (!fp) {
        printf("fopen error!\n");
        return 2;
    }
 
    // 定义一个字符数组用于存储从文件中读取的数据
    char buf[1024];
 
    // 进入循环，持续从文件中读取数据
    while (1) {
        // 从文件中读取数据到 buf 数组，每次最多读取 sizeof(buf) 个字节
        int s = fread(buf, 1, sizeof(buf), fp);
        if (s > 0) {
            // 在读取的数据末尾添加字符串结束符
            buf[s] = '\0';
            // 输出读取到的数据
            printf("%s", buf);
        }
 
        // 检查是否到达文件末尾，如果是则跳出循环
        if (feof(fp)) {
            break;
        }
    }
 
    // 关闭文件
    fclose(fp);
    return 0;
}复制

C语言stdin & stdout & stderr

我们把信息输出到显示器，有几种方法

 #include <stdio.h>
#include <string.h>
int main()
{
	const char *msg = "hello fwrite\n";
	fwrite(msg, strlen(msg), 1, stdout);
	printf("hello printf\n");
	fprintf(stdout, "hello fprintf\n");
	return 0;
}复制

C会默认打开三个输入输出流，分别是stdin & stdout & stderr
这三个流的类型都是FILE*, fopen返回值类型，文件指针

 #include <stdio.h>
extern FILE *stdin;
extern FILE *stdout;
extern FILE *stderr;复制

stdin是标准输入，对应键盘文件。stdout是标准输出，对应显示器文件。stderr是标准错误，对应显示器文件。为什么这样设置，因为程序是做数据处理的。

打开文件的方式

在这里插入图片描述
当以w的方式打开文件的时候，也就是想向文件内写内容。文件会先被清空。

echo进行重定向就是用w的方式打开文件然后进行写入
在这里插入图片描述
第一次把aaaaa重定向进文件log.txt，然后第二次把bbbbbb重定向进文件log.txt,发现第一次重定向的内容被清空了。

当以a的方式打开文件的时候，也是向文件内写入内容。只不过这是追击内容，之前的内容不会被清空。

echo进行追加重定向是用a的方式打开文件，然后追加写入内容。
在这里插入图片描述
先把aaaaa重定向写入文件log.txt，然后第二次进行追加重定向把bbbbb以追加的方式写入文件log.txt。此时之前的内容不会被清空。

三、系统文件IO

上面聊的C语言的文件操作只是语言层上的打开方式。但是系统才是打开文件的最底层的方案。我们也可以以系统接口的方式访问文件。

系统接口
在这里插入图片描述

 #include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
pathname: 要打开或创建的⽬标⽂件
flags: 打开⽂件时，可以传⼊多个参数选项，⽤下⾯的⼀个或者多个常量进⾏“或”运算，构成flags。
参数:
	O_RDONLY: 只读打开
	O_WRONLY: 只写打开
	O_RDWR : 读，写打开
		这三个常量，必须指定⼀个且只能指定⼀个
	O_CREAT : 若⽂件不存在，则创建它。需要使⽤mode选项，来指明新⽂件的访问权限
	O_APPEND: 追加写
返回值：
成功：新打开的⽂件描述符
失败：-1
 复制

写入文件

清空并写入

 #include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>
#include <unistd.h>
 
int main()
{
    umask(0);
    int fd=open("log.txt",O_CREAT | O_WRONLY | O_TRUNC,0666);
    if(fd<0)
    {
        perror("open");
        return 1;
    }
    printf("fd: %d\n",fd);
    const char* msg="hello hhh";
    int cnt=1;
    while(cnt--)
    {
        write(fd,msg,strlen(msg));
    }
    close(fd);
    return 0;
}复制

在这里插入图片描述
追加并写入

 #include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <string.h>
#include <unistd.h>
 
int main()
{
    umask(0);
    int fd=open("log.txt",O_CREAT | O_WRONLY | O_TRUNC ,0666);
    if(fd<0)
    {
        perror("open");
        return 1;
    }
    printf("fd: %d\n",fd);
    const char* msg="hello bbbb";
    int cnt=1;
    while(cnt--)
    {
        write(fd,msg,strlen(msg));
    }
    close(fd);
    return 0;
}复制

注意上面的加入函数umask(0);就可以自己规范权限。

读文件

 int main()
{
    int fd = open("myfile", O_RDONLY);
    if(fd < 0)
    {
        perror("open");
        return 1;
    } 
    const char *msg = "hello bit!\n";
    char buf[1024];
    while(1)
{
    ssize_t s = read(fd, buf, strlen(msg));//类⽐write
    if(s > 0)
    {
        printf("%s", buf);
    }
    else
    {
        break;
    }
    } 
    close(fd);
    return 0;
}复制

这里的接口都是系统调用，而上面的c语言的文件操作都是语言层面上的调用。其实语言层里面的调用里面都封装着系统级别的调用。

四、文件描述符

文件描述符是一个非负整数，它是 Linux 内核为了管理文件操作而给每个打开的文件或其他 I/O 资源（如管道、套接字等）分配的一个标识符。可以将其理解为一个指向内核中代表打开文件的数据结构的索引，通过这个索引，程序能够方便地对相应的文件或资源进行各种读写等操作。

在操作系统层面接口层面，系统只认文件描述符(fd)。所有根据前面所讲，语言层面肯定封装了文件fd。

 int main()
{
    printf("stdin: %d\n",stdin->_fileno);
    printf("stdout: %d\n",stdout->_fileno);
    printf("stderr: %d\n",stderr->_fileno);
 
    int fd1=open("log.txt",O_CREAT | O_WRONLY | O_TRUNC ,0666);
    int fd2=open("log2.txt",O_CREAT | O_WRONLY | O_TRUNC ,0666);
    int fd3=open("log3.txt",O_CREAT | O_WRONLY | O_TRUNC ,0666);
    int fd4=open("log4.txt",O_CREAT | O_WRONLY | O_TRUNC ,0666);
 
    if(fd1<0) exit(1);
    if(fd2<0) exit(1);
    if(fd3<0) exit(1);
    if(fd4<0) exit(1);
 
    printf("fd1 : %d\n",fd1);
    printf("fd2 : %d\n",fd2);
    printf("fd3 : %d\n",fd3);
    printf("fd4 : %d\n",fd4);
 
    close(fd1);
    close(fd2);
    close(fd3);
    close(fd4);
}复制

在这里插入图片描述
看上面代码，普通进行系统层面的文件操作比如用系统接口进行读操作写操作等，文件描述符是从3开始的。但是语言层面的标准输入标准输出标准错误，是从0-2。(当然其他语言的也是这样)

在这里插入图片描述
文件描述符就是从0开始的小整数。当我们打开文件时，操作系统在内存中要创建相应的数据结构来描述目标文件。于是就有了file结构体。表示⼀个已经打开的文件对象。而进程执行open系统调用，所以必须让进程和文件关联起来。每个进程都有⼀个指针*files, 指向⼀张表files_struct,该表最重要的部分就是包含⼀个指针数组，每个元素都是⼀个指向打开文件的指针！所以，本质上，文件描述符就是该数组的下标。所以，只要拿着文件描述符，就可以找到对应文件。

文件描述符的分配规则

 int main()
{
    umask(0);
    int fd=open("log.txt",O_CREAT | O_WRONLY | O_TRUNC ,0666);
    if(fd<0)
    {
        perror("open");
        return 1;
    }
 
    printf("fd:%d\n",fd);
    close(fd);
    return 0;
 
}复制

在这里插入图片描述
正常情况打开，一个文件。文件描述符从3开始。

关闭files_sructs数组0下标位置，发现打开文件描述符下标位置为0。

 int main()
{
    umask(0);
    close(0);
    int fd=open("log.txt",O_CREAT | O_WRONLY | O_TRUNC ,0666);
    if(fd<0)
    {
        perror("open");
        return 1;
    }
 
    printf("fd:%d\n",fd);
    close(fd);
    return 0;
 
}复制

在这里插入图片描述

通过上面示例发现，在files_struct数组中，找到当前没有使用的最小的一个位置的小标，作为新的文件描述符的位置。

重谈重定向

上面谈过，echo重定向本质是通过语言层面进行文件操作把内容写进文件。从上面也知道语言层面的接口都封装系统层面的调用。下面谈一谈系统层面是如何进行重定向的。

最小的没有被使用的fd，最为新的fd分配给用户。

在这里插入图片描述
当我们把fd下标为2，标准输出的位置关了，我们文件的内容的fd会自动分配到下标为2位置。

使用dup2系统调用
在这里插入图片描述

 int main() {
    // 打开文件，如果文件不存在则创建，同时以读写模式打开
    int fd = open("./log", O_CREAT | O_RDWR);
    if (fd < 0) {
        perror("open");
        return 1;
    }
 
    // 关闭标准输出文件描述符
    close(1);
    // 将文件描述符 fd 复制到标准输出文件描述符（1）
    dup2(fd, 1);
 
    for (;;) {
        char buf[1024] = {0};
        // 从标准输入读取数据到缓冲区
        ssize_t read_size = read(0, buf, sizeof(buf) - 1);
        if (read_size < 0) {
            perror("read");
            break;
        }
        // 输出读取到的内容
        printf("%s", buf);
        // 刷新标准输出缓冲区
        fflush(stdout);
    }
    return 0;
}
 
 复制

标准错误

向标准输出和标准错误里打信息
在这里插入图片描述
标准输出和标准错误都是显示器文件，想把标准输出和标准错误的信息重定向一个文件。这样是不行的。可以发现两者在两个文件中

用下面这个指令进行重定向，重定向到了两个文件

用下面这个指令可以把两者重定向到一个文件
在这里插入图片描述

为什么存在一个标准错误呢？可以通过重定向能力把常规消息和错误消息进行分离。以方便后续用户进行操作好区分。

	#include <stdio.h>
	int main()
	{
	FILE *fp = fopen("myfile", "w");
	if(!fp)
	{
	printf("fopen error!\n");
	}
	while(1);
	fclose(fp);
	return 0;
	}


	int main()
	{
	FILE* fp=("myfile","w");
	if(!fp)
	{
	printf("perror\n");
	}
	const char* msg="gujidaxian"
	int count=5
	while(count--)
	{
	fwrite(msg,strlen(msg),1,fp);

	}
	fclose(fp);
	return 0;
	}

	#include <stdio.h>
	#include <string.h>

	int main()
	{
	// 以只读模式打开文件 "myfile"
	FILE *fp = fopen("myfile", "r");
	if (!fp) {
	// 若文件打开失败，输出错误信息并返回 1
	printf("fopen error!\n");
	return 1;
	}

	// 定义一个长度为 1024 的字符数组用于存储从文件中读取的数据
	char buf[1024];
	const char *msg = "hello bit!\n";

	while (1) {
	// 从文件中读取数据到 buf 数组，每次读取 strlen(msg) 个字节
	ssize_t s = fread(buf, 1, strlen(msg), fp);
	if (s > 0) {
	// 在读取的数据末尾添加字符串结束符
	buf[s] = '\0';
	// 输出读取的数据
	printf("%s", buf);
	}
	// 检查是否到达文件末尾，如果是则跳出循环
	if (feof(fp)) {
	break;
	}
	}

	// 关闭文件
	fclose(fp);
	return 0;
	}

	#include <stdio.h>
	#include <string.h>

	int main(int argc, char* argv[]) {
	// 检查命令行参数数量是否为 2
	if (argc != 2) {
	printf("argv error!\n");
	return 1;
	}

	// 以只读模式打开命令行参数指定的文件
	FILE *fp = fopen(argv[1], "r");
	if (!fp) {
	printf("fopen error!\n");
	return 2;
	}

	// 定义一个字符数组用于存储从文件中读取的数据
	char buf[1024];

	// 进入循环，持续从文件中读取数据
	while (1) {
	// 从文件中读取数据到 buf 数组，每次最多读取 sizeof(buf) 个字节
	int s = fread(buf, 1, sizeof(buf), fp);
	if (s > 0) {
	// 在读取的数据末尾添加字符串结束符
	buf[s] = '\0';
	// 输出读取到的数据
	printf("%s", buf);
	}

	// 检查是否到达文件末尾，如果是则跳出循环
	if (feof(fp)) {
	break;
	}
	}

	// 关闭文件
	fclose(fp);
	return 0;
	}

	#include <stdio.h>
	extern FILE *stdin;
	extern FILE *stdout;
	extern FILE *stderr;

	#include <sys/types.h>
	#include <sys/stat.h>
	#include <fcntl.h>
	int open(const char *pathname, int flags);
	int open(const char *pathname, int flags, mode_t mode);
	pathname: 要打开或创建的⽬标⽂件
	flags: 打开⽂件时，可以传⼊多个参数选项，⽤下⾯的⼀个或者多个常量进⾏“或”运算，构成flags。
	参数:
	O_RDONLY: 只读打开
	O_WRONLY: 只写打开
	O_RDWR : 读，写打开
	这三个常量，必须指定⼀个且只能指定⼀个
	O_CREAT : 若⽂件不存在，则创建它。需要使⽤mode选项，来指明新⽂件的访问权限
	O_APPEND: 追加写
	返回值：
	成功：新打开的⽂件描述符
	失败：-1

	int main()
	{
	int fd = open("myfile", O_RDONLY);
	if(fd < 0)
	{
	perror("open");
	return 1;
	}
	const char *msg = "hello bit!\n";
	char buf[1024];
	while(1)
	{
	ssize_t s = read(fd, buf, strlen(msg));//类⽐write
	if(s > 0)
	{
	printf("%s", buf);
	}
	else
	{
	break;
	}
	}
	close(fd);
	return 0;
	}

	int main()
	{
	printf("stdin: %d\n",stdin->_fileno);
	printf("stdout: %d\n",stdout->_fileno);
	printf("stderr: %d\n",stderr->_fileno);

	int fd1=open("log.txt",O_CREAT \| O_WRONLY \| O_TRUNC ,0666);
	int fd2=open("log2.txt",O_CREAT \| O_WRONLY \| O_TRUNC ,0666);
	int fd3=open("log3.txt",O_CREAT \| O_WRONLY \| O_TRUNC ,0666);
	int fd4=open("log4.txt",O_CREAT \| O_WRONLY \| O_TRUNC ,0666);

	if(fd1<0) exit(1);
	if(fd2<0) exit(1);
	if(fd3<0) exit(1);
	if(fd4<0) exit(1);

	printf("fd1 : %d\n",fd1);
	printf("fd2 : %d\n",fd2);
	printf("fd3 : %d\n",fd3);
	printf("fd4 : %d\n",fd4);

	close(fd1);
	close(fd2);
	close(fd3);
	close(fd4);
	}

	int main()
	{
	umask(0);
	int fd=open("log.txt",O_CREAT \| O_WRONLY \| O_TRUNC ,0666);
	if(fd<0)
	{
	perror("open");
	return 1;
	}

	printf("fd:%d\n",fd);
	close(fd);
	return 0;

	}

	int main()
	{
	umask(0);
	close(0);
	int fd=open("log.txt",O_CREAT \| O_WRONLY \| O_TRUNC ,0666);
	if(fd<0)
	{
	perror("open");
	return 1;
	}

	printf("fd:%d\n",fd);
	close(fd);
	return 0;

	}

	int main() {
	// 打开文件，如果文件不存在则创建，同时以读写模式打开
	int fd = open("./log", O_CREAT \| O_RDWR);
	if (fd < 0) {
	perror("open");
	return 1;
	}

	// 关闭标准输出文件描述符
	close(1);
	// 将文件描述符 fd 复制到标准输出文件描述符（1）
	dup2(fd, 1);

	for (;;) {
	char buf[1024] = {0};
	// 从标准输入读取数据到缓冲区
	ssize_t read_size = read(0, buf, sizeof(buf) - 1);
	if (read_size < 0) {
	perror("read");
	break;
	}
	// 输出读取到的内容
	printf("%s", buf);
	// 刷新标准输出缓冲区
	fflush(stdout);
	}
	return 0;
	}