Linux系统 2023-07-02

Linux管道的工作原理简介 (linux管道实现原理)

Linux操作系统是一个免费、免费开放源代码的操作系统。它是由极客和程序员们开发的，已被许多人广泛使用。其中一个重要的优势是它有许多特性，其中之一是管道。通过管道机制，Linux让数据流动变得更加容易。

管道是Linux中的一种特殊文件类型。它允许将一个程序的输出传递给另一个程序的输入。管道的工作原理非常简单。当一个程序把数据发送到管道中时，该数据自动传递给管道的另一端，另一个程序可读取该数据。这里我们将介绍Linux管道的工作原理，以及如何在Linux系统中使用管道。

Linux管道原理

在讲述Linux管道原理之前，我们先来介绍一些Linux系统中的概念。在Linux系统中，一切都是文件。例如，当您输入命令并按下Enter键时，命令本身可以被视为文件。常常在Linux命令行中看到的红色的一些词（例如ls，cat等）也可以被视为文件。文件之间的数据传输也是通过文件描述符进行的。在Linux系统中，每个打开的文件都有一个相应的文件描述符。

在Linux系统中，管道被视为文件之一，因此，管道也有一个文件描述符。正因为如此，Linux管道可以被视为两个程序之间的一条连接。其中一个程序称为管道的写端，其他一个程序称为管道的读端。

当一个程序把数据写入管道中时，管道的写端就变为可读写状态，管道的读端就会变为可读状态，另一个程序就可以读到管道中的数据。

如何在Linux系统中使用管道

现在让我们来看看如何在Linux系统中使用管道。您需要有两个程序，一个为管道的写端，另一个为管道的读端。您可以使用以下命令将两个程序连成一个管道：

program_1 | program_2

在这里，您需要将一个程序的输出连接到另一个程序的输入。使用竖杠符号“|”将两个程序连通。

让我们来看一个例子。假设您有一个程序A，它生成文本，但是您想要将这个文本写入文件中。在这种情况下，您可以使用以下命令将程序A的输出连接到程序B的输入：

./programA | ./programB > output.txt

这将创建一个管道，将程序A的输出连接到程序B的输入。ProgramB将写入它接收到的数据到output.txt。

管道与大多数Linux命令一起使用非常方便。例如，您可以使用以下命令将列出/etc目录中的文件和文件夹，然后将该列表按字母顺序排序：

ls /etc/ | sort

该命令将列出/etc目录的内容，连接到sort程序的输入，将列表按字母顺序排序，并将输出发送到Linux终端。

Linux管道是Linux系统中的一个非常强大的特性。通过使用Linux管道，多个程序之间的数据流转可以变得更加方便快捷。管道的工作原理很简单，通过将一个程序的输出连接到另一个程序的输入来建立一条管道。当程序把数据写入管道中时，另一个程序就可以从管道中读取这些数据。希望以上内容能够帮助对Linux管道的工作原理有更好的理解，并能够更好地应用于Linux系统中。

相关问题拓展阅读：

12 Binder原理-基础知识点
Linux的管道命令如何使用？

12 Binder原理-基础知识点

Binder原理是掌握系统底层原理的基石，也是进阶高级工程师的必备知识点，这篇文章不会过多介绍Binder原理，而是讲解学习Binder前需要的掌握的知识点。

IPC全名为inter-Process Communication，含义为进程间通信，是指两个进程之间进行数据交换的过程。在Android和Linux中都有各自的IPC机制，这里分别来介绍下。

Linux中提供了很多进程间通信机制，主要有管道（pipe）、信号（sinal）、信号量（semophore）、消息队列（Message）、共享内存（Share Memory)、套接字（Socket）等。

管道

管道是Linux由Unix那里继承过来的进程间的通信机制，它是Unix早期的一个重要通信机制。管道的主要思想是，在内存中创建一个共享文件，从而使通信双方利用这个共享文件来传递信息。这个共享文件比较特殊，它不属于文件系统并且只存在于内存中。另外还有一点，管道采用的是半双工通信方式的，数据只能在一个方向上流动。

简单的模型如下所示。

信号

信号是软件层次上对中断机制的一种模拟，是一种异步通信方式，进程不必通过任何操作来等待信号的到达。信号可以在用户空间进程和内核之间直接交互，内核可以利用信号来通知用户空间的进程发生了哪些系统事件。信号不适用于信息交换，比较适用于进程中断控制。

信号量

信号量是一个计数器，用来控制多个进程对共享资源的访问。它常作为一种锁机制，防止某进程正在访问共享资源时，其他进程也访问该资源。主要作为进程间以及同一进程内不同线程之间的同步手段。

消息队列

消息队列是消息的链表，具有特定的格式，存放在内存中并由消息队列标识符标识，并且允许一个或多个进程向它写入与读取消息。信息会复制两次，因此对于频繁或者信息量大的通信不宜使用消息队列。

共享内存

多个进程可以直接读写的一块内存空间，是针对其他通信机制运行效率较低而设计的。

为了在多个进程间交换信息，内核专门留出了一块内存区，可以由需要访问的进程将其映射到自己的私有地址空间。进程就可以直接读写这一块内存而不需要进行数据的拷贝，从而大大的提高效率。

套接字

套接字是更为基础的进程间通信机制，与其他方式不同的是，套接字可用于不同机器之间的进程间通信。

Android系统是基于Linux内核的，在Linux内核基础上，又拓展出了一些IPC机制。Android系统除了支持套接字，还支持序列化、Messenger、AIDL、Bundle、文件共享、ContentProvider、Binder等。Binder会在后面介绍，先来了解前面的IPC机制。

序列化

序列化指的是Serializable/Parcelable，Serializable是Java提供的一个序列化接口，是一个空接口，为对象提供标准的序列化和反序列化操作。Parcelable接口是Android中的序列化方式，更适合在Android平台上使用，用起来比较麻烦，效率很高。

Messenger

Messenger在Android应用开发中的使用频率不高，可以在不同进程中传递Message对象，在Message中加入我们想要传的数据就可以在进程间的进行数据传递了。Messenger是一种轻量级的IPC方案并对AIDL进行了封装。

AIDL

AIDL全名为Android interface definition Language，即Android接口定义语言。Messenger是以串行的方式来处理客户端发来的信息，如果有大量的消息发到服务端，服务端仍然一个一个的处理再响应客户端显然是不合适的。另外还有一点，Messenger用来进程间进行数据传递但是却不能满足跨进程的方法调用，这个时候就需要使用AIDL了。

Bundle

Bundle实现了Parcelable接口，所以它可以方便的在不同的进程间传输。Acitivity、Service、Receiver都是在Intent中通过Bundle来进行数据传递。

文件共享

两个进程通过读写同一个文件来进行数据共享，共享的文件可以是文本、XML、JOSN。文件共享适用于对数据同步要求不高的进程间通信。

ContentProvider

ContentProvider为存储和获取数据了提供统一的接口，它可以在不同的应用程序之间共享数据，本身就是适合进程间通信的。ContentProvider底层实现也是Binder，但是使用起来比AIDL要容易许多。系统中很多操作都采用了ContentProvider，例如通讯录，音视频等，这些操作本身就是跨进程进行通信。

在讲到Linux的进程通信原理之前，我们需要先了解Liunx中的几个概念。

内核空间和用户空间

当我们接触到Liunx时，免不了听到两个词，User space（用户空间）和 Kernel space（内核空间），那么它们的含义是什么呢？

为了保护用户进程不能直接操作内核，保证内核的安全，操作系统从逻辑上将虚拟空间划分为用户空间和内核空间。Linux 操作系统将更高的1GB字节供内核使用，称为内核空间，较低的3GB 字节供各进程使用，称为用户空间。

内核空间是Linux内核的运行空间，用户空间是用户程序的运行空间。为了安全，它们是隔离的，即使用户的程序崩溃了，内核也不会受到影响。内核空间的数据是可以进程间共享的，而用户空间则不可以。比如在上图进程A的用户空间是不能和进程B的用户空间共享的。

进程隔离

进程隔离指的是，一个进程不能直接操作或者访问另一个进程。也就是进程A不可以直接访问进程B的数据。

系统调用

用户空间需要访问内核空间，就需要借助系统调用来实现。系统调用是用户空间访问内核空间的唯一方式，保证了所有的资源访问都是在内核的控制下进行的，避免了用户程序对系统资源的越权访问，提升了系统安全性和稳定性。

进程A和进程B的用户空间可以通过如下系统函数和内核空间进行交互。

内存映射

由于应用程序不能直接操作设备硬件地址，所以操作系统提供了一种机制：内存映射，把设备地址映射到进程虚拟内存区。

举个例子，如果用户空间需要读取磁盘的文件，如果不采用内存映射，那么就需要在内核空间建立一个页缓存，页缓存去拷贝磁盘上的文件，然后用户空间拷贝页缓存的文件，这就需要两次拷贝。

采用内存映射，如下图所示。

由于新建了虚拟内存区域，那么磁盘文件和虚拟内存区域就可以直接映射，少了一次拷贝。

内存映射全名为Memory Map，在Linux中通过系统调用函数mmap来实现内存映射。将用户空间的一块内存区域映射到内核空间。映射关系建立后，用户对这块内存区域的修改可以直接反应到内核空间，反之亦然。内存映射能减少数据拷贝次数，实现用户空间和内核空间的高效互动。

了解Liunx中的几个概念后，就可以学习Linux的IPC通信原理了，如下图所示。

内核程序在内核空间分配内存并开辟一块内核缓存区，发送进程通过copy_from_user函数将数据拷贝到到内核空间的缓冲区中。同样的，接收进程在接收数据时在自己的用户空间开辟一块内存缓存区，然后内核程序调用 copy_to_user() 函数将数据从内核缓存区拷贝到接收进程。这样数据发送进程和数据接收进程完成了一次数据传输，也就是一次进程间通信。

Linux的IPC通信原理有两个问题：

Binder是基于开源的OpenBinder实现的，OpenBinder最早并不是由Google公司开发的，而是Be Inc公司开发的，接着由Palm, Inc.公司负责开发。后来OpenBinder的作者Dianne Hackborn加入了Google公司，并负责Android平台的开发工作，顺便把这项技术也带进了Android。

Binder是基于内存映射来实现的，在前面我们知道内存映射通常是用在有物理介质的文件系统上的，Binder没有物理介质，它使用内存映射是为了跨进程传递数据。

Binder通信的步骤如下所示。

1.Binder驱动在内核空间创建一个数据接收缓存区。

2.在内核空间开辟一块内核缓存区，建立内核缓存区和数据接收缓存区之间的映射关系，以及数据接收缓存区和接收进程用户空间地址的映射关系。

3.发送方进程通过copy_from_user()函数将数据拷贝到内核中的内核缓存区，由于内核缓存区和接收进程的用户空间存在内存映射，因此也就相当于把数据发送到了接收进程的用户空间，这样便完成了一次进程间的通信。

整个过程只使用了1次拷贝，不会因为不知道数据的大小而浪费空间或者时间，效率更高。

Android是基于Linux内核的，Linux提供了很多IPC机制，而Android却自己设计了Binder来进行通信，主要是因为以下几点。

性能方面

性能方面主要影响的因素是拷贝次数，管道、消息队列、Socket的拷贝次书都是两次，性能不是很好，共享内存不需要拷贝，性能更好，Binder的拷贝次书为1次，性能仅次于内存拷贝。

稳定性方面

Binder是基于C/S架构的，这个架构通常采用两层结构，在技术上已经很成熟了，稳定性是没有问题的。共享内存没有分层，难以控制，并发同步访问临界资源时，可能还会产生死锁。从稳定性的角度讲，Binder是优于共享内存的。

安全方面

Android是一个开源的系统，并且拥有开放性的平台，市场上应用来源很广，因此安全性对于Android 平台而言极其重要。

传统的IPC接收方无法获得对方可靠的进程用户ID/进程ID（UID/PID），无法鉴别对方身份。Android 为每个安装好的APP分配了自己的UID，通过进程的UID来鉴别进程身份。另外，Android系统中的Server端会判断UID/PID是否满足访问权限，而对外只暴露Client端，加强了系统的安全性。

语言方面

Linux是基于C语言，C语言是面向过程的，Android应用层和Java Framework是基于Java语言，Java语言是面向对象的。Binder本身符合面向对象的思想，因此作为Android的通信机制更合适不过。

从这四方面来看，Linux提供的大部分IPC机制根本无法和Binder相比较，而共享内存只在性能方面优于Binder，其他方面都劣于Binder，这些就是为什么Android要使用Binder来进行进程间通信，当然系统中并不是所有的进程通信都是采用了Binder，而是根据场景选择最合适的，比如Zygote进程与AMS通信使用的是Socket，Kill Process采用的是信号。

Binder机制在Android中的地位举足轻重，我们需要掌握的很多原理都和Binder有关：

上面只是列了一小部分，简单来说说，比如系统在启动时，SystemServer进程启动后会创建Binder线程池，目的是通过Binder，使得在SystemServer进程中的服务可以和其他进程进行通信了。再比如我们常说的AMS、PMS都是基于Binder来实现的，拿PMS来说，PMS运行在SystemServer进程，如果它想要和DefaultContainerService通信（是用于检查和复制可移动文件的系统服务），就需要通过Binder，因为DefaultContainerService运行在com.android.defcontainer进程。

还有一个比较常见的C/S架构间通信的问题，Client端的MediaPlayer和Server端的MeidaPlayerService不是运行在一个进程中的，同样需要Binder来实现通信。

可以说Binder机制是掌握系统底层原理的基石。

上图并没有给出Binder机制的具体的细节，而是先给出了一个概念，根据系统的Android系统的分层。

Linux的管道命令如何使用？

管道命令就是用来连接多条指令的，前一条指令的输出流向会作为后一条指含掘闹令的操作对象。

管道命令的操作符是：|，它只能处理由前面一条指令传出的正确输出信息，对错误信息是没有直接处理能力的。然后，传递给下一条指令，作为操作对象。

基本格式：

指令1 | 指令2 | …

【指令1】正确输出，作散厅为【指令2】的输入，然后【指令2】的输出作为【指令3】的输入，如果【指令3】有输出，那么输出谈罩就会直接显示在屏幕上面了。通过管道之后【指令1】和【指令2】的正确输出是不显示在屏幕上面的。

【提醒注意】

管道命令只能处理前一条指令的正确输出，不能处理错误输出;

管道命令的后一条指令，必须能够接收标准输入流命令才能执行。

使用示例

1、分页显示/etc目录中内容的详细信息

$ ls -l /etc | more

2、将一个字符串输入到一个文件中

$ echo “hello world” | cat > hello.txt

1.linux管道命令具有过滤特性，一条命令通过标准输入端口接收一个文件中的数据，命令执行后产生的结果数据又通过标准输出端口送给后一条命令，作为第二条罩猜命令的输入数据。第二条数据也是通过标准输入端口接收输入数据。shell提供管尘毕道命令|把这派闷芹些命令前后衔接在一起，形成一个管道线。2.ps -ef|grep mysqld 这个竖线|就是管道命令的体现。

关于linux管道实现原理的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

数据运维技术 » Linux管道的工作原理简介 (linux管道实现原理)

分享到：

12 Binder原理-基础知识点

Linux的管道命令如何使用？

相关推荐