Linux Top命令参数解析,提高系统管理效率 (linux top命令参数)

在Linux系统中,Top命令是一个常用的系统性能监视工具。使用Top命令可以实时监测Linux系统中各项资源的状态,包括CPU、内存、磁盘、网络等。Top命令的参数较多,掌握它们的含义并正确使用可以提高系统管理效率。下面将对Top命令的常用参数进行介绍。

1. 显示进程列表

Top命令默认显示系统的进程列表,并按照CPU占用率从高到低进行排序。进程列表中包括进程ID、进程名称、用户、CPU占用率、内存占用率等信息。通过按下“P”键可以按照CPU占用率进行排序,按下“M”键可以按照内存占用率进行排序。

2. 显示特定用户的进程列表

如果需要查看特定用户的进程列表,可以使用“-U”参数。例如,输入“top -U root”可以显示root用户的进程列表。

3. 按CPU占用率进行排序

使用Top命令最常用的参数之一就是按照CPU占用率进行排序。通过按下“P”键可以实现,也可以在命令行中添加“-o %CPU”参数进行设置,例如“top -o %CPU”。

4. 显示进程的完整命令行

Top命令默认只显示进程的名称,如果需要查看进程的完整命令行,可以在Top命令中按下“c”键。此外,也可以在命令行中添加“-c”参数进行设置,例如“top -c”。

5. 显示系统整体的CPU和内存使用情况

除了显示进程列表外,Top命令还可以用来查看系统整体的CPU和内存使用情况。在Top命令的顶部,可以看到CPU和内存的使用情况,包括总量、已用量、空闲量等信息。

6. 设置刷新时间

Top命令的默认刷新时间是3秒钟。如果需要更改刷新时间,可以按下“d”键,然后在弹出的窗口中输入所需的刷新时间,单位为秒。此外,也可以在命令行中添加“-d”参数进行设置,例如“top -d 5”表示刷新时间为5秒。

7. 以批处理模式运行Top命令

批处理模式是指将Top命令的输出结果保存到文件中,而不是实时显示在终端中。在命令行中添加“-b”参数即可将Top命令运行在批处理模式下,例如“top -b > top.log”。

8. 显示指定进程的信息

如果需要查看单个进程的详细信息,可以在Top命令中输入进程的PID或者名称,然后按下“Enter”键。此时,Top命令会显示该进程的详细信息,包括进程状态、线程数、CPU和内存使用情况等。

Top命令是Linux系统中非常重要的一个工具,可以帮助管理员实时监视系统资源的状态。掌握Top命令的常用参数可以提高系统管理效率,缩短故障处理时间,从而提升整个系统的稳定性和可靠性。

相关问题拓展阅读:

linux系统top给出的信息都有哪些

Linux新手,个人认为首先就应该了解纳团一下top命令各项的含义.

不用有事就问什么搜索引擎,先看看man top.

top – 16:12:56 up 1 day, 22 min, 4 users, load average: 0.02, 0.04, 0.05

Tasks: 158 total, 1 running, 156 sleeping, 0 stopped, 1 zombie

%Cpu(s): 0.7 us, 0.3 sy, 0.0 ni, 98.8 id, 0.1 wa, 0.0 hi, 0.0 si, 0.0 st

KiB Mem:total,used,free,buffers

KiB Swap:total,used,free.cached Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

5761 eechen1076 R 6.2 0.2 0:00.01 top

16:12:56 up 1 day, 22 min, 4 users, load average: 0.02, 0.04, 0.05

这句等同于执行 uptime 命令返回的内容.

16:12:56 是当前时间(date).

up 1 day, 22 min 表示系统已经运行1天又22分钟(uptime -p).

4 users 表示当前登录系统的用户(w,who).

load average 表示系统负载,分别是1分钟,5分钟,15分钟前到现在的负载平均值.

Tasks: 158 total 表示系统的进程数(数目等于ps -ef|wc -l的值减去2),按大写H可以切换到线程模式.

running表示正在运行的进程,sleeping表示睡眠的进程,stopped表示暂停的进程,zombie表示已结束但还没有从进程表中删除的僵尸进程.

total表示总内存,used表示已经使用的内存,free表示空闲的内存,按E可以切换单位.

buffers(Buffer Cache)表示块设备的读写缓冲区占用的内存,cached(Page Cache)表示文件系统缓存占用的内存.

buffers:块设备缓冲 cached:文件系统缓存

如果cached的值很大,说明cache住的文件数很多.如果频繁访问到的文件都能被cache住,那么磁盘的读I/O就非常小.

所谓块设备是指对其信息的存取以”块”为单位,如通常的光盘,硬磁盘,软磁盘,磁带等,块长取512字节或1024字节或4096字节.

块设备可以直接通过块设备特别文件来访问,为了提高数据传输效率,块设备驱动程序内部采用块缓冲技术.

Swap是交换空间,交换空间在物理内存(RAM)被充满时被使用.

如果系统需要更多的内存资源,而物理内存已经充满,内存中不活跃的页就会被移到交换空间去.

虽然交换空间可以为带有少量内存的机器提供帮助,但是这种方法不应该宏茄庆被当做是对内存的取蔽握代.

交换空间位于硬盘驱动器上,它比进入物理内存要慢.

load average的理解:

load average指的是处于task_running或task_uninterruptible状态的进程(或线程)数的平均值.

处于task_running状态的进程(或线程),可能正在使用CPU或排队等待使用CPU.

处于task_uninterruptible状态的进程(或线程),可能正在等待I/O,比如等待磁盘I/O.这时I/O等待占用的CPU时间百分比iowait(wa)可能会比较高.

sudo strace -p `pidof top` 可见top从/proc读取了很多信息.

man proc 查看 /proc/loadavg 的说明:

man proc | col -b > proc.txt

/proc/loadavg 内容:

0.22 0.13 0.14 2/

0.22 0.13 0.14表示在过去的1分钟,5分钟,15分钟,

正在运行(task_running)或等待IO(task_uninterruptible)的任务的数量.

2/374中的2表示当前运行的线程数,374则表示系统当前存在的内核调度实体(进程/线程)的数量.

5306是系统最近创建的进程PID编号.

又比如:

load average: 31.09, 29.87, 29.92

表示在过去的1分钟,5分钟,15分钟的时间里,CPU任务队列中平均有30个程序(这里应该是30个Java线程)在使用CPU.

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

root0.227t 0.012tS.:58 java

Java进程的CPU使用率%CPU达到3090%,表示这个Java进程正在使用31个CPU核心,

这样对上了上面load average得出的数据,也就是有30个左右的Java线程正在使用30个CPU核心.

按H(区分大小写)切换到线程模式,因为一个线程最多只能使用一个核心,所以线程模式下显示的CPU使用率不会超过100%.

当CPU和磁盘都忙不过来的时候,开再多的进程也没有任何意义,只会徒增CPU上下文切换和磁盘I/O等待,得不偿失.

系统负载高,普遍是因为系统进程数太多,I/O太多导致的.

load average小于1表示系统空闲,大于1表示系统开始繁忙.

Linux服务器的任务(进程)数量保持在200个以下是比较好的,更好不要超过300个.

us, user : time running un-niced user processes 用户空间进程占用CPU时间百分比

sy, system : time running kernel processes 内核进程占用CPU时间百分比

ni, nice : time running niced user processes 用户空间内改变过优先级的进程占用CPU时间百分比

id, idle : time spent in the kernel idle handler 空闲CPU时间百分比(100%表示系统完全空闲)

wa, iowait : time waiting for I/O completion I/O等待占用的CPU时间百分比

hi : time spent servicing hardware interrupts 硬件中断占用CPU时间百分比

si : time spent servicing software interrupts 软件中断占用CPU时间百分比

st : time stolen from this vm by the hypervisor 虚拟化hypervisor从当前虚拟机vm偷走的时间

如果st这个值很高的话,说明你的VPS提供商的CPU资源有限,而你没能抢过别人,很有可能就是VPS提供商超售了.

按F选择要显示的列和查看每列的含义,默认有下面这些列:

PID = Process Id

USER = Effective User Name

PR = Priority PR和NI的值越高越友好即越不竞争资源,比如PR 20和NI 0,另外,PR=NI+20.

NI = Nice Value 负值表示高优先级,正值表示低优先级,比如kworker的NI为-20,PR为0.

VIRT = Virtual Image (KiB)

RES = Resident Size (KiB) 常驻内存,按E切换单位.

SHR = Shared Memory (KiB)

S= Process Status

%CPU = CPU Usage 四核处理器在Tasks模式下满载为400%,在Threads模式(按H切换)下满载为100%(一个线程最多只能使用一个核心).按Shift+P按CPU使用率排序.

%MEM = Memory Usage (RES) 满载为100%,按Shift+M按RES内存排序.

TIME+ = CPU Time, hundredths 进程使用的CPU时间总计.比如2:32.45代表2分钟32.45秒.

COMMAND = Command Name/Line

按F进入域管理窗口后按A可以切换显示模式,按空格选中要显示的列,按S按指定列排序,用向右方向键选中列后可以调整顺序.修改后按Shift+W保存设置到~/.toprc文件.

top里面按Shift+M是按内存排序,按E是切换内存单位,按Shfit+W保存设置.

然后执行top -n1 -b可以看到按内存排序的所有进程的信息.

或者ps后用sort排序:

ps aux | sort -k4nr | head -n5

top里按C或者使用-c参数可以看到进程的绝对路径和启动参数,就可以得到类似ps -ef和ps aux提供的信息了.

看进程路径: top -p `pidof firefox` -c -n1

看进程线程: top -p `pidof firefox` -H -n1

Linux Process Status:

R (task_running) : 可执行状态

S (task_interruptible): 可中断的睡眠状态

D (task_uninterruptible): 不可中断的睡眠状态

T (task_stopped or task_traced): 暂停状态或跟踪状态

Z (task_dead – exit_zombie): 退出状态,进程成为僵尸进程

X (task_dead – exit_dead): 退出状态,进程即将被销毁

running进程:

只有在该状态的进程才可能在CPU上运行。

而同一时刻可能有多个进程处于可执行状态,这些进程的task_struct结构(进程控制块)被放入对应CPU的可执行队列中(一个进程最多只能出现在一个CPU的可执行队列中)。

进程调度器的任务就是从各个CPU的可执行队列中分别选择一个进程在该CPU上运行。

很多操作系统教科书将正在CPU上执行的进程定义为RUNNING状态、而将可执行但是尚未被调度执行的进程定义为READY状态,这两种状态在Linux下统一为TASK_RUNNING状态。

sleeping进程:

处于这个状态的进程因为等待某某事件的发生(比如等待socket连接、等待信号量),而被挂起。

这些进程的task_struct结构被放入对应事件的等待队列中。当这些事件发生时(由外部中断触发、或由其他进程触发),对应的等待队列中的一个或多个进程将被唤醒。

通过ps命令我们会看到,一般情况下,进程列表中的绝大多数进程都处于task_interruptible状态(除非机器的负载很高)。

毕竟CPU就这么一两个,进程动辄几十上百个,如果不是绝大多数进程都在睡眠,CPU又怎么响应得过来。

stopped进程:

向进程发送一个sigstop信号,它就会因响应该信号而进入task_stopped状态,除非该进程本身处于task_uninterruptible状态而不响应信号。

sigstop与sigkill信号一样,是非常强制的。不允许用户进程通过signal系列的系统调用重新设置对应的信号处理函数。

向进程发送一个sigcont信号,可以让其从task_stopped状态恢复到task_running状态。

当进程正在被跟踪时,它处于task_traced这个特殊的状态。“正在被跟踪”指的是进程暂停下来,等待跟踪它的进程对它进行操作。

比如在gdb中对被跟踪的进程下一个断点,进程在断点处停下来的时候就处于task_traced状态。而在其他时候,被跟踪的进程还是处于前面提到的那些状态。

对于进程本身来说,task_stopped和task_traced状态很类似,都是表示进程暂停下来。

而task_traced状态相当于在task_stopped之上多了一层保护,处于task_traced状态的进程不能响应sigcont信号而被唤醒。

只能等到调试进程通过ptrace系统调用执行ptrace_cont、ptrace_detach等操作(通过ptrace系统调用的参数指定操作),或调试进程退出,被调试的进程才能恢复task_running状态。

zombie进程:

在Linux进程的状态中,僵尸进程是非常特殊的一种,它是已经结束了的进程,但是没有从进程表中删除。

太多了会导致进程表里面条目满了,进而导致系统崩溃,倒是不占用其他系统资源。

它已经放弃了几乎所有内存空间,没有任何可执行代码,也不能被调度,

仅仅在进程列表中保留一个位置,记载该进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不再占有任何内存空间。

进程在退出的过程中,处于TASK_DEAD状态。在这个退出过程中,进程占有的所有资源将被回收,除了task_struct结构(以及少数资源)以外。

于是进程就只剩下task_struct这么个空壳,故称为僵尸。

之所以保留task_struct,是因为task_struct里面保存了进程的退出码、以及一些统计信息。

而其父进程很可能会关心这些信息。比如在shell中,$?变量就保存了最后一个退出的前台进程的退出码,而这个退出码往往被作为if语句的判断条件。

当然,内核也可以将这些信息保存在别的地方,而将task_struct结构释放掉,以节省一些空间。

但是使用task_struct结构更为方便,因为在内核中已经建立了从pid到task_struct查找关系,还有进程间的父子关系。

释放掉task_struct,则需要建立一些新的数据结构,以便让父进程找到它的子进程的退出信息。

子进程在退出的过程中,内核会给其父进程发送一个信号,通知父进程来“收尸”。

父进程可以通过wait系列的系统调用(如wait4、waitid)来等待某个或某些子进程的退出,并获取它的退出信息。

然后wait系列的系统调用会顺便将子进程的尸体(task_struct)也释放掉。

这个信号默认是SIGCHLD,但是在通过clone系统调用创建子进程时,可以设置这个信号。

如果他的父进程没安装SIGCHLD信号处理函数调用wait或waitpid()等待子进程结束,又没有显式忽略该信号,那么它就一直保持僵尸状态,子进程的尸体(task_struct)也就无法释放掉。

如果这时父进程结束了,那么init进程自动会接手这个子进程,为它收尸,它还是能被清除的。

但是如果如果父进程是一个循环,不会结束,那么子进程就会一直保持僵尸状态,这就是为什么系统中有时会有很多的僵尸进程。

当进程退出的时候,会将它的所有子进程都托管给别的进程(使之成为别的进程的子进程)。

托管的进程可能是退出进程所在进程组的下一个进程(如果存在的话),或者是1号进程。

所以每个进程、每时每刻都有父进程存在。除非它是1号进程。1号进程,pid为1的进程,又称init进程。

Linux系统启动后,之一个被创建的用户态进程就是init进程。它有两项使命:

1、执行系统初始化脚本,创建一系列的进程(它们都是init进程的子孙);

2、在一个死循环中等待其子进程的退出事件,并调用waitid系统调用来完成“收尸”工作;

init进程不会被暂停、也不会被杀死(这是由内核来保证的)。它在等待子进程退出的过程中处于task_interruptible状态,“收尸”过程中则处于task_running状态。

关于linux top命令参数的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。


数据运维技术 » Linux Top命令参数解析,提高系统管理效率 (linux top命令参数)