在本文中,我们将解释关键的Linux系统管理任务之一 – 性能监控,涉及系统/CPU负载和负载平均值。
在我们进一步讨论之前,让我们了解所有类Unix系统中这两个重要短语:
- 系统负载/CPU负载 – 是Linux系统中CPU过度或未充分利用的衡量;正在由CPU执行或处于等待状态的进程数量。
- 负载平均值 – 是在给定时间段内计算的平均系统负载,包括1、5和15分钟。
在Linux中,负载平均值在技术上被认为是内核执行队列中正在运行或不可中断的进程的运行平均值。
请注意:
- 所有或大多数由Linux或其他类Unix系统驱动的系统可能会在某个地方显示负载平均值。
- A downright idle Linux system may have a load average of zero, excluding the idle process.
- 几乎所有类Unix系统仅计算运行或等待状态的进程。但Linux不是这种情况,它包括处于不可中断睡眠状态的进程;那些正在等待其他系统资源如磁盘I/O等。
如何监控Linux系统负载平均值
有许多监控系统负载平均值的方法,包括显示系统运行时间的uptime,用户数量以及负载平均值:
$ uptime 07:13:53 up 8 days, 19 min, 1 user, load average: 1.98, 2.15, 2.21
这些数字从左到右读取,上面的输出意味着:
- 过去1分钟的负载平均值为1.98
- 过去5分钟的平均负载为2.15
- 过去15分钟的平均负载为2.21
高负载平均值意味着系统超载;许多进程正在等待CPU时间。
我们将在下一部分中揭示这一点,与CPU核心数量有关。此外,我们还可以使用其他众所周知的工具,如top和glances,它们显示运行中Linux系统的实时状态,以及许多其他工具:
Top命令
$ top
top - 12:51:42 up 2:11, 1 user, load average: 1.22, 1.12, 1.26 Tasks: 243 total, 1 running, 242 sleeping, 0 stopped, 0 zombie %Cpu(s): 17.4 us, 2.9 sy, 0.3 ni, 74.8 id, 4.6 wa, 0.0 hi, 0.0 si, 0.0 st KiB Mem : 8069036 total, 388060 free, 4381184 used, 3299792 buff/cache KiB Swap: 3906556 total, 3901876 free, 4680 used. 2807464 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 6265 tecmint 20 0 1244348 170680 83616 S 13.3 2.1 6:47.72 Headset 2301 tecmint 9 -11 640332 13344 9932 S 6.7 0.2 2:18.96 pulseaudio 2459 tecmint 20 0 1707692 315628 62992 S 6.7 3.9 6:55.45 cinnamon 2957 tecmint 20 0 2644644 1.035g 137968 S 6.7 13.5 50:11.13 firefox 3208 tecmint 20 0 507060 52136 33152 S 6.7 0.6 0:04.34 gnome-terminal- 3272 tecmint 20 0 1521380 391324 178348 S 6.7 4.8 6:21.01 chrome 6220 tecmint 20 0 1595392 106964 76836 S 6.7 1.3 3:31.94 Headset 1 root 20 0 120056 6204 3964 S 0.0 0.1 0:01.83 systemd 2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd 3 root 20 0 0 0 0 S 0.0 0.0 0:00.10 ksoftirqd/0 5 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H ....
Glances工具
$ glances
TecMint (LinuxMint 18 64bit / Linux 4.4.0-21-generic) Uptime: 2:16:06 CPU 16.4% nice: 0.1% LOAD 4-core MEM 60.5% active: 4.90G SWAP 0.1% user: 10.2% irq: 0.0% 1 min: 1.20 total: 7.70G inactive: 2.07G total: 3.73G system: 3.4% iowait: 2.7% 5 min: 1.16 used: 4.66G buffers: 242M used: 4.57M idle: 83.6% steal: 0.0% 15 min: 1.24 free: 3.04G cached: 2.58G free: 3.72G NETWORK Rx/s Tx/s TASKS 253 (883 thr), 1 run, 252 slp, 0 oth sorted automatically by cpu_percent, flat view enp1s0 525Kb 31Kb lo 2Kb 2Kb CPU% MEM% VIRT RES PID USER NI S TIME+ IOR/s IOW/s Command wlp2s0 0b 0b 14.6 13.3 2.53G 1.03G 2957 tecmint 0 S 51:49.10 0 40K /usr/lib/firefox/firefox 7.4 2.2 1.16G 176M 6265 tecmint 0 S 7:08.18 0 0 /usr/lib/Headset/Headset --type=renderer --no-sandbox --primordial-pipe-token=879B36514C6BEDB183D3E4142774D1DF --lan DISK I/O R/s W/s 4.9 3.9 1.63G 310M 2459 tecmint 0 R 7:12.18 0 0 cinnamon --replace ram0 0 0 4.2 0.2 625M 13.0M 2301 tecmint -11 S 2:29.72 0 0 /usr/bin/pulseaudio --start --log-target=syslog ram1 0 0 4.2 1.3 1.52G 105M 6220 tecmint 0 S 3:42.64 0 0 /usr/lib/Headset/Headset ram10 0 0 2.9 0.8 409M 66.7M 6240 tecmint 0 S 2:40.44 0 0 /usr/lib/Headset/Headset --type=gpu-process --no-sandbox --supports-dual-gpus=false --gpu-driver-bug-workarounds=7,2 ram11 0 0 2.9 1.8 531M 142M 1690 root 0 S 6:03.79 0 0 /usr/lib/xorg/Xorg :0 -audit 0 -auth /var/lib/mdm/:0.Xauth -nolisten tcp vt8 ram12 0 0 2.6 0.3 79.3M 23.8M 9651 tecmint 0 R 0:00.71 0 0 /usr/bin/python3 /usr/bin/glances ram13 0 0 1.6 4.8 1.45G 382M 3272 tecmint 0 S 6:25.30 0 4K /opt/google/chrome/chrome ...
这些工具显示的负载平均值是从/proc/loadavg文件中读取的,您可以使用如下的cat命令查看:
$ cat /proc/loadavg 2.48 1.69 1.42 5/889 10570
要以图形格式监视负载平均值,请查看:ttyload – 在终端中显示Linux负载平均值的彩色图形
在桌面机器上,有图形用户界面工具可用于查看系统负载平均值。
了解系统平均负载与CPU数量的关系
我们无法在不涉及CPU核心数量对性能的影响的情况下解释系统负载或系统性能。
多处理器与多核
- 多处理器 – 是指将两个或更多物理CPU集成到单个计算机系统中。
- 多核处理器 – 是指至少有两个或更多个独立核心(或我们也可以称之为处理单元)的单个物理CPU,这些核心可以并行工作。这意味着双核有2个处理单元,四核有4个处理单元,依此类推。
此外,还有一种处理器技术,由英特尔首次引入以改进并行计算,称为超线程。
在超线程下,单个物理CPU核心对操作系统显示为两个逻辑CPU核心(但实际上只有一个物理硬件组件)。
请注意,单个CPU核心一次只能执行一个任务,因此诸如多个CPU/处理器、多核CPU和超线程等技术应运而生。
有多个CPU时,可以同时执行多个程序。现今的英特尔CPU使用多核和超线程技术的组合。
要查找系统上可用的处理单元数量,我们可以使用nproc或lscpu命令如下:
$ nproc 4 OR lscpu
使用grep命令另一种找到处理单元数量的方法。
$ grep 'model name' /proc/cpuinfo | wc -l 4
现在,为了进一步了解系统负载,我们将做一些假设。假设我们的负载平均值如下:
23:16:49 up 10:49, 5 user, load average: 1.00, 0.40, 3.35
在单核系统上,这意味着:
- 平均情况下,CPU利用率达到100%;CPU上有1个进程在运行(1.00),在过去的1分钟内。
- 平均情况下,CPU空闲60%;没有进程在等待CPU时间(0.40),在过去的5分钟内。
- 平均情况下,CPU超负荷235%;有2.35个进程在等待CPU时间(3.35),在过去的15分钟内。
在双核系统上,这意味着:
- 一个CPU平均空闲100%,一个CPU正在使用;没有进程在等待CPU时间(1.00),在过去的1分钟内。
- 平均情况下,CPU空闲160%;没有进程在等待CPU时间(0.40),在过去的5分钟内。
- 平均情况下,CPU超负荷135%;有1.35个进程在等待CPU时间(3.35),在过去的15分钟内。
您可能还喜欢:
总之,如果您是系统管理员,那么高负载平均值确实值得关注。当它们高于 CPU 核心数时,表示对 CPU 的需求很高,而低负载平均值低于 CPU 核心数则表明 CPU 利用率不高。
Source:
https://www.tecmint.com/understand-linux-load-averages-and-monitor-performance/