无论我们从事的是测试工作、开发工作或者运维工作,当性能测试或线上出现性能问题时,相信很多人都会用到的一个命令就是top,通过top首先关注的就是CPU指标,接下来Linux篇我们就先从CPU开始,下面我们就来说一说关于linux性能优化之从cpu开始?我们一起去了解并探讨一下这个问题吧!
linux性能优化之从cpu开始
无论我们从事的是测试工作、开发工作或者运维工作,当性能测试或线上出现性能问题时,相信很多人都会用到的一个命令就是top,通过top首先关注的就是CPU指标,接下来Linux篇我们就先从CPU开始。
在讲解CPU使用率、CPU负载、上下文切换等CPU知识之前,我们先问自己一个问题:CPU的单位是什么?
相信很多人都有点模糊,有人说了,单位肯定是“个”啊,单核CPU、多核CPU,那我们常听到的CPU多少赫兹(HZ)又是啥呢?对CPU资源做过限制的同学可能又看到过:CPU限制500m,这个m又是什么呢?
带着这几个问题,下面我们一点点寻找答案。
首先,我们必须要有一个基本的共识,那就是在任意一个时刻,一个CPU只能处理一个“任务”。这个“任务”是什么呢?我们在学校上课时可能听到过这么一句话,线程是CPU调度的基本单位,那么在这里提到的“任务”就是一个线程。此处我们假设一个任务就包括了一个线程,比如这个任务是看电影、搜索网页、微信聊天。如果我的电脑只有一个CPU,也就是单核CPU,按照一个CPU只能处理一个任务的逻辑,那我只能做一件事,要么看电影,要么聊天,看完电影后才能聊微信。这样肯定是不行的,也不符合我们玩电脑的常识,显然我们看电影的同时也是可以聊天的,那么CPU是怎么做到的呢?
这就引出了时间分片概念,其实所谓的CPU调度,也就是拥有时间分片。内核在微观上,会把CPU的运行时间分成许多份,然后为每个线程分配时间额度,安排给各个线程轮流运行,如果当前线程的时间额度用完了,就会被强制停止(不考虑优先级等机制的情况下),切换其他线程执行。这就造成宏观上所有的任务(线程)仿佛同时在执行的错觉。
在Linux的内核处理过程中,每一个进程默认会有一个固定的时间片来执行命令,这段时间内进程被分配到CPU,然后独占使用。如果使用完,同时未到时间片的规定时间,那么就主动放弃CPU的占用,如果到时间片用完尚未完成工作,那么CPU的使用权也会被收回,进程将会被中断挂起等待下一个时间片。
时间片的长短对系统性能是很关键的:它既不能太长也不能太短。
如果平均时间片太短,由进程切换引起的系统额外开销就变得非常高。例如,假定进程切换需要5ms,如果时间片也设置5ms,那么cpu至少把50%的时间花费在进程切换上。
如果平均分片太长,进程看起来就不再是并发执行。例如,让我们假定把时间片设置为5s,那么,每个可运行进程运行大约5s,但是暂停的时间更长(一般是5s乘以可运行进程的个数)。
对时间片大小的选择始终是一种折中。Linux采取单凭经验的方法,即选择尽可能长、同时能保持良好相应时间的一个分片。
——《深入理解Linux内核》
知道了时间分片的概念,我们接下来再看赫兹(HZ)。HZ是系统时钟在一秒内固定发出时钟中断的次数。HZ在编译内核前是可以进行配置的,因此通过下述命令就可以查看当前系统的时钟中断频率:
cat /boot/config-`uname -r` | grep CONFIG_HZ
CONFIG_HZ_PERIODIC=y
# CONFIG_HZ_100 is not set
# CONFIG_HZ_250 is not set
# CONFIG_HZ_300 is not set
CONFIG_HZ_1000=y
CONFIG_HZ=1000
从上面的展示可以看出,我开发机的时钟中断频率是1000HZ。时钟中断是操作系统最重要的中断,操作系统内核依靠时钟中断完成时间片计算和分配、定时等管理工作,是分时机制实现的基础,总之时钟中断主要处理和时间有关的所有信息,这些信息包括系统时间、进程的时间片、延时、使用CPU的时间、各种定时器等等。
和时钟中断紧密相连的一个概念就是tick,也叫“滴答”,tick是系统时钟每“滴答”一次的时间,其值为(1/HZ)秒。也就是连续两次时钟中断之间的时间间隔。
内核中有个全局变量jiffies,用来计算自系统启动以来tick的次数,也就是说系统时钟每产生一次时钟中断,该变量的值就增加一次。后面的文章我会讲到CPU使用率也是以tick为基础进行计算的。
cat /proc/sched_debug|grep jiffies
jiffies : 10490243173
最后一个问题,我们在很多资源限制的定义中经常见到CPU限制xxxm的描述,比如下面是kubernets使用中一个yaml文件定义一个资源的限制时的描述:
resources:
requests:
memory: "64Mi"
cpu: "250m"
limits:
memory: "128Mi"
cpu: "500m"
其实此处CPU 资源的单位是 millicores,即一个核的 1/1000,那500m就是0.5个core的意思。它等价于下面的描述
resources:
requests:
memory: "64Mi"
cpu: "0.25"
limits:
memory: "128Mi"
cpu: "0.5"
可能又有人问了,0.5个cpu是只使用半个cpu吗,答案是对也不对。对是因为确实是使用了半个cpu,不对是因为这个一半不是物理意义上的半个CPU,而是逻辑上的一半,也就是限制了程序只能使用一个CPU时间的一半时间片。
总结:通过以上概念的分析,从整体上你应该对cpu有了一个大概的认识。如果有人再问CPU的单位是什么,不能笼统的说是“个”或者“赫兹”,要结合问这个问题的场景进行回答。其实CPU的工作是一个特别复杂的过程,中断处理、工作队列、CPU竞争、进程调度等等,在内核中是一个很庞大的工程,但是只要能够理解即将讲解的内容就能应付工作中80%的问题,更深入的知识有机会会不断补充。
,