linux性能优化之从cpu开始（Linux篇:1CPU之基础知识）

无论我们从事的是测试工作、开发工作或者运维工作，当性能测试或线上出现性能问题时，相信很多人都会用到的一个命令就是top，通过top首先关注的就是CPU指标，接下来Linux篇我们就先从CPU开始，下面我们就来说一说关于linux性能优化之从cpu开始?我们一起去了解并探讨一下这个问题吧!

linux性能优化之从cpu开始

无论我们从事的是测试工作、开发工作或者运维工作，当性能测试或线上出现性能问题时，相信很多人都会用到的一个命令就是top，通过top首先关注的就是CPU指标，接下来Linux篇我们就先从CPU开始。

在讲解CPU使用率、CPU负载、上下文切换等CPU知识之前，我们先问自己一个问题：CPU的单位是什么？

相信很多人都有点模糊，有人说了，单位肯定是“个”啊，单核CPU、多核CPU，那我们常听到的CPU多少赫兹（HZ）又是啥呢？对CPU资源做过限制的同学可能又看到过：CPU限制500m，这个m又是什么呢？

带着这几个问题，下面我们一点点寻找答案。

首先，我们必须要有一个基本的共识，那就是在任意一个时刻，一个CPU只能处理一个“任务”。这个“任务”是什么呢？我们在学校上课时可能听到过这么一句话，线程是CPU调度的基本单位，那么在这里提到的“任务”就是一个线程。此处我们假设一个任务就包括了一个线程，比如这个任务是看电影、搜索网页、微信聊天。如果我的电脑只有一个CPU，也就是单核CPU，按照一个CPU只能处理一个任务的逻辑，那我只能做一件事，要么看电影，要么聊天，看完电影后才能聊微信。这样肯定是不行的，也不符合我们玩电脑的常识，显然我们看电影的同时也是可以聊天的，那么CPU是怎么做到的呢？

这就引出了时间分片概念，其实所谓的CPU调度，也就是拥有时间分片。内核在微观上，会把CPU的运行时间分成许多份，然后为每个线程分配时间额度，安排给各个线程轮流运行，如果当前线程的时间额度用完了，就会被强制停止（不考虑优先级等机制的情况下），切换其他线程执行。这就造成宏观上所有的任务（线程）仿佛同时在执行的错觉。

在Linux的内核处理过程中，每一个进程默认会有一个固定的时间片来执行命令，这段时间内进程被分配到CPU，然后独占使用。如果使用完，同时未到时间片的规定时间，那么就主动放弃CPU的占用，如果到时间片用完尚未完成工作，那么CPU的使用权也会被收回，进程将会被中断挂起等待下一个时间片。

时间片的长短对系统性能是很关键的：它既不能太长也不能太短。

如果平均时间片太短，由进程切换引起的系统额外开销就变得非常高。例如，假定进程切换需要5ms，如果时间片也设置5ms，那么cpu至少把50%的时间花费在进程切换上。

如果平均分片太长，进程看起来就不再是并发执行。例如，让我们假定把时间片设置为5s，那么，每个可运行进程运行大约5s，但是暂停的时间更长（一般是5s乘以可运行进程的个数）。

对时间片大小的选择始终是一种折中。Linux采取单凭经验的方法，即选择尽可能长、同时能保持良好相应时间的一个分片。

——《深入理解Linux内核》

知道了时间分片的概念，我们接下来再看赫兹（HZ）。HZ是系统时钟在一秒内固定发出时钟中断的次数。HZ在编译内核前是可以进行配置的，因此通过下述命令就可以查看当前系统的时钟中断频率：

cat /boot/config-`uname -r` | grep CONFIG_HZ

CONFIG_HZ_PERIODIC=y

# CONFIG_HZ_100 is not set

# CONFIG_HZ_250 is not set

# CONFIG_HZ_300 is not set

CONFIG_HZ_1000=y

CONFIG_HZ=1000

从上面的展示可以看出，我开发机的时钟中断频率是1000HZ。时钟中断是操作系统最重要的中断，操作系统内核依靠时钟中断完成时间片计算和分配、定时等管理工作，是分时机制实现的基础，总之时钟中断主要处理和时间有关的所有信息，这些信息包括系统时间、进程的时间片、延时、使用CPU的时间、各种定时器等等。

和时钟中断紧密相连的一个概念就是tick，也叫“滴答”，tick是系统时钟每“滴答”一次的时间，其值为(1/HZ)秒。也就是连续两次时钟中断之间的时间间隔。

内核中有个全局变量jiffies，用来计算自系统启动以来tick的次数，也就是说系统时钟每产生一次时钟中断，该变量的值就增加一次。后面的文章我会讲到CPU使用率也是以tick为基础进行计算的。

cat /proc/sched_debug|grep jiffies

jiffies : 10490243173

最后一个问题，我们在很多资源限制的定义中经常见到CPU限制xxxm的描述，比如下面是kubernets使用中一个yaml文件定义一个资源的限制时的描述：

resources:

requests:

memory: "64Mi"

cpu: "250m"

limits:

memory: "128Mi"

cpu: "500m"

其实此处CPU 资源的单位是 millicores，即一个核的 1/1000，那500m就是0.5个core的意思。它等价于下面的描述

resources:

requests:

memory: "64Mi"

cpu: "0.25"

limits:

memory: "128Mi"

cpu: "0.5"

可能又有人问了，0.5个cpu是只使用半个cpu吗，答案是对也不对。对是因为确实是使用了半个cpu，不对是因为这个一半不是物理意义上的半个CPU，而是逻辑上的一半，也就是限制了程序只能使用一个CPU时间的一半时间片。

总结：通过以上概念的分析，从整体上你应该对cpu有了一个大概的认识。如果有人再问CPU的单位是什么，不能笼统的说是“个”或者“赫兹”，要结合问这个问题的场景进行回答。其实CPU的工作是一个特别复杂的过程，中断处理、工作队列、CPU竞争、进程调度等等，在内核中是一个很庞大的工程，但是只要能够理解即将讲解的内容就能应付工作中80%的问题，更深入的知识有机会会不断补充。

linux性能优化之从cpu开始（Linux篇:1CPU之基础知识）

最新推荐

热门推荐