Linux 内核给每个进程都提供了一个独立的虚拟地址空间,并且这个地址空间是连续的。这样进程就可以很方便地访问内存,更确切地说是访问虚拟内存。
1、什么是虚拟内存假设某个进程需要100MB的空间,而内存假设是16MB的,如果进程直接使用物理地址,就会因为内存不足而无法运行。
既然进程不是直接访问物理内存,那么进程中涉及的内存地址当然也不是物理内存地址。而是虚拟的内存地址,虚拟的内存地址和物理的内存地址之间保持一种映射关系,这种关系由内存管理单元(MMU)进行管理。
内存管理单元(Memory Management Unit,MMU),将物理内存分割成多个pages,MMU管理进程的虚拟地址空间中的page和物理内存中的page之间的映射关系。、
因为是映射,所以随时都可能发生变化,例如某个进程虚拟内存空间中的page1,在不同的时间点,可能出现在物理内存中的不同位置(当发生了页交换时)。
2、什么是 page fault
虚拟地址空间的内部又被分为内核空间和用户空间两部分。并不是所有的虚拟内存都会分配物理内存,只有那些实际使用的虚拟内存才分配物理内存,并且分配后的物理内存,是通过内存映射来管理的。
当进程访问它的虚拟地址空间中的page时,如果这个page目前还不在物理内存中,此时CPU是不能工作的,Linux会产生一个hard page fault中断。系统需要从慢速设备(如磁盘)将对应的数据page读入物理内存,并建立物理内存地址与虚拟地址空间page的映射关系。然后进程才能访问这部分虚拟地址空间的内存。
page fault 又分为三种:minor page fault、major page fault、invalid(segment fault)。
2.1、minor page fault也称为 soft page fault,指需要访问的内存不在虚拟地址空间,但是在物理内存中,需要MMU建立物理内存和虚拟地址空间的映射关系。
当一个进程在调用 malloc 获取虚拟空间地址后,首次访问该地址会发生一次soft page fault。
通常是多个进程访问同一个共享内存中的数据,当某些进程还没有建立起映射关系,访问时也会出现soft page fault。
2.2、major page fault
也称为 hard page fault,指需要访问的内存不在虚拟地址空间,也不在物理内存中,需要从慢速设备载入。
从磁盘 swap in 回到物理内存就是 hard page fault。
- swap out:当物理内存不够时,把一些物理内存 page 中的内容写入到磁盘,以腾出一些空闲的 page;
- swap in:当CPU要执行的指令被发现已经 swap out 到了磁盘中, 这时就需要从磁盘把这些指令再 swap in 到物理内存中。
注意:swap in 和 swap out 的操作都是比较耗时的。
2.3、invalid(segment fault)也称为 segment fault,指进程需要访问的内存地址不在它的虚拟地址空间范围内,属于越界访问,内核就会报 segment fault 错误。
造成 segment fault 的原因可能有以下几种:
- 堆栈溢出;
- 内存访问越界,如数组下表错误访问越界;使用strcpy/strcat/sprintf/strcmp 等字符串操作函数导致的读写越界,应尽量使用strncpy/strncat/snprintf/strncmp 等函数;
- 非法指针:野指针,错误的指针转换等;
- 多线程读写的数据未加锁保护,或使用了线程不安全的函数。
,