一个系统中的进程与其他进程共享CPU和主存资源的。

为了更加有效地管理内存并且少出错,现代系统提供了一种对主存的抽象概念,叫做虚拟内存VM

虚拟内存是硬件异常,硬件地址,主存,磁盘文件和内核软件的完美交互,它为每个进程提供了一个大的,一致的和私有的地址空间。

虚拟内存提供了三个重要的能力:

  1. 它将主存看成是一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据,通过这种方式,它高效地使用了主存。
  2. 它为每个进程提供了一致的地址空间,从而简化了内存管理。
  3. 它保护了每个进程的地址空间不被其他进程破坏。

物理和虚拟寻址

  • 计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组。每字节都有一个唯一的物理地址(Physical Address, PA)。
  • CPU访问内存最自然的方式就是使用物理地址。我们把这种方式称为物理寻址
  • 该示例的上下文是一条加载指令,它读取从物理地址4处开始的4字节字,CPU会将他存放在一个寄存器中。
  • 现在处理器使用的是一种称为虚拟寻址的寻址形式:
  • 使用虚拟寻址,CPU通过生成一个虚拟地址(Virtual Address, VA)来访问主存,这个虚拟地址在被送到内存之前先转换成合适的物理地址。
  • 将一个虚拟地址转换为物理地址的任务叫做地址翻译。就像异常处理一样,地址翻译需要CPU硬件和操作系统之间的紧密合作。
  • CPU芯片上叫做内存管理单元(Memory Management Unit,MMU)的专用硬件,利用存放在主存中的查询表来动态翻译虚拟地址,该表的内容由操作系统管理。

地址空间

  • 地址空间是一个非负整数地址的有序集合: $ {0,1,2,…} $
  • 如果地址空间中的整数是连续的,那么我们说它是一个线性地址空间。
  • 在一个带虚拟内存的系统中,CPU从一个由$N=2^n$个地址的地址空间中生成虚拟地址,这个地址空间称为虚拟地址空间:$ {0,1,2,…,N-1} $
  • 一个地址空间的大小是由标识最大地址所需要的位数来描述的。现代系统通常支持64位地址空间。
  • 一个系统还有一个物理地址空间,对应于系统中物理内存的M个字节:$ {0,1,2,…,M-1} $

虚拟内存作为缓存的工具

  • 概念上而言,虚拟内存被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。
  • 每字节都有一个唯一的虚拟地址,作为数组的索引。
  • 磁盘上数组的内容被缓存在主存中。
  • 和存储器层次结构中其他缓存一样,磁盘上的数据被分割成块,这些块作为磁盘和主存之间的传输单元。VM系统通过将虚拟内存分割为称为虚拟页(Virtual Page,VP)的大小固定的块来处理这个问题。每个虚拟页的大小为$P=2^p$字节
  • 物理内存也被分割为物理页(Physical Page, PP),大小也为P字节。
  • 在任意时刻,虚拟页面的集合都分为三个不相交的子集:
    • 未分配的: VM系统还未分配的页。未分配的块没有任何数据和它们相关联,因此也就不占用任何磁盘空间。
    • 缓存的: 当前已缓存在物理内存中的已分配页。
    • 未缓存的: 未缓存在物理内存中的已分配页。

DRAM缓存的组织结构

页表

  • 同任何缓存一样,虚拟内存系统必须有某种方法来判定一个虚拟页是否缓存在DRAM的某个地方。如果是,系统还必须确定这个虚拟页存放在那个物理页中。如果不命中,系统必须判断这个虚拟页存放在磁盘的那个位置,在物理内存中选择一个牺牲页,并将虚拟页从此盘复制到DRAM中,替换这个牺牲页。
  • 这些功能时由软硬件联合提供的,包括操作系统软件,MMU中地址翻译硬件和一个 存放在物理内存中叫做页表的数据结构,页表将虚拟页映射到物理页。每次地址翻译硬件将一个虚拟地址转换为物理地址时,都会读取页表。操作系统负责维护页表的内容,以及在磁盘与DRAM之间来回传送页。
  • 有效位表明了该虚拟页当前是否被缓存在DRAM中。如果设置了有效位,那么地址字段就表示DRAM中相应的物理页的起始地址。如果没有设置有效位,那么一个空地址表示这个虚拟页还未被分配。否则,这个地址就指向该虚拟页在磁盘上的起始位置。
  • 图中,VP0和VP5是未分配的虚拟页,VP1,VP2,VP4和VP7是已缓存的,VP3和VP6是未缓存的。

页命中

  • 当CPU想要读取包含在VP2中的虚拟内存中的一个字时会发生什么,VP2被缓存在DRAM中。地址翻译硬件将虚拟地址作为一个索引来定位PTE2,并存内存中读取它。因为设置了有效位,那么地址翻译硬件就知道VP2是缓存在内存中的了。所以它使用PTE中的物理内存地址,构造处这个字的物理地址。

缺页

  • 在虚拟内存的习惯说法中,DRAM缓存不命中称为缺页。
  • CPU引用了VP3中的一个字,VP3并未缓存在DRAM中。地址翻译硬件从内存中读取PTE3,从有效位判断处VP3未被缓存,并且触发了一个缺页异常。缺页异常调用内核中的缺页异常处理程序,该程序会选择一个牺牲页VP4,接下来,内核从磁盘复制VP3到内存中的PP3,更新PTE3,随后返回。当异常处理程序返回时,它会重新启动导致缺页的指令,该指令会把导致缺页的虚拟地址重发到地址翻译硬件。

分配页面

  • 当调用malloc时,就是在磁盘上创建空间并更新页表,使页表地址指向磁盘上创建的页面。

又是局部性救了我们

  • 尽管在整个运行过程中引用的不同页面的总数可能超出物理内存的大小,但是局部性原则保证了在任意时刻,程序将趋向于在一个较小的活动页面集合上工作,这个集合叫做工作集。在初始开销,也就是将工作集页面调度到内存中之后,接下来对这个工作集的引用将导致命中,而不会产生额外的磁盘流量。

虚拟内存作为内存管理的工具

  • 实际上,操作系统为每个进程提供了一个独立的页表,因而就是一个独立的虚拟地址空间。
  • 多个虚拟页面可以映射到同一个共享物理页面上。
  • 操作系统将不同进程中适当的虚拟页面映射到相同的物理页面,从而安排多个进程共享这部分代码的一个副本,而不是在每个进程中都包括单独的内核和C标准库的副本。

虚拟内存作为内存保护的工具

  • 任何现代计算机系统必须为操作系统提供手段来控制对内存系统的访问。
  • 不应该允许一个用户进程修改它的只读代码段。而且也不应该允许它读或修改内核中的代码和数据结构。不应该允许它读或者写其他进程的私有内存,并且不允许它修改任何与其他进程共享的虚拟页面,除非所有的共享者都显式地允许它这么做。
  • 提供独立的地址空间使得区分不同进程的私有内存变得容易。
  • 地址翻译机制可以以一种自然的方式扩展到提供更好的访问控制。因为每次CPU生成一个地址时,地址翻译硬件都会读一个PTE,,所以通过在PTE上添加一些额外的许可位来控制对一个虚拟页面内容访问十分简单。
  • SUP位表示进程是否必须运行在内核模式下才能访问该页。运行在内核模式中的进程可以访问任何页面,但是运行在用户在用户模式下的进程只允许访问SUP为0的页面。
  • READ位和WRITE位控制对页面的读写访问。
  • 如果一个指令违反了这些许可条件,那么CPU就会触发一个一般保护故障,将控制传递给一个内核中的异常处理程序。Linux shell一般把这种异常报告位“段错误(segmentation fault)”。

地址翻译

内存映射

  • Linux通过将一个虚拟内存区域与一个磁盘上的对象关联起来,以初始化这个虚拟内存区域的内容,这个过程称为内存映射。
  • 虚拟内存区域可以映射到两种类型的对象中的一种:
    • Linux文件系统中的普通文件。
    • 匿名文件。

再看共享对象

  • 如果虚拟内存系统可以集成到传统的文件系统中,那么就能提供一种简单而高效的把程序和数据加载到内存中的方法。
  • 一个对象可以被映射到虚拟内存的一个区域,要么作为共享对象,要么作为私有对象。
  • 如果一个进程将一个共享对象映射到它的虚拟地址空间的一个区域内,那么这个进程对这个区域的任何写操作,对于那些把这个共享对象映射到它们虚拟地址的其他进程而言,也是可见的。而且,这些变化也会反映到磁盘上的原始对象中。
  • 另一方面。对于一个映射到私有对象的区域做的改变,对其他进程来说是不可见的。
  • 一个映射到共享对象的虚拟内存区域叫做共享区域。
  • 即使对象被映射到了多个共享区域,物理内存中也只需要存放共享对象的一个副本。
  • 私有对象使用一种叫做写时复制的技术被映射到虚拟内存中。
  • 一个私有对象开始生命周期的方式基本上与共享对象一样,在物理内存中只保存有私有对象的一份副本。
  • 对于每个映射私有对象的进程,相应私有区域的页表条目都被标记为只读,并且区域结构被标记为私有的写时复制。只要没有进程试图写它自己的私有区域,它们就可以继续共享物理内存中对象的一个副本。
  • 只要有一个进程试图写私有区域的某个页面,那么这个写操作就会触发一个保护故障。
  • 当故障处理程序注意到保护异常是由进程试图写私有的写时复制区域中的一个页面而引起的,他就会在物理内存中创建这个页面的一个新副本,更新页表条目指向这个新的副本,然会恢复这个页面的可写权限。

再看fork函数

  • fork函数被当前进程调用时,内核为新进程创建各种数据结构,被分配给它一个唯一的PID。为了给这个新进程创建虚拟内存,它创建了当前进程的mm_struct,区域结构和页表的原始样本。它将两个进程中的每个页面都标记为只读,并将两个进程中的每个区域结构都标记为私有的写时复制。
  • fork在新进程中返回时,新进程现在的虚拟内存刚好和调用fork时存在的虚拟内存相同。当这两个进程中的任一个后来进行写操作时,写时复制机制就会创建新页面,因此,也就为每个进程保持了私有地址空间的抽象概念。

使用mmap函数的用户级内存映射

  • Linux进程可以使用mmap函数来创建新的虚拟内存区域,并将对象映射到这些区域中。
      #include <unistd.h>
      #include <sys/mman.h>
      void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset);
      //返回:若成功时则指向映射区域的指针
    
  • mmap函数要求内核创建一个新的虚拟内存区域,最好是从地址start开始的一个区域,并将文件描述符fd指定的对象的一个连续的片映射到这个新的区域。连续的对象片的大小为length字节,从据文件开始处偏移量为offset字节的地方开始。start地址仅仅是一个暗示,通常被定义为NULL。
  • 参数prot包含描述新映射的虚拟内存区域的访问权限位:
    • PROT_EXEC: 可执行
    • PROT_READ: 可读
    • PROT_WRITE: 可写
    • PROT_NONE: 这个区域内的页面不能被访问。
  • 参数flags由描述被映射对象类型的位组成。如果设置了MAP_ANON,那么被映射的对象就是一个匿名对象,而相应的虚拟页面是请求二进制零的。MAP_PRIVATE表示被映射的对象是一个私有的,写时复制的独享,MAP_SHARED表示是一个共享对象。
  • munmap函数删除虚拟内存区域
      #include <unistd.h>
      #include <sys/mman.h>
      int munmap(void *start, size_t length);
    
  • munmap函数删除从虚拟地址start开始的,由接下来length字节组成的区域。
      #include <unistd.h>
      #include <sys/mman.h>
      #include <sys/types.h>
      #include <sys/stat.h>
      #include <fcntl.h>
    
      int main(){
          struct stat stat;
          int fd=open("test",O_RDONLY);
          if (fd!=0 )
          {
              fstat(fd,&stat);
              void* bufP=mmap(NULL,stat.st_size,PROT_READ,MAP_PRIVATE,fd,0);
              write(1,bufP,stat.st_size);
          }
          return 0;
      }