2026-03-14 OS-learn

Outline

ch1 概述
ch2 硬件环境
ch3 操作系统结构
ch4 进程基础
ch5 线程
ch6 CPU调度
ch7 进程同步
ch8 死锁
ch9 内存管理基础
ch10 虚拟内存管理
ch11 文件系统
ch12 设备管理
ch13 磁盘结构

按照课程大纲来看,只需要学到教材的第十三章就可以了

参考教材:操作系统概念(第九版)
事实上,看原文会很累,废话太多,真东西太少,而且比较混乱,我只好移步中文翻译,节省点时间

archive1

# ch1&&ch2
操作系统:运行在计算机上的程序(称为内核(kernel))

## 实时操作系统 (RTOS) 与 分时操作系统 (TSOS)

* **分时系统 (Time-Sharing):** 追求**资源利用率**与**公平性**。通过将 CPU 时间划分为极小的“时间片”，轮流分配给多个用户或任务，营造“独占计算机”的错觉。其关键指标是**平均响应时间**。
* **实时系统 (Real-Time):** 追求**确定性 (Determinism)** 与**可预测性**。任务必须在严格定义的截止时间内完成。其关键指标是**最坏情况下的响应延迟**。



# ch3:进程
进程:操作相关资源执行某一命令的活动实体

### 进程控制块(Process Control Block,PCB)
进程可以用PCB来表示,它包含许多与某个特定进程相关的信息:
- 进程状态: new,running,waiting,terminated
- 程序计数器(program counter,PC): 进程要执行的下个指令的地址
- 寄存器(CPU register)
- CPU调度信息
### 进程调度
#### 调度序列
进程在进入系统时,会被加入到一个作业队列(job queue)中.
最初,新进程会进入就绪队列(ready queue),直到被选中执行,之后可能发生以下事件:
- 进程创建了一个新的子进程,并等待子进程终止
- 进程由于中断被强制返回就绪队列
- 发出使用某个设备的请求,进入设备队列

#### 调度类型

* **高级调度 (High-Level Scheduling)**
  * 也称为**作业调度**或**宏观调度**。
  * **核心逻辑**：负责从后备队列中挑选作业进入内存，为其创建进程并分配必要的资源。
  * **时间尺度**：通常是**分钟、小时或天**。


* **中级调度 (Intermediate-Level Scheduling)**
  * 涉及进程在**内、外存间的交换**（Swapping）。
  * **资源管理维度**：从存储器资源管理的角度来看，把进程部分或全部**换出到外存**上，可为当前运行进程的执行提供所需内存空间；反之，将当前进程所需部分**换入到内存**。
  * **物理约束**：指令和数据必须在内存里才能被处理机直接访问。


* **低级调度 (Low-Level Scheduling)**
  * 也称**微观调度**或**进程调度**。
  * **资源分配维度**：从处理机资源分配角度来看，处理机需要经常选择**就绪进程或线程**进入运行状态。
  * **时间尺度**：通常是**毫秒级**的。
  * **实现要求**：由于低级调度算法使用频繁，要求在实现时做到**高效**。
### 进程运行
#### 进程创建
当进程创建新进程时,有两种情况:
1. 父进程和子进程并发执行
2. 父进程等待子进程执行完毕

新进程的地址空间有两种可能:
1. 子进程与父进程有同样的程序和数据
2. 子进程加载的是另一个新程序

#### 进程终止
>Process executes last statement and asks the operating system to delete it (exit).

Parent may terminate execution of children processes (abort).
-  Child has exceeded allocated resources.
-  Task assigned to child is no longer required.
-  Parent is exiting.
   -  Operating system does not allow child to continue if its parent terminates,which is called as **Cascading termination**.

- [chrome多线程架构](https://developer.chrome.com/blog/inside-browser-part1?hl=zh-cn)

### 进程间通信(InterProcess Communication,IPC)
与其他进程共享数据的进程为协作进程,协作进程需要有一种进程间通信的机制,允许进程之间交换数据,有两种基本模型:
1. 共享内存模型: 建立起一块供协作进程共享的内存区域.
2. 消息传递模型: 通过消息队列来处理. 

#### 共享内存模型
一种方法是通过一个缓冲区供producer存放信息和consumer提取信息,这里的producer和consumer是相对的,协作进程可以同时扮演这两个角色
#### 消息传递系统(待补充)

# ch4:线程
### 概述
线程:cpu使用的基本单元,包括线程ID,程序计数器,寄存器组和堆栈,与同一进程的其他线程共享代码段,数据段和其他操作系统资源.
- 如果一个进程有多个线程,那么就能同时执行多个任务

### 多核编程
对于单核系统,并发仅意味着线程随着时间推移交错执行,因为内核在某一时刻只能执行单个线程;但对于多核系统,并发可以让线程并行运行

#### 并行类型
**数据并行**: 将数据分布于多个核上,在每个核上执行相同操作
**任务并行**: 不同核上的每个线程都执行一个单独的操作,可以操作相同的,也可以操作不同的数据

### 多线程模型
用户层的用户线程需要内核层的内核线程来支持和管理,有三种常见的关系模型
#### 多对一模型
映射多个用户级线程到一个内核线程,显然这无法利用多核操作系统
#### 一对一模型
一个用户线程对应一个内核线程,唯一缺点是创建一个用户线程就要创 建一个相应的内核线程,会影响应用程序的性能,故需要限制某一时刻下可供使用的线程数量,Linux和Windows是采用这一模型的代表
#### 多对多模型
该模型可以将多个用户线程映射到多个内核线程中
### 线程库
线程库为程序员提供创建和管理线程的API,有两种方法实现线程库:
1. 在用户层实现一个无内核支持的库,手写寄存器调用之类的操作
2. 在内核层实现一个库,创建线程时会发生系统调用
# ch5:CPU如何调度进程
### 调度算法
#### 先到先服务(First Come First Served ,FCFS)
当一个进程进入准备队列时,会被链接到队列尾部.
**缺点**: 平均等待事件很长,一旦CPU分配给了一个进程,进程就会一直运行直到CPU释放,不适用于分时系统
#### 最短作业优先调度(Shortest Job First ,SJF)
当CPU空闲时,会分配给执行时间最短的进程.
**缺点**: 很难判断新进程的具体执行时间,只能通过估计来处理
可分为抢占的和非抢占的,对于抢占SJF算法来说,如果当前执行的进程所需剩余执行时间比新进程长,就会被抢占.
#### 优先级调度(priority scheduling)
通过对进程标识优先级,保证优先级最高的进程先执行,同样可以分为抢占的和非抢占的.
**缺点**: 无穷阻塞,即低优先级进程可能永远无法执行,解决方法是老化(aging),即根据等待时间提高等待进程的优先级
#### 轮转调度(Round Robin,RR)
这个算法是专门为分时系统设计的,结合了FCFS调度和抢占的概念:
将一个较小时间单元(如10-100ms)定义为时间片,CPU调度程序为每个进程分配不超过一个时间片的占用时间,当一个进程占用时间超过一个时间片时,将会被抢占,并被加到队列尾部.

关键在于要根据进程切换的时间花费来设计时间片大小,从而保证进程切换不会过度拖延平均的进程运行时间.
#### 多级队列调度(multilevel queue)
根据进程的类型,大小,将准备队列分成具有优先级别划分的多个单独队列,每个队列使用独特的调度算法.
#### 多级反馈队列调度(multilevel feedback queue)
在多级队列调度中,进程进入系统时会被永久分配到某个队列.
但现在讨论的反馈队列调度算法允许进程在队列之间迁移,将等待过长的进程放入高优先级队列,将用时过长的进程放入低优先级队列.
- 是最通用,但也是最复杂的算法

### 线程调度(待补充)

### 多处理器调度
当操作系统有多个核即有多个CPU时,进程的调度会变得更加复杂,有两种方法,一种是让一个处理器负责处理所有的调度决定,I/O处理核其他系统活动,而其他的处理器只执行用户代码.这被称为**非对称多处理**.因为只有一个处理器能够访问系统数据,减少了数据共享的负担.
另一种方法是使用对称多处理(Symmetric MultiProcessing,SMP),每个处理器自我调度,可以使用一个共享的准备队列,也可以每个处理器单独使用一个准备队列.
几乎所有的现代操作系统都采用这一方案.

#### 处理器亲和性(processor affinity)
由于将一个进程从一个处理器转移到另一个处理器需要在处理器之间迁移缓存,代价过高,因此需要让一个进程一直运行在同一个处理器上,这被称为**处理器亲和性**.

#### 负载平衡(load balance)
对于共享队列的多处理器操作系统,由于处理器需要一直从队列中取得最新的进程,故没有处理器会保持空闲.
但对于具有单独准备队列的多处理器操作系统,需要决定每个处理器的负载分配,避免有处理器的负载太高或者太低.
有两种方法:
1. 推迁移(push migration): 超载处理器将进程push到空闲处理器
2. 拉迁移(pull migration): 空闲处理器从超载处理器pull进程.

这两种方法经常被同时使用,但因为发生了进程在处理器之间的迁移,会抵消**处理器亲和性**带来的好处.

#### 多核处理器
在多核处理器中应用多线程有两种方法:
1. 粗粒度(coarse-grained): 线程一直在处理器上执行,直到突然遇到长时间的中断(这里的中断仅仅是指处理器停止运行,而非通常意义的主动性中断),这时处理器会切换执行另一个线程.
2. 细粒度(fine-grained): 通过精细化线程的运行逻辑,减小线程的切换成本

### 实时操作系统的CPU调度(过)




# ch6:同步
### 临界区问题
假设某个系统有n个进程,每个进程有一段代码,称为**临界区**(critical section).当一个进程在临界区执行时,其他进程不允许在各自的临界区内执行,因为这个正在执行的进程有可能正在修改公共资源,不能被打扰.
临界区问题的具体情景如下:
在进入临界区前,每个进程需要进行访问申请,实现访问申请的代码段称为**进入区**;在临界区执行完后有**退出区**,其他代码为**剩余区**.
因此,我们需要实现以下三个要求:
1. 互斥: 保证某一时刻只有一个进程能够在临界区执行
2. 提升: 如果没有进程在临界区执行,那么只有不处于剩余区的进程可以选择是否进入临界区.
3. 有限等待: 如果有一个进程位于进入区,那么其他进程允许进入临界区的次数有一个上限值,从而保证该进程可以进入临界区


### 基于软件的临界区问题解决方案: Peterson
不妨假设有两个交替运行的进程P0和P1,这两个进程共享以下数据项:

```java
int turn;
boolean flag[2];
//turn表示允许让哪个进程进入临界区,flag表示哪个进程位于进入区.

archive2

那么,只有当turn为i且flag[i]=1的时候这个进程才能真正执行.
现在我们需要证明这个解决方案是有效的,即证明前文提及的三点.
1. 当flag[0]和flag[1]都为1时,由于turn只能有一个值,故只有一个进程可以在临界区执行
2. 当进程P0在临界区执行完毕后,它进入退出区,并切换turn为1.此时flag[0]==0,而如果P1在进入区的话,那么flag[1]==1,而turn为1,故P1进入临界区执行,执行完后再将turn置为0.从而实现循环运行.

### 基于硬件的解决方案(待补充)

### 

# ch7:死锁(deadlock)(3/22)
- 从这里开始使用中英文版交杂的形式

当某个进程申请资源时,若该资源当前不可用,则进程进入等待队列,但如果这个资源一直被其他进程占有,这个进程将一直位于待定状态,这被称为**死锁**.
### System Model
进程使用资源的全过程:
1. 申请: 进程请求资源,如果资源暂时无法获取,那么进入等待队列
2. 使用: 进程使用资源
3. 释放: 进程释放资源

- 那么很显然的是,只有我们能够保证进程在使用后会释放资源,就不会出现死锁问题,除非新进程不停的大量出现

### 死锁出现的必要条件
1. 互斥: 某个资源同时刻只能被一个进程使用
2. 占有和等待: 一个进程应占有至少一个资源,并等待另一个被其他进程占有的资源
3. 不允许抢占: 资源只能在进程完成任务后自动释放
4. 循环队列: A set {P 0 , P 1 , ..., P n } of waiting processes must exist such that P 0 is waiting for a resource held by P 1 , P 1 is waiting for a resource held by P 2 , ..., P n−1 is waiting for a resource held by P n , and P n is waiting for a resource held by P 0 .

只有着四种条件都满足时才会出现死锁,这显然是一个非常极端的情况
#### Resource-Allocation Graph(过)
光画图的话我想考试不会考的
### Methods for Handling Deadlocks(处理死锁问题)
Generally speaking, we can deal with the deadlock problem in one of three ways:
• We can use a protocol to prevent or avoid deadlocks, ensuring that the system will never enter a deadlocked state.
• We can allow the system to enter a deadlocked state, detect it, and recover.
• We can ignore the problem altogether and pretend that deadlocks never occur in the system.
由于大多数操作系统采用第三种方式也就是忽视死锁问题,因此开发应用程序时需要开发人员自己来处理死锁问题,有三种常见的操作:
1. 死锁预防(deadlock prevention): 确保死锁发生的必要条件不全部成立
2. 死锁避免(deadlock avoidance): 为操作系统提供相关进程信息来合理调度资源
3. 死锁恢复: 检测是否发生了死锁和如何从死锁中恢复

### Deadlock Prevention
我们通过讨论发生死锁的4个条件来谈谈如何预防死锁:
1. **互斥**: 使用可共享的资源,如只读文件等
2. **持有并等待**: 当进程申请一个资源时,它不能占有其他资源,我们有两种方法:
   1. 进程需要在执行前申请所需的所有资源
   2. 进程仅在没有资源时才可以申请资源,或者在申请更多资源之前需要释放占用的资源
   3. 但这两种方法会导致资源利用率低,某个进程进入**饥饿**状态等问题
3. 无抢占: 如果一个进程申请一个被占用的资源时,他目前占用的资源都可以被抢占
4. 循环等待: 对所有的资源类型进行排序,确保每个进程按顺序申请资源

#### 循环等待的解决方法详解

### Deadlock Avoidance
####  Safe State
>A state is safe if the system can allocate resources to each process (up to its maximum) in some order and still avoid a deadlock. More formally, a system is in a **safe state** only if there exists a **safe sequence**. 
#### Banker’s Algorithm

### Deadlock Detection
### Recovery from Deadlock
可以使用两种方法:
1. 进程终止: 可以终止所有死锁进程或者一次终止一个进程直到消除死锁
2. 资源抢占: 抢占死锁进程占用的资源直到消除死锁
# ch8: Main Memory
本章主要讨论内存管理的各种方法
## Background
### Basic Hardware
CPU可以直接访问的存储器是内存和寄存器,但由于内存的执行时间一般超过一个时钟周期,故需要在CPU和内存之间增加一个高速缓存(cache)

为了保证不同进程之间不会相互影响,我们可以用下面所述的一种简单方法来处理:
1. 每个进程都应该有一个单独的内存空间,因此我们需要确定单一进程可以访问的地址范围
2. 我们使用两个寄存器: 基地址寄存器(base register)-含有最小的合法物理内存地址,地址范围寄存器(limit register)-指定地址的范围大小.
   1. 例如: 基地址为10000,地址范围为1200,则该进程可以合法访问从10000到11200的所有地址
3. 当然,如果进程本身可以修改这两个寄存器,那就没有意义了,因此,只有操作系统可以加载并修改这两个寄存器

### Address Binding
用户程序执行时,操作系统需要将指令和数据绑定到存储器里的对应地址上(不然怎么执行),有三种常见的绑定时机:
1. compile time: 编译时就将进程绑定在一个固定地址上,非常省心,但缺点是当地址变化时,就需要重新编译代码.
2. load time: 加载时用相对地址来绑定进程,当地址变化时,只需要重新加载程序代码就可以了
3. runtime time: 如果进程在执行时会跳跃地址,那么我们就只能在进程执行的时候再绑定地址,这也是现代操作系统采用的方法
### Logical Versus Physical Address Space
当我们采用runtime time方案来绑定进程时,将程序生成的地址称为**虚拟地址**(也称为逻辑地址),虚拟地址对应的实际地址称为**物理地址**.

将虚拟地址映射到物理地址的硬件设备是Memery-Management Unit(MMU,内存管理单元),在这里我们先介绍一种简单的映射方案:
- 将虚拟地址加上重定位寄存器(relocation register)内存储的偏移值,得到物理地址.

这种简单的方法能够有效的防止进程得知自己的实际执行地址,不让它搞破坏.
## Swapping(3/28)
在第五章里我们提到了调度队列的问题,进程会经常在磁盘和内存之间交换,在这一节我们再来深入探讨交换的详细过程
### Standard Swapping(过)
这种交换方式在内存和备份存储之间进行,由于交换速度过慢,因此现代操作系统不使用标准交换
- ...我不知道这一节想表达什么

## 内存分配
>In the **variable-partition** scheme, the operating system keeps a table
indicating which parts of memory are available and which are occupied.
Initially, all memory is available for user processes and is considered one
large block of available memory, a **hole**.