type
status
date
slug
summary
tags
category
icon
password
能力模型
能力分类
省赛
全球总决赛
学习进度
中国总决赛
本篇主要是目的是进行个人知识梳理和总结,不含技术性实现的详细内容,若涉及实际技术性操作的内容,会另起一文。
本篇主要参考王道考研书籍。
死锁的概念
在并发环境下,各进程因竞争资源二造成的一种互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象,就是“死锁”。
死锁、饥饿、死循环的区别与联系
- 死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
- 饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。(比如:在短进程优先(SPF)算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程“饥饿”。)
- 死循环:某进程执行过程中一直跳不出某个循环的现象。优势是因为程序逻辑bug,有时是程序员故意设计的。
ㅤ | 共同点 | 不同点 |
死锁 | 都是进程无法顺利向前推进的现象 | 死锁一定是“循环等待对方手里的资源”导致的,因此如果有死锁现象,那至少有两个或两个以上的进程同时发生死锁。另外,发生死锁的进程一定处于阻塞态。 |
饥饿 | ㅤ | **可能只有一个进程发生饥饿。**发生饥饿的进程既可能是阻塞态(如长期得不到需要的I/O设备),也可能是就绪态(长期得不到处理机) |
死循环 | (故意设计的死循环除外) | 可能只有一个进程发生死循环。死循环的进程可以上处理机运行(可以是运行态),只不过无法像期待的那样顺利推进。死锁和饥饿问题是由于操作系统分配资源的策略不合理导致的,而死循环是由代码逻辑的错误导致的。死锁和饥饿是管理者(操作系统)的问题,死循环是被管理者的问题。 |
死锁产生的必要条件
产生死锁必须同时满足一下四个条件,只要其中任一条件不成立,死锁就不会发生。
- 互斥条件(竞争):只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。
- 不剥夺条件(不抢):进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
- 请求和保持条件(不给):进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
- 循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
注意:发生死锁时一定有循环等待,但是发生循环等待时未必发生死锁循环等待是死锁的必要不充分条件)。如果同类资源数大于1,则即使有循环等待,也未必发生死锁。但如果系统中每类资源都只有一个,那循环等待就是死锁的充分必要条件了。
死锁产生的原因
- (空间)对系统资源的竞争。各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。
- (时间)进程推进顺序非法。请求和释放资源的顺序不当,也同样会导致死锁。例如,并发执行的进程P1、P2 分别申请并占有了资源R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
- 信号量的使用不当也会造成死锁。如生产者-消费者问题中,如果实现互斥的P操作在实现同步的P操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资源)
总之,对不可剥夺资源的不合理分配,可能导致死锁。
死锁的处理策略
- 预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
- 避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
- 死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。
预防死锁【静态策略】
预防死锁的发生只需要破坏死锁产生的4个必要条件之一即可。
1.破坏互斥条件(能否共享)
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁。
如果把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。比如: SPOOLing技术。
缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件。
2.破坏不剥夺条件
不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件。
方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)
缺点:
- 实现起来比较复杂。
- 释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态的资源,如CPU。
- 反复地申请和释放资源会增加系统开销,降低系统吞吐量。
- 若采用方案一,意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。
3.破坏请求和保持条件
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。
方法一:采用静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。
方法二:允许一个进程只获得运行初期所需的资源后便开始运行,进程运行过程中逐步释放分配给自己且已用毕的全部资源,再请求新的所需资源。。
缺点:
有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿。方法二则改进了这些缺点。
4.破坏循环等待条件
循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
可采用顺序资源分配法。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完。
原理分析:一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。
缺点:
- 不方便增加新的设备,因为可能需要重新分配所有的编号;
- 进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费;
- 必须按规定次序申请资源,用户编程麻烦。
避免死锁【动态策略】
系统安全状态
若系统能按照某种推进顺序(P1,P2,...,Pn)为每个进程 Pi 分配其所需的资源,直至满足每个进程对资源的最大需求,使每个进程都可顺利完成,其中(P1,P2,...,Pn)为安全序列(当然,安全序列可能有多个)。若系统找到一个安全序列并按此分配资源,则系统处于安全状态,否则系统处于不安全状态。
如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)。
因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源 分配请求。这也是 “银行家算法” 的核心思想。
银行家算法
数据结构
- 可利用资源向量 Available:含有 m 个元素,其中每个元素代表一类可利用的资源数目
- 最大需求矩阵 Max:是个 n*m 矩阵,代表系统中 n 个进程,每个进程对 m 类资源的最大需求量
- 分配矩阵 Allocation:是个 n*m 矩阵,代表系统中每类资源当前分配给每个进程的资源数
- 需求矩阵 Need:是个 n*m 矩阵,代表系统中每个进程尚需的各类资源数
银行家算法
设 Requesti 是进程 Pi 的请求向量,Request i [j] = K 表示进程 Pi 需要 K 个 Rj 类型资源,则系统按照以下步骤检查
- 若 Request i [j] ≤ Need[i,j],则转向2;否则出错,进程需要的资源数超过其宣布的最大值
- 若 Request i [j] ≤ Available[j],转向3;否则尚无足够资源,Pi 须等待
- 系统试探着把资源分配给进程 Pi,并修改数据结构中的数值
- Available[j] -= Requesti[j]
- Allocation[i,j] += Requesti[j]
- Need[i,j] -= Requesti[j]
- 系统执行安全性算法,检查此次资源分配后系统是否处于安全状态,若安全,则系统正式把资源分配给进程 Pi;否则本次试探作废,恢复数据结构中的数值
安全性算法
- 设置两个向量
- 工作向量 Work:含有 m 个元素,表示系统可提供给进程继续运行所需的各类资源数目,执行安全算法开始时,Work=Available
- Finish:表示系统是否有足够的资源分配给进程,初始值为 false,当有足够资源分配给进程时,令 Finish[i] = true
- 从进程集合中找到一个满足一下条件的进程
- Finish[i] = false
- Need[i,j] ≤ Work[i]
若找到,则执行3;否则执行4
- 当 Pi 进程获得资源并顺利执行至完成,释放出分配给它的资源,故执行
- Work[j] = Work[j] + Allocation[i,j]
- Finish[i] = true
- 转到2
- 若所有进程的 Finish[i] = true 都满足,则系统处于安全状态;否则系统处于不安全状态
死锁检测
为了能对系统是否已发生了死锁进行检测,必须:
- 用某种数据结构来保存资源的请求和分配信息
- 提供一套算法,利用上述信息来检测系统是否已经进入死锁状态
检测死锁的算法:
- 在资源分配图中,找出既不阻塞又不是孤点的进程 Pi(即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量。如下图中,R1 没有空闲资源,R2 有一个空闲资源。若所有的连接该进程的边均满足上述条件,则这个进程能继续运行直至完成,然后释放它所占有的所有资源)。消去它所有的请求边和分配变,使之称为孤立的结点。在下图中,P1 是满足这一条件的进程结点,于是将 P1 的所有边消去
- 进程 Pi 所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程。在下图中,P2 就满足这样的条件。根据 1 中的方法进行一系列简化后,若能消去途中所有的边,则称该图是可完全简化的
死锁定理:如果某时刻系统的资源分配图是不可完全化简的,那么此时系统死锁
死锁解除
- 资源剥夺法:挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿
- 撤销进程法(或称终止进程法):强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来
- 进程回退法:让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点
有关问题,欢迎您在底部评论区留言,一起交流~
- Author:Koreyoshi
- URL:https://Koreyoshi1216.com/article/11cc7b13-c6a7-80e0-8a7a-e0d500414a57
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!