Linux内核抢占实现机制分析.docx
- 文档编号:30509407
- 上传时间:2023-08-16
- 格式:DOCX
- 页数:11
- 大小:20.43KB
Linux内核抢占实现机制分析.docx
《Linux内核抢占实现机制分析.docx》由会员分享,可在线阅读,更多相关《Linux内核抢占实现机制分析.docx(11页珍藏版)》请在冰豆网上搜索。
Linux内核抢占实现机制分析
Linux内核抢占实现机制分析
来源:
中国IT实验室作者:
网络发表于:
2012-08-1310:
19 点击:
319
1、内核抢占概述2.6新的可抢占式内核是指内核抢占,即当进程位于内核空间时,有一个更高优先级的任务出现时,如果当前内核允许抢占,则可以将当前任务挂起,执行优先级更高的进程。
在2.5.4版本之前,Linux内核是不可抢占的,高优先级的进程不能中止正在内核
-
1、内核抢占概述
2.6新的可抢占式内核是指内核抢占,即当进程位于内核空间时,有一个更高优先级的任务出现时,如果当前内核允许抢占,则可以将当前任务挂起,执行优先级更高的进程。
在2.5.4版本之前,Linux内核是不可抢占的,高优先级的进程不能中止正在内核中运行的低优先级的进程而抢占CPU运行。
进程一旦处于核心态(例如用户进程执行系统调用),则除非进程自愿放弃CPU,否则该进程将一直运行下去,直至完成或退出内核。
与此相反,一个可抢占的Linux内核可以让Linux内核如同用户空间一样允许被抢占。
当一个高优先级的进程到达时,不管当前进程处于用户态还是核心态,如果当前允许抢占,可抢占内核的Linux都会调度高优先级的进程运行。
2、用户抢占
内核即将返回用户空间的时候,如果needresched标志被设置,会导致schedule()被调用,此时就会发生用户抢占。
在内核返回用户空间的时候,它知道自己是安全的。
所以,内核无论是在从中断处理程序还是在系统调用后返回,都会检查needresched标志。
如果它被设置了,那么,内核会选择一个其他(更合适的)进程投入运行。
简而言之,用户抢占在以下情况时产生:
从系统调返回用户空间。
从中断处理程序返回用户空间。
3、不可抢占内核的特点
在不支持内核抢占的内核中,内核代码可以一直执行,到它完成为止。
也就是说,调度程序没有办法在一个内核级的任务正在执行的时候重新调度-内核中的各任务是协作方式调度的,不具备抢占性。
当然,运行于内核态的进程可以主动放弃CPU,比如,在系统调用服务例程中,由于内核代码由于等待资源而放弃CPU,这种情况叫做计划性进程切换(plannedprocessswitch)。
内核代码一直要执行到完成(返回用户空间)或明显的阻塞为止,
在单CPU情况下,这样的设定大大简化了内核的同步和保护机制。
可以分两步对此加以分析:
首先,不考虑进程在内核中自愿放弃CPU的情况(也即在内核中不发生进程的切换)。
一个进程一旦进入内核就将一直运行下去,直到完成或退出内核。
在其没有完成或退出内核之前,不会有另外一个进程进入内核,即进程在内核中的执行是串行的,不可能有多个进程同时在内核中运行,这样内核代码设计时就不用考虑多个进程同时执行所带来的并发问题。
Linux的内核开发人员就不用考虑复杂的进程并发执行互斥访问临界资源的问题。
当进程在访问、修改内核的数据结构时就不需要加锁来防止多个进程同时进入临界区。
这时只需再考虑一下中断的情况,若有中断处理例程也有可能访问进程正在访问的数据结构,那么进程只要在进入临界区前先进行关中断操作,退出临界区时进行开中断操作就可以了。
再考虑一下进程自愿放弃CPU的情况。
因为对CPU的放弃是自愿的、主动的,也就意味着进程在内核中的切换是预先知道的,不会出现在不知道的情况下发生进程的切换。
这样就只需在发生进程切换的地方考虑一下多个进程同时执行所可能带来的并发问题,而不必在整个内核范围内都要考虑进程并发执行问题。
4、为什么需要内核抢占?
实现内核的可抢占对Linux具有重要意义。
首先,这是将Linux应用于实时系统所必需的。
实时系统对响应时间有严格的限定,当一个实时进程被实时设备的硬件中断唤醒后,它应在限定的时间内被调度执行。
而Linux不能满足这一要求,因为Linux的内核是不可抢占的,不能确定系统在内核中的停留时间。
事实上当内核执行长的系统调用时,实时进程要等到内核中运行的进程退出内核才能被调度,由此产生的响应延迟,在如今的硬件条件下,会长达100ms级。
这对于那些要求高实时响应的系统是不能接受的。
而可抢占的内核不仅对Linux的实时应用至关重要,而且能解决Linux对多媒体(video,audio)等要求低延迟的应用支持不够好的缺陷。
由于可抢占内核的重要性,在Linux2.5.4版本发布时,可抢占被并入内核,同SMP一样作为内核的一项标准可选配置。
5、什么情况不允许内核抢占
有几种情况Linux内核不应该被抢占,除此之外Linux内核在任意一点都可被抢占。
这几种情况是:
●内核正进行中断处理。
在Linux内核中进程不能抢占中断(中断只能被其他中断中止、抢占,进程不能中止、抢占中断),在中断例程中不允许进行进程调度。
进程调度函数schedule()会对此作出判断,如果是在中断中调用,会打印出错信息。
●内核正在进行中断上下文的BottomHalf(中断的底半部)处理。
硬件中断返回前会执行软中断,此时仍然处于中断上下文中。
●内核的代码段正持有spinlock自旋锁、writelock/readlock读写锁等锁,处干这些锁的保护状态中。
内核中的这些锁是为了在SMP系统中短时间内保证不同CPU上运行的进程并发执行的正确性。
当持有这些锁时,内核不应该被抢占,否则由于抢占将导致其他CPU长期不能获得锁而死等。
●内核正在执行调度程序Scheduler.抢占的原因就是为了进行新的调度,没有理由将调度程序抢占掉再运行调度程序。
●内核正在对每个CPU“私有”的数据结构操作(Per-CPUdatestructures)。
在SMP中,对于per-CPU数据结构未用spinlocks保护,因为这些数据结构隐含地被保护了(不同的CPU有不一样的per-CPU数据,其他CPU上运行的进程不会用到另一个CPU的per-CPU数据)。
但是如果允许抢占,但一个进程被抢占后重新调度,有可能调度到其他的CPU上去,这时定义的Per-CPU变量就会有问题,这时应禁抢占。
为保证Linux内核在以上情况下不会被抢占,抢占式内核使用了一个变量preempt_count,称为内核抢占锁。
这一变量被设置在进程的PCB结构task_struct中。
每当内核要进入以上几种状态时,变量preempt_count就加1,指示内核不允许抢占。
每当内核从以上几种状态退出时,变量preempt_count就减1,同时进行可抢占的判断与调度。
从中断返回内核空间的时候,内核会检查need_resched和preempt_count的值。
如果need_resched被设置,并且preemptcount为0的话,这说明可能有一个更为重要的任务需要执行并且可以安全地抢占,此时,调度程序就会被调用。
如果preempt-count不为0,则说明内核现在处干不可抢占状态,不能进行重新调度。
这时,就会像通常那样直接从中断返回当前执行进程。
如果当前进程持有的所有的锁都被释放了,那么preempt_count就会重新为0.此时,释放锁的代码会检查need_resched是否被设置。
如果是的话,就会调用调度程序。
6、内核抢占时机
在2.6版的内核中,内核引入了抢占能力;现在,只要重新调度是安全的,那么内核就可以在任何时间抢占正在执行的任务。
那么,什么时候重新调度才是安全的呢?
只要premptcount为0,内核就可以进行抢占。
通常锁和中断是非抢占区域的标志。
由于内核是支持SMP的,所以,如果没有持有锁,那么正在执行的代码就是可重新导人的,也就是可以抢占的。
如果内核中的进程被阻塞了,或它显式地调用了schedule(),内核抢占也会显式地发生。
这种形式的内核抢占从来都是受支持的(实际上是主动让出CPU),因为根本无需额外的逻辑来保证内核可以安全地被抢占。
如果代码显式的调用了schedule(),那么它应该清楚自己是可以安全地被抢占的。
内核抢占可能发生在:
当从中断处理程序正在执行,且返回内核空间之前。
当内核代码再一次具有可抢占性的时候,如解锁及使能软中断等。
如果内核中的任务显式的调用schedule()
如果内核中的任务阻塞(这同样也会导致调用schedule())
7、如何支持抢占内核
抢占式Linux内核的修改主要有两点:
一是对中断的入口代码和返回代码进行修改。
在中断的入口内核抢占锁preempt_count加1,以禁止内核抢占;在中断的返回处,内核抢占锁preempt_count减1,使内核有可能被抢占。
我们说可抢占Linux内核在内核的任一点可被抢占,主要就是因为在任意一点中断都有可能发生,每当中断发生,Linux可抢占内核在处理完中断返回时都会进行内核的可抢占判断。
若内核当前所处状态允许被抢占,内核都会重新进行调度选取高优先级的进程运行。
这一点是与非可抢占的内核不一样的。
在非可抢占的Linux内核中,从硬件中断返回时,只有当前被中断进程是用户态进程时才会重新调度,若当前被中断进程是核心态进程,则不进行调度,而是恢复被中断的进程继续运行。
另一基本修改是重新定义了自旋锁、读、写锁,在锁操作时增加了对preemptcount变量的操作。
在对这些锁进行加锁操作时preemptcount变量加1,以禁止内核抢占;在释放锁时preemptcount变量减1,并在内核的抢占条件满足且需要重新调度时进行抢占调度。
下面以spin_lock(),spin_unlock()操作为例说明:
/////////////////////////////////////////////////////////////////////////
/linux+v2.6.19/kernel/spinlock.c
320void__lockfunc_spin_unlock(spinlock_t*lock)
321{
322spin_release(&lock->dep_map,1,_RET_IP_);
323_raw_spin_unlock(lock);
324preempt_enable();
325}
326EXPORT_SYMBOL(_spin_unlock);
178void__lockfunc_spin_lock(spinlock_t*lock)
179{
180preempt_disable();
181spin_acquire(&lock->dep_map,0,0,_RET_IP_);
182_raw_spin_lock(lock);
183}
184
185EXPORT_SYMBOL(_spin_lock);
/////////////////////////////////////////////////////////////////////////
29#definepreempt_disable()/
30do{/
31inc_preempt_count();/
32barrier();/
33}while(0)
34
35#definepreempt_enable_no_resched()/
36do{/
37barrier();/
38dec_preempt_count();/
39}while(0)
40
41#definepreempt_check_resched()/
42do{/
43if(unlikely(test_thread_flag(TIF_NEED_RESCHED)))/
44preempt_schedule();/
45}while(0)
46
47#definepreempt_enable()/
48do{/
49preempt_enable_no_resched();/
50barrier();/
51preempt_check_resched();/
52}while(0)
53
另外一种可抢占内核实现方案是在内核代码段中插入抢占点(preemptionpoint)的方案。
在这一方案中,首先要找出内核中产生长延迟的代码段,然后在这一内核代码段的适当位置插入抢占点,使得系统不必等到这段代码执行完就可重新调度。
这样对于需要快速响应的事件,系统就可以尽快地将服务进程调度到CPU运行。
抢占点实际上是对进程调度函数的调用,代码如下:
if(current->need_resched)schedule();
通常这样的代码段是一个循环体,插入抢占点的方案就是在这一循环体中不断检测need_resched的值,在必要的时候调用schedule()令当前进程强行放弃CPU
8、何时需要重新调度
内核必须知道在什么时候调用schedule()。
如果仅靠用户程序代码显式地调用schedule(),它们可能就会永远地执行下去。
相反,内核提供了一个need_resched标志来表明是否需要重新执行一次调度。
当某个进程耗尽它的时间片时,schedulertick()就会设置这个标志;当一个优先级高的进程进入可执行状态的时候,try_to_wake_up也会设置这个标志。
set_tsk_need_resched:
设置指定进程中的need_resched标志
cleartskneed_resched:
清除指定进程中的need_resched标志
need_resched():
检查need_resched标志的值;如果被设置就返回真,否则返回假
信号量、等到队列、completion等机制唤醒时都是基于waitqueue的,而waitqueue的唤醒函数为default_wake_function,其调用try_to_wake_up将进程更改为可运行状态并置待调度标志。
在返回用户空间以及从中断返回的时候,内核也会检查need_resched标志。
如果已被设置,内核会在继续执行之前调用调度程序。
每个进程都包含一个need_resched标志,这是因为访问进程描述符内的数值要比访问一个全局变量快(因为current宏速度很快并且描述符通常都在高速缓存中)。
在2.2以前的内核版本中,该标志曾经是一个全局变量。
2.2到2.4版内核中它在task_struct中。
而在2.6版中,它被移到thread_info结构体里,用一个特别的标志变量中的一位来表示。
可见,内核开发者总是在不断改进。
/linux+v2.6.19/include/linux/sched.h
1503staticinlinevoidset_tsk_need_resched(structtask_struct*tsk)
1504{
1505 set_tsk_thread_flag(tsk,TIF_NEED_RESCHED);
1506}
1507
1508staticinlinevoidclear_tsk_need_resched(structtask_struct*tsk)
1509{
1510 clear_tsk_thread_flag(tsk,TIF_NEED_RESCHED);
1511}
1512
1513staticinlineintsignal_pending(structtask_struct*p)
1514{
1515 returnunlikely(test_tsk_thread_flag(p,TIF_SIGPENDING));
1516}
1517
1518staticinlineintneed_resched(void)
1519{
1520 returnunlikely(test_thread_flag(TIF_NEED_RESCHED));
1521}
///////////////////////////////////////////////////////////////////////////////
/linux+v2.6.19/kernel/sched.c
991/*
992*resched_task-markatask'tobereschedulednow'.
993*
994*OnUPthismeansthesettingoftheneed_reschedflag,onSMPit
995*mightalsoinvolveacross-CPUcalltotriggerthescheduleron
996*thetargetCPU.
997*/
998#ifdefCONFIG_SMP
999
1000#ifndeftsk_is_polling
1001#definetsk_is_polling(t)test_tsk_thread_flag(t,TIF_POLLING_NRFLAG)
1002#endif
1003
1004staticvoidresched_task(structtask_struct*p)
1005{
1006 intcpu;
1007
1008 assert_spin_locked(&task_rq(p)->lock);
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Linux 内核 抢占 实现 机制 分析