Linux内核设计与实现.docx
- 文档编号:5028798
- 上传时间:2022-12-12
- 格式:DOCX
- 页数:40
- 大小:80.30KB
Linux内核设计与实现.docx
《Linux内核设计与实现.docx》由会员分享,可在线阅读,更多相关《Linux内核设计与实现.docx(40页珍藏版)》请在冰豆网上搜索。
Linux内核设计与实现
进程管理
一、FORK()函数的两次返回的具体情况
对于fork来说,父子进程共享同一段代码空间,所以给人的感觉好像是有两次返回,其实对于调用fork的父进程来说,如果fork出来的子进程没有得到调度,那么父进程从fork系统调用返回,同时分析sys_fork知道,fork返回的是子进程的id。
再看fork出来的子进程,由copy_process函数可以看出,子进程的返回地址为ret_from_fork(和父进程在同一个代码点上返回),返回值直接置为0。
所以当子进程得到调度的时候,也从fork返回,返回值为0。
关键注意两点:
1.fork返回后,父进程或子进程的执行位置。
(首先会将当前进程eax的值做为返回值)2.两次返回的pid存放的位置。
(eax中)
进程调用copy_process得到lastpid的值(放入eax中,fork正常返回后,父进程中返回的就是lastpid)
子进程任务状态段tss的eax被设置成0,
fork.c中
p->tss.eax=0;(如果子进程要执行就需要进程切换,当发生切换时,子进程tss中的eax值就调入eax寄存器,子进程执行时首先会将eax的内容做为返回值)
当子进程开始执行时,copy_process返回eax的值。
fork()后,就是两个任务同时进行,父进程用他的tss,子进程用自己的tss,在切换时,各用各的eax中的值.
所以,“一次调用两次返回”是2个不同的进程!
例子:
intmain()
{
pid_tpid;
pid=fork();
if(pid<0){
fprintf(stderr,"ForkFailed");
exit(-1);
}
else
if(pid==0){
printf("childprocess\\n");
}
else
{
printf("parentprocess\\n");
}
return0;
}
这个程序执行为什么总是显示:
childprocess
parentprocess
而不会先是parent后是child呢?
答:
看这一句:
pid=fork()
当执行这一句时,当前进程进入fork()运行,此时,fork()内会用一段嵌入式汇编进行系统调用:
int0x80(具体代码可参见内核版本0.11的unistd.h文件的133行_syscall0函数)。
这时进入内核根据此前写入eax的系统调用功能号便会运行sys_fork系统调用。
接着,sys_fork中首先会调用C函数find_empty_process产生一个新的进程,然后会调用C函数copy_process将父进程的内容复制给子进程,但是子进程tss中的eax值赋值为0(这也是为什么子进程中返回0的原因),当赋值完成后,copy_process会返回新进程(该子进程)的linux进程描述符—task_struct结构
为了管理进程,操作系统必须对每个进程所做的事情进行清楚地描述,为此,操作系统使用数据结构来代表处理不同的实体,这个数据结构就是通常所说的进程描述符或进程控制块,在linux系统中,这就是task_struct结构,在include\linux\sched.h文件中定义。
每个进程都会被分配一个task_struct结构,它包含了这个进程的所有信息,在任何时候操作系统都能跟踪这个结构的信息,这个结构是linux内核汇总最重要的数据结构,下面我们会详细的介绍。
这个结构的源代码及其注释如下,之后对其进行了分类解释。
//进程描述符task_struct
structtask_struct{
/**offsetsofthesearehardcodedelsewhere-touchwithcare
*/volatilelongstate;/*-1unrunnable,0runnable,>0stopped*///-1不能运行0运行>0停止
unsignedlongflags;/*perprocessflags,definedbelow*///进程标志,在下面定义
intsigpending;//进程上是否有待处理的信号
mm_segment_taddr_limit;/*threadaddressspace:
进程地址空间
0-0xBFFFFFFFforuser-thead
0-0xFFFFFFFFforkernel-thread
*/
volatilelongneed_resched;//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度
intlock_depth;/*Lockdepth*///锁深度
/**offset32beginshereon32-bitplatforms.Wekeep
*allfieldsinasinglecachelinethatareneededfor
*thegoodness()loopinschedule().
*/longcounter;//进程可运行的时间量
longnice;//进程的基本时间片
unsignedlongpolicy;//进程的调度策略,有三种,实时进程:
SCHED_FIFO,SCHED_RR;分时进程:
SCHED_OTHER;
structmm_struct*mm;//进程内存管理信息
intprocessor;
/**cpus_runnableis~0iftheprocessisnotrunningonany
*CPU.It's(1< *isupdatedundertherunqueuelock. **TodeterminewhetheraprocessmightrunonaCPU,this *maskisAND-edwithcpus_allowed. *若进程不在任何CPU上运行,cpus_runnable的值是0,否则是1。 这个值在运行*队列被锁时更新;*/ unsignedlongcpus_runnable,cpus_allowed; /**(onlythe'next'pointerfitsintothecacheline,but *that'sjustfine.) */ structlist_headrun_list;//指向运行队列的指针 unsignedlongsleep_time;//进程的睡眠时间 structtask_struct*next_task,*prev_task;//用于将系统中所有的进程连成一个双向循环链表,其根是init_task. structmm_struct*active_mm; structlist_headlocal_pages;//指向本地页面 unsignedintallocation_order,nr_local_pages; /*taskstate*/ structlinux_binfmt*binfmt;//进程所运行的可执行文件的格式 intexit_code,exit_signal; intpdeath_signal;/*Thesignalsentwhentheparentdies*///父进程终止是向子进程发送的信号 /*? ? ? */ unsignedlongpersonality;//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序 intdid_exec: 1;//按POSIX要求设计的布尔量,区分进程正在执行从父进程中继承的代码,还是执行由execve装入的新程序代码 pid_tpid;//进程标识符,用来代表一个进程 pid_tpgrp;//进程组标识,表示进程所属的进程组 pid_ttty_old_pgrp;//进程控制终端所在的组标识 pid_tsession;//进程的会话标识 pid_ttgid; /*booleanvalueforsessiongroupleader*/ intleader;//标志,表示进程是否为会话主管 /* *pointersto(original)parentprocess,youngestchild,youngersibling, *oldersibling,respectively.(p->fathercanbereplacedwith *p->p_pptr->pid) *///指针指向(原始的)父进程,孩子进程,比自己年轻的兄弟进程,比自己年长的兄弟进程 //(p->father能被p->p_pptr->pid代替) structtask_struct*p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr; structlist_headthread_group;//线程链表 /*PIDhashtablelinkage.*///进程散列表指针 structtask_struct*pidhash_next;//用于将进程链入HASH表pidhash structtask_struct**pidhash_pprev; wait_queue_head_twait_chldexit;/*forwait4()*///wait4()使用 structcompletion*vfork_done;/*forvfork()*///vfork()使用 unsignedlongrt_priority;//实时优先级,用它计算实时进程调度时的weight值 //it_real_value,it_real_incr用于REAL定时器,单位为jiffies。 系统根据it_real_value//设置定时器的第一个终止时间。 在定时器到期时,向进程发送SIGALRM信号,同时根据it_real_incr重置终止时间 //it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。 当进程运行时,不管在何种状态下,每个tick都使 //it_prof_value值减一,当减到0时,向进程发送信号SIGPROF,并根据it_prof_incr重置时间 //it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。 当进程运行时,不管在何种状态下,每个tick都使 //it_virt_value值减一,当减到0时,向进程发送信号SIGVTALRM,根据it_virt_incr重置初值。 //Real定时器根据系统时间实时更新,不管进程是否在运行 //Virtual定时器只在进程运行时,根据进程在用户态消耗的时间更新 //Profile定时器在进程运行时,根据进程消耗的时(不管在用户态还是内核态)更新 unsignedlongit_real_value,it_prof_value,it_virt_value; unsignedlongit_real_incr,it_prof_incr,it_virt_value; structtimer_listreal_timer;//指向实时定时器的指针 structtmstimes;//记录进程消耗的时间, unsignedlongstart_time;//进程创建的时间 longper_cpu_utime[NR_CPUS],per_cpu_stime[NR_CPUS];//记录进程在每个CPU上所消耗的用户态时间和核心态时间 /*mmfaultandswapinfo: thiscanarguablybeseenaseithermm-specificorthread-specific*/ //内存缺页和交换信息: //min_flt,maj_flt累计进程的次缺页数(Copyon Write页和匿名页)和主缺页数(从映射文件或交换设备读入的页面数); //nswap记录进程累计换出的页面数,即写到交换设备上的页面数。 //cmin_flt,cmaj_flt,cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。 在父进程 //回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中 unsignedlongmin_flt,maj_flt,nswap,cmin_flt,cmaj_flt,cnswap; intswappable: 1;//表示进程的虚拟地址空间是否允许换出 /*processcredentials*////进程认证信息 //uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid//euid,egid为有效uid,gid //fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件系统的访问权限时使用他们。 //suid,sgid为备份uid,gid uid_tuid,euid,suid,fsuid; gid_tgid,egid,sgid,fsgid; intngroups;//记录进程在多少个用户组中 gid_tgroups[NGROUPS];//记录进程所在的组 kernel_cap_tcap_effective,cap_inheritable,cap_permitted;//进程的权能,分别是有效位集合,继承位集合,允许位集合 intkeep_capabilities: 1; structuser_struct*user; /*limits*/ structrlimitrlim[RLIM_NLIMITS];//与进程相关的资源限制信息 unsignedshortused_math;//是否使用FPU charcomm[16];//进程正在运行的可执行文件名 /*filesysteminfo*///文件系统信息 intlink_count,total_link_count; structtty_struct*tty;/*NULLifnotty进程所在的控制终端,如果不需要控制终端,则该指针为空*/ unsignedintlocks;/*Howmanyfilelocksarebeingheld*/ /*ipcstuff*///进程间通信信息 structsem_undo*semundo;//进程在信号灯上的所有undo操作 structsem_queue*semsleeping;//当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作 /*CPU-specificstateofthistask*///进程的CPU状态,切换时,要保存到停止进程的 task_struct中 structthread_structthread; /*filesysteminformation文件系统信息*/ structfs_struct*fs; /*openfileinformation*///打开文件信息 structfiles_struct*files; /*signalhandlers*///信号处理函数 spinlock_tsigmask_lock;/*Protectssignalandblocked*/ structsignal_struct*sig;//信号处理函数, sigset_tblocked;//进程当前要阻塞的信号,每个信号对应一位 structsigpendingpending;//进程上是否有待处理的信号 unsignedlongsas_ss_sp; size_tsas_ss_size; int(*notifier)(void*priv); void*notifier_data; sigset_t*notifier_mask; /*Threadgrouptracking*/ u32parent_exec_id; u32self_exec_id; /*Protectionof(de-)allocation: mm,files,fs,tty*/ spinlock_talloc_lock; /*journallingfilesysteminfo*/ void*journal_info; }; pid,这个值会被保存到eax中。 这时子进程就产生了,此时子进程与父进程拥有相同的代码空间,程序指针寄存器eip指向相同的下一条指令地址,当fork正常返回调用其的父进程后,因为eax中的值是新创建的子进程号,所以,fork()返回子进程号,执行else(pid>0);当产生进程切换运行子进程时,首先会恢复子进程的运行环境即装入子进程的tss任务状态段,其中的eax值(copy_process中置为0)也会被装入eax寄存器,所以,当子进程运行时,fork返回的是0执行if(pid==0)。 先显示childprocess应该和内核机制有关,当fork一个新的进程后都会进行进程的重新调度,此时总是子进程先运行(和进程优先级有关? ) 二、进程描述符 linux进程描述符—task_struct结构 为了管理进程,操作系统必须对每个进程所做的事情进行清楚地描述,为此,操作系统使用数据结构来代表处理不同的实体,这个数据结构就是通常所说的进程描述符或进程控制块,在linux系统中,这就是task_struct结构,在include\linux\sched.h文件中定义。 每个进程都会被分配一个task_struct结构,它包含了这个进程的所有信息,在任何时候操作系统都能跟踪这个结构的信息,这个结构是linux内核汇总最重要的数据结构,下面我们会详细的介绍。 这个结构的源代码及其注释如下,之后对其进行了分类解释。 //进程描述符task_struct structtask_struct{ /**offsetsofthesearehardcodedelsewhere-touchwithcare */volatilelongstate;/*-1unrunnable,0runnable,>0stopped*///-1不能运行0运行>0停止 unsignedlongflags;/*perprocessflags,definedbelow*///进程标志,在下面定义 intsigpending;//进程上是否有待处理的信号 mm_segment_taddr_limit;/*threadaddressspace: 进程地址空间 0-0xBFFFFFFFforuser-thead 0-0xFFFFFFFFforkernel-thread */ volatilelongneed_resched;//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度 intlock_depth;/*Lockdepth*///锁深度 /**offset32beginshereon32-bitplatforms.Wekeep *allfieldsinasinglecachelinethatareneededfor *thegoodness()loopinschedule(). */longcounter;//进程可运行的时间量 longnice;//进程的基本时间片 unsignedlongpolicy;//进程的调度策略,有三种,实时进程: SCHED_FIFO,SCHED_RR;分时进程: SCHED_OTHER; structmm_struct*mm;//进程内存管理信息 intprocessor; /**cpus_runnableis~0iftheprocessisnotrunningonany *CPU.It's(1< *isupdatedundertherunqueuelock. **TodeterminewhetheraprocessmightrunonaCPU,this *maskisAND-edwithcpus_allowed. *若进程不在任何CPU上运行,cpus_runnable的值是0,否则是1。 这个值在运行*队列被锁时更新;*/ unsignedlongcpus_runnable,cpus_allowed; /**(onlythe'next'pointerfitsintothecacheline,but *that'sjustfine.) */ structlist_headrun_list;//指向运行队列的指针 unsignedlongsleep_time;//进程的睡眠时间 structtask_struct*next_task,*prev_task;//用于将系统中所有的进程连成一个双向循环链表,其根是init_task. structmm_struct*active_mm; structlist_headlocal_pages;//指向本地页面 unsignedintallocation_order,nr_local_pages; /*taskstate*/ structlinux_binfmt*binfmt;//进程所运行的可执行文件的格
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Linux 内核 设计 实现