Linux init_task描述符

阅读数:294 评论数:0

跳转到新版页面

分类

Linux

正文

一、概述

内核中init_task变量是进程0使用的进程描述符，也是Linux系统中第一个进程描述符。

smp amp bmp

非对称多处理(Asymmetric multiprocessing）	每个CPU内核运行一个独立的操作系统或同一操作系统的独立实例
对称多处理（Symmetric multiprocessing）	一个操作系统的实例可以同时管理所有CPU内核，且应用并不绑定某一个内核
混合多处理（Bound multiprocessing）	一个操作系统的实例可以同时管理所有CPU内核，但每个应用被锁定于某个指定的核心

task_struct

task_struct是Linux内核的一种数据结构,相关代码在include/linux/sched.h中，每个进程都把它的信息放在task_struct这个数据结构体,在start_kernel中使用的init_task在init/init_task.c文件中初始化的.

task_struct包含如下内容:

(1)标示符

描述本进程的唯一标识符, 用来区别其他进程.

(2)状态

任务状态, 退出代码, 退出信号等.

(3)优先级

相对于其他进程的优先级

(4)程序计数器

程序中即将被执行的下一条指令的地址.

(5)内存指针

包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针.

(6)上下文数据

进程执行时处理器的数据.

(7)I/O状态信息

包括显示的IO请求,分配给进程的IO设备的被使用的文件列表

(8)记账信息

可能包括处理器时间总和, 使用的时钟数总和, 时间限制,记账号等.

二、进一步分析

1. 为什么需内核栈

内核态的进程访问处于内核数据段的栈, 这个栈不同于用户态的进程所用的栈。当进程从用户空间进入内核空间时特权级发生变化，需要切换堆栈，那么内核空间中使用的就是这个内核栈。因为内核控制路径使用很少的栈空间，所以只需几KB的内核态栈。

Linux内核另外为中断提供了单独的硬中断和软中断栈。

2、为什么需要thread_info

内核还需要存储每个进程的PCB信息，linux内核是支持不同体系的，但是不同的体系结构可能进程需要存储的信息不尽相同，这就需要我们实现一种通用的方式，我们将体系结构相关的部分和无关的部分进行分离。

用一种通用的方式描述进程，这就是struct task_struct，而thread_info就保存了特定体系结构的汇编代码段需要访问的那部分进程的数据，我们在thread_info中嵌入指向task_struct的指针，则我们可以很方便的通过thread_info查找task_struct。

thread_info定义在thread_info.h中

架构	定义链接
x86	arch/x86/include/asm/thread_info.h
arm	arch/arm/include/asm/thread_info.h
arm64	arch/arm64/include/asm/thread_info.h

3、进程相关数据结构

（1）CURRENT宏

task_struct在linux/sched.h文件里定义，在使用current宏的时候一定要引这个头文件，在linux内核编程中常用的current宏可以非常简单地获取到指向task_struct的指针，这个宏和体系统结构有关，大多数情况下，我们都是x86体系结构的，所以在arch/x86目录下，其他体结构类推。

目前主流的体系结构有x86、ARM、MIPS架构，在继续学习之前，我们先来简单了解一下什么是体系结构。

目前主流的体系结构有x86、arm、mips架构，我们先来简单了解一下什么是体系结构：“体系结构”用来描述一个抽象的机器，而不是一个具体的机器实现，一般而言，一个CPU的体系结构有一个指令集加上一些寄存器而组成。

x86、mips、arm三种cpu的体系结构和特点：

X86
X86采用了CISC指令集。在CISC指令集的各种指令中，大约有20%的指令会被反复使用，占整个程序代码的80%。而余下的80%的指令却不经常使用，在程序设计中只占20%。
1.1 总线接口部件BIU
总线接口部件由以下几部分组成
1) 4个16位段寄存器(DS、ES、SS、CS)
2) 一个16位指令指针寄存器(IP)
3) 20位物理地址加法器
4) 6字节指令队列(8088为4字节)
5) 总线控制电路组成，负责与存储器及I/O端口的数据传送 
1.2 执行部件EU
执行部件由以下几部分组成，其任务就是从指令队列流中取出指令，然后分析和执行指令，还负责计算操作数的16位偏移地址
1) ALU
2) 寄存器阵列(AX、BX、CX、DX、SI、DI、BP、SP)
3) 标志寄存器(PSW)等几个部分组成
1.3 寄存器的结构
1) 数据寄存器AX、BX、CX、DX均为16位的寄存器，它们中的每一个又可分为高字节H和低字节L。即AH、BH、CH、DH及AL、BL、CL、DL可作为单独的8位寄存器使用。不论16位寄存器还是8位寄存器，它们均可寄存操作数及
运算的中间结果。有少数指令指定某个寄存器专用，例如，串操作指令指定CX专门用作记录串中元素个数的计数器。
2) 段寄存器组：CS、DS、SS、ES。8086/8088的20位物理地址在CPU内部要由两部分相加形成的
2.1) 指明其偏移地址
SP、BP、SI、DI标识20位物理地址的低16位，用于指明其偏移地址
2.2) 指明20位物理地址的高16位，故称作段寄存器，4个存储器使用专一，不能互换
2.2.1) CS: CS识别当前代码段
2.2.2) DS: DS识别当前数据段
2.2.3) SS: SS识别当前堆栈段
2.2.4) ES: ES识别当前附加段
一般情况下，DS和ES都须用户在程序中设置初值
3) 控制寄存器组
3.1) IP
指令指针IP用以指明当前要执行指令的偏移地址(段地址由CS提供)
3.2) FLAG
标志寄存器FLAG有16位，用了其中的九位，分两组:
3.2.1) 状态标志: 用以记录状态信息，由6位组成，包括CF、AF、OF、SF、PF和ZF，它反映前一次涉及ALU操作的结果，对用户它"只读不写"
3.2.2) 控制标志: 用以记录控制信息由3位组成，包括方向标志DF，中断允许标志IF及陷阱标志TF，中断允许标志IF及陷阱标志TF，可通过指令设置

2. MIPS:
1) 所有指令都是32位编码；
　　 2) 有些指令有26位供目标地址编码；有些则只有16位。因此要想加载任何一个32位值，就得用两个加载指令。16位的目标地址意味着，指令的跳转或子函数的位置必须在64K以内(上下32K)
3) 所有的动作原理上要求必须在1个时钟周期内完成，一个动作一个阶段
4) 有32个通用寄存器，每个寄存器32位(对32位机)或64位(对64位机)
5) 对于MIPS体系结构来说，本身没有任何帮助运算判断的标志寄存器，要实现相应的功能时，是通过测试两个寄存器是否相等来完成
6) 所有的运算都是基于32位的，没有对字节和对半字的运算(MIPS里，字定义为32位，半字定义为16位)
7) 没有单独的栈指令，所有对栈的操作都是统一的内存访问方式。因为push和pop指令实际上是一个复合操作，包含对内存的写入和对栈指针的移动；
8) 由于MIPS固定指令长度，所以造成其编译后的二进制文件和内存占用空间比x86的要大，(x86平均指令长度只有3个字节多一点，而MIPS是4个字节)
9) 寻址方式：只有一种内存寻址方式。就是基地址加一个16位的地址偏移
10) 内存中的数据访问必须严格对齐(至少4字节对齐)
11) 跳转指令只有26位目标地址，再加上2位的对齐位，可寻址28位的空间，即256M
12) 条件分支指令只有16位跳转地址，加上2位的对齐位，共18位寻址空间，即256K
13) MIPS默认不把子函数的返回地址(就是调用函数的受害指令地址)存放到栈中，而是存放到$31寄存器中；这对那些叶子函数有利。如果遇到嵌套的函数的话，有另外的机制处理；
　　 14) 高度的流水线：＊MIPS指令的五级流水线：(每条指令都包含五个执行阶段)
14.1) 第一阶段：从指令缓冲区中取指令。占一个时钟周期
14.2) 第二阶段：从指令中的源寄存器域(可能有两个)的值(为一个数字，指定$0~$31中的某一个)所代表的寄存器中读出数据。占半个时钟周期
14.3) 第三阶段：在一个时钟周期内做一次算术或逻辑运算。占一个时钟周期
14.4) 第四阶段：指令从数据缓冲中读取内存变量的阶段。从平均来讲，大约有3／4的指令在这个阶段没做什么事情，但它是指令有序性的保证。占一个时钟周期
14.5) 第五阶段：存储计算结果到缓冲或内存的阶段。占半个时钟周期
所以一条指令要占用四个时钟周期

3. ARM
ARM处理器是一个32位元精简指令集(RISC)处理器架构，其广泛地使用在许多嵌入式系统设计 
1) RISC(Reduced Instruction Set Computer，精简指令集计算机)
RISC体系结构应具有如下特点：
1.1) 采用固定长度的指令格式，指令归整、简单、基本寻址方式有2~3种
1.2) 使用单周期指令，便于流水线操作执行。
1.3) 大量使用寄存器，数据处理指令只对寄存器进行操作，只有加载/ 存储指令可以访问存储器，以提高指令的执行效率
2) ARM体系结构还采用了一些特别的技术，在保证高性能的前提下尽量缩小芯片的面积，并降低功耗
2.1) 所有的指令都可根据前面的执行结果决定是否被执行，从而提高指令的执行效率
2.2) 可用加载/存储指令批量传输数据，以提高数据的传输效率。 
3) 寄存器结构
ARM处理器共有37个寄存器，被分为若干个组(BANK)，这些寄存器包括
3.1) 31个通用寄存器，包括程序计数器(PC指针)，均为32位的寄存器
3.2) 6个状态寄存器，用以标识CPU的工作状态及程序的运行状态，均为32位
4) 指令结构
ARM微处理器的在较新的体系结构中支持两种指令集：ARM指令集和Thumb指令集。其中，ARM指令为32位的长度，Thumb指令为16位长度。Thumb指令集为ARM指令集的功能子集，但与等价的ARM代码相比较，可节省30%~40%以上的
存储空间，同时具备32位代码的所有优点。

set_task_stack_end_magic

进入start_kernel, set_task_stack_end_magic(&init_task)函数设置整个系统的第一个进程。其中，init_task这个变量是在init/init_task.c中。回到start_kernel函数中，set_task_stack_end_magic函数的原型是kernel/Fork.c中

void set_task_stack_end_magic(struct task_struct *tsk)
{
unsigned long *stackend;

stackend = end_of_stack(tsk);
*stackend = STACK_END_MAGIC; /* for overflow detection */
}

这个end_of_stack在include/linux/sched.h中，它的意思是获取栈边界地址，然后把栈底内容设置为STACK_END_MAGIC，这个作为栈溢出的标记。

Linux的list_head

首先找到list_head结构体定义，/include/linux/types.h如下：

struct list_head {
struct list_head *next, *prev;
};

接下来我们看/include/linux/list.h

#define LIST_HEAD_INIT(name) { &(name), &(name) }

#define LIST_HEAD(name) \
struct list_head name = LIST_HEAD_INIT(name)

static inline void INIT_LIST_HEAD(struct list_head *list)
{
WRITE_ONCE(list->next, list);
list->prev = list;
}

可以通过LIST_HEAD(mylist)进行初始化一个链表，mylist的prev和next指针都指向自己。

RCU机制

Read-Copy Update是数据同步的一种方式，RCU主要针对的数据对象是链表，目的是提高遍历读取数据的效率，为了达到目的使用RCU机制读取数据的时候不对链表进行耗时的加锁操作。这样在同一时间可以有多个线程同时读取该链表，并且允许一个线程对链表进行修改（修改的时候，需要加锁）。RCU适用于需要频繁的读取数据，而相应修改数据并不多的情景，例如在文件系统中，经常城要查找定位目录，而对目录的修改相对来说并不多，这就是RCU发挥作用的最佳场景。

在Linux源码的/Documentation/RCU/目录下可以找到RCU相关的文档。

RCU的原理可以简述：RCU记录了所有对共享数据的使用者，当内核线程需要write某个数据时，先创建一个副本，在副本中修改。当所有读线程都离开临界区后，新的数据才被更新。

1、宽限期（Grace period）

图中每行代表一个线程，最下面的一行是删除线程，当它执行删除操作后，线程进入了宽限期。宽限期的意义是，在一个删除动作发生后，它必须等待所有宽限期开始前已经开如的读线程结束，才可以进行销毁操作。这样做的原因是这些线程有可能读到了要删除的元素。图中的宽限期必须等待1和2结束，而读线程5在宽限期开始已经结束，不需要考虑，而3、4、6也不城要考虑。

2、数据读取的完整性

如图我们在原list中加入一个节点new到A之前，所要做的第一步是将new的指针指和A节点，第二步才是将Head指针指向new。这样做的目的是当插入操作完成第一步的时候，对于链表的读取并不产生影响，而执行完第二步时候，读线程如果读到new，由于new指针指向的是null，这样将导制读线程无法读取到A、B等后续节点。从以上过程中，可以看出RCU并不保证读线程读取到new节点。

如图我们希望删除B，这时候要做的就是将A的指针指向C，保持B的指针，然后删除程序将进入宽限期检测，由于B的内容并没有变更，读到B的线程仍然可以继续读取B的后续节点。B不能销毁，它必须等待宽限期结束后，才能进行相应销毁操作。由于A的节点已经指向了C，当宽限期之后所有后续读操作通过A找到的是C，而B已经隐藏了，后续的读线程都不会读到它。这样就确保宽限期过后，删除B并不对系统造成影响。

cred管理

一个对象操作另一个对象时通常做安全性检查。如一个进程操作一个文件，要检查进程是否有权操作该文件。credential机制的引入，正是对象间访问所需权限的抽象，主体提供自己权限的证书，客记提供访问自己所需权限的证书，根据主客户体提供的证书及操作做安全性检查。

ABI

1、Application Binary Interface，应用程序二进制接口。即然是接口，那就是某两种东西的沟通桥梁，此处有这种情况：

（1）应用程序 -- 操作系统

（2）应用程序 -- (应用程序所用到的)库

（3）应用程序各个组件之间

类似于API的作用是使得程序的代码的兼容，ABI的目的是使得程序的二进制（级别）的兼容。

2、什么是OABI和EABI

OABI中的O表示“Old”，就是旧的ABI，EABI的E表示Embedded，也叫做GNU EABI，OABI和EABI都专门针对ARM的CPU来说的。

LSM

LSM是Linux Security Module的简称，即Linux安全模块，是一种轻量级通用访问控制框架。

LSM的设计思想：在最少改变内核代码的情况下，提供一个能够成实现强制访问控制模块需要结构都只者接口。对于使用的人来说尽量少引入麻烦，对使用的人来说要带来效率。

秒吧学习