大学课程 | 计算机系统结构精简知识点
计算机系统结构知识点
- 多级层次结构:
(1)按功能划分成多层机器级组成的层次结构,从上到下依次为,应用语言机器级,高级语言机器级,汇编语言机器级,操作系统机器级,传统机器语言机器级,微程序机器级。
(2)机器,被定义为能存储和执行相应语言程序的算法和数据结构的集合体
(3)微程序机器级用硬件实现,传统机器语言机器级用固件实现
(4)固件:具有软件功能的硬件
(5)以软件为主实现的机器称为虚拟机器,由硬件或固件实现的称为实际机器 - 透明性:
(1)客观存在的事物或属性从某个角度看不见 - 翻译与解释
(1)翻译:先用转换程序将高一级机器级上的程序整个
变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技术
(2)解释:在低级机器级上用它的一串语句或指令来仿真高级机器级上的一条语句或指令的功能,是通过对高级的机器级语言程序中的每条语句或指令逐条
解释来实现的技术 - 软硬件逻辑功能等效
(1)概念:软硬件逻辑功能等效是指计算机系统的某功能可以由硬件实现也可以由软件实现,在逻辑功能上是等价的。由硬件实现功能的特点是速度快、增加硬件成本,灵活性低。由软件实现功能的特点是灵活性好、但速度较慢,增加软件设计费用等 - 计算机系统结构、组成与实现的定义及三者之间的关系,以乘法指令为例说明上述三者各自的研究内容
(1)计算机系统结构的定义:对计算机系统中各级界面的定义及其上下的功能分配
(2)计算机组成的定义:计算机系统结构的逻辑实现,包括机器级内部的数据流和控制流的组成以及逻辑设计等
(3)计算机实现:是指计算机组成的物理实现(具体电路,器件的设计,装配技术等等)
(4)三者的关系:三者互不相同,但又相互影响。组成向上决定于结构,向下受限于实现技术。
(5)对于乘法指令,计算机系统结构主要考虑是否要设置乘法指令;而计算机组成主要考虑乘法指令是用专门的高速乘法器还是用加法器和移位器实现;计算机实现主要考虑乘法器,加法器的物理显示,如器件的类型,继承父,数量的确定和选择 - 计算机系统结构的设计思路
(1)“由上往下”设计
,由顶向底。先考虑应用要求,再逐级向下,下一级是对上一级的优化。是一种穿行设计方法,设计周期较长
(2)“由下往上”设计
,由底向顶。先设计底层,再加配操作系统和编译系统,以及设施的系统软件和算法等等。软硬件容易脱节,串行设计,周期长,很少采用
(3)“从中间开始”向两边设计
。一般方法。软硬件并行设计,较好的设计方法 - 软件移植及三种移植技术
(1)软件的可移植性:软件不修改或只经少量修改就可以由一台机器移到另一台机器上允许,同一软件可应用于不同的环境
(2)移植技术:统一高级语言
;采用系列机
;模拟和仿真
- 软件兼容及分类
(1)软件兼容:机器语言程序以及编译程序能不加修改地通用于各档机器
(2)分类:
a. 向上兼容/向下兼容:向上(下)兼容是指,按某党机器编制的软件,不加修改就能运行于比他高(低)档的机器上。
b. 向前兼容/向后兼容:向前(后)兼容是指,按某个时期投入市场的该型号机器上编制的软件,不加修改就能运行于在它之前(后)的投入市场的机器上。
(3)系列机软件必须保证向后兼容,力争向上兼容 - 系列机与兼容机,模拟与仿真
(1)系列机:是具有相同体系结构,但组成和实现不同的一系列不同型号的计算机系统。
兼容机:不同厂家生产的具有相同体系结构的计算机。
(2)模拟:用机器语言程序(在主存)解释实现软件移植的方法;运行速度低,实时性差,模拟程序复杂
仿真:用微程序(在控制寄存器)直接解释另一种机器指令系统的方法;两种系统结构差别较大时,难以仿真
两者的主要区别在于解释用的语言,其次有解释程序的所存位置不同 - 应用与器件对系统结构的影响
(1)应用的发展对结构设计提出范围广泛的要求
(2)器件的发展改变了逻辑设计的传统方法;推动结构和组成前进的关键因素;加速了结构“下移”;促进了算法,语言和软件的发展 - 并行性概念及发展并行性的三种技术途径
(1)并行性:把解题中具有可以同时进行运算或操作的特性称为并行性,并行性包括同时性和并发性
(2)并行性等级:
①按计算机系统执行程序的角度,从低到高:指令内部,指令之间,任务或进程之间,作业或程序之间
②从计算机系统中处理数据的角度来看,从低到高:位串字串,位并字串,位片串字并,全并行
(3)三种技术途径:时间重叠,资源重叠,资源共享
时间重叠:多个处理过程在时间上错开
资源重叠:重复设置硬件资源来提高可靠性和性能
资源共享:多个用户按时间顺序轮流使用同一套资源 - 耦合度概念
(1)耦合度概念:反映多机系统中各机器之间物理连接的紧密度和交叉作用能力
(2)分类:
最低耦合:除存储介质,无物理连接,脱机
松散耦合:通过通道或通信线路互连,磁带,磁盘…
紧密耦合:通过总线或高速开关互连,主存… - 弗林分类法
(1)单指令流单数据流(SISD),传统单处理器计算机
(2)单指令流多数据流(SIMD),阵列处理机和相联处理机
(3)多指令流单数据流(MISD),很少见
(4)多指令流多数据流(MIMD),多级系统 - 数据表示与数据结构
(1)数据表示:能由机器硬件识别和引用的数据类型(数据类型指一类值的集合和可作用于其上的操作集)
(2)数据结构:结构数据类型的组织方式,反映了应用中要用到的各种数据元素或信息单元之间的结构关系
(3)数据结构和数据表示是软硬件的交界面,数据结构是软,数据表示是硬 - 高级数据表示
(1)自定义数据表示:
a). 标识符数据表示
①每个数据带了类型标志位,标识符主要用于指明数据类型,但也可以用域指明所用信息类型。标识符由编译程序建立,对高级语言程序透明。
②优点:简化了指令系统和程序设计;简化了编译程序;便于一致性校验;能由硬件自动变换数据类型;支持数据库系统的实现与数据类型无关的要求;为软件调试和应用软件开发提供了支持,便于程序的跟踪和调试
③缺点:增加程序所占的主存空间;降低指令的执行速度
b). 数据描述符
①描述符和数据分开存放,用于描述所访问的数据是整块的还是单个的,访问该数据块或数据元素所要的地址以及其它信息
②优点:进一步减少标识符所占存储空间
(2)向量,数组数据表示
①有向量数据表示的处理机是向量处理机
②优点:加快形成元素地址,便于实现把向量各元素成块预取到中央处理机,用一条向量,数组指令流水或同事对整个向量,数组进行高速处理
(3)堆栈数据表示
①有堆栈数据表示的处理机是堆栈机器
②通常用于保存子程序调用时的返回地址
③堆栈机器特点:有丰富的堆栈操作指令且功能强大;有力地支持了高级语言程序的编译;有力的支持了子程序的嵌套和递归调用 - 引入数据表示的原则
(1)原则1:看系统的效率是否显著提高,包括实现时间和存储空间是否显著减少。实现时间是否减少又主要看主存和处理机之间传送的信息量是否减少
(2)原则2:看引入这种数据表示后,其通用性和利用率是否提高
(3)原则3:基本的数据表示,也有可挖掘的细节问题
(4)原则4:基本的数据类型必须设 - 浮点数尾数基值的选择与下溢处理方法
(1)浮点数尾数基值的选择
如果小数点的位置事先已有约定,不再改变,此类数称为“定点数”。
如果小数点的位置可变,则称为“浮点数”。
rm :尾数的基
re :阶码的基(re =2)
m: 尾数长度 (注意其含义)
p: 阶码长度
【p表示数的范围大小;尾数的位数m主要影响表示值的精度】
条件:非负阶,规格化,正尾数 | 阶值:二进制p位,尾数:rm进制m’位 | 若p=2,m=4,当rm=2(即m’=4)时 | 若p=2,m=4,当rm=16(即m’=1)时 |
---|---|---|---|
可表示最小尾数值 | rm^(-1) | 1/2 | 1/16 |
可表示最大尾数值 | 1-1×rm^(-m’) | 15/16 | 15/16 |
最大阶值 | 2^p-1 | 3 | 3 |
可表示最小值 | rm^(-1) | 1/2 | 1/16 |
可表示最大值 | rm^(2^p-1)×(1-rm^(-m’)) | 7.5 | 3840 |
可表示的尾数个数 | rm^(m’)×(rm-1)/rm | 8 | 15 |
可表示阶的个数 | 2^p | 4 | 4 |
可表示数的个数 | 2^p×rm^(m’)×(rm-1)/rm | 32 | 60 |
(2)下溢处理方法(对应用程序员,系统程序员透明)
减少运算中的精度损失关键是要处理好运算中尾数超出字长的部分,使精度损失最小
a) 截断法
①方法:将尾数超出机器字长的部分去掉
②以rm=2,m=2为例讨论最大误差:在整数时接近于1(“11:111…1”截断成“11:”);在分数时接近于2^(-m) (“.01:111…1”截断成“.01:”)
③对于正数,如有误差总是负误差
④优点:实现简单,不增加硬件,不需要处理时间
缺点:最大误差较大,且平均误差为负且较大,无法调节,因而已很少使用
b) 舍入法
①方法:在机器运算的规定字长之外增设一位附加位,存放溢出部分的最高位,每当进行尾数下溢处理时,将附加位加1,[整数加0.5,分数加2^(-(m+1))]
②例如:整数:“10:10…0”舍入成“11:” 正误差;分数:“.10:01…0”舍入成“.10:” 负误差
③优点:实现简单,增加的硬件开销少,最大误差小,平均误差接近于零,略偏正
缺点:处理速度慢,需要花费在数的附加位加1以及因此产生进位的时间,最坏情况下,需要从尾数最低位进制
c) 恒置“1”法
①方法:将机器运算的规定字长之最低位恒置“1”
②最大误差:整数为1(如“10:00…0”处理成“11:”);分数为2-m(如“.00:00…0”处理成“.01:”)
③误差有正负:负误差(如“.11:10…1”处理成“.11:”);正误差(如“.00:00…0”处理成“.01:”)
④优点:实现简单,不需要增加硬件和处里时间,平均误差趋于0
缺点:最大误差最大,比截断法还大(接近于1)
⑤多用于中、高速机器中,由于尾数位数比微、小型机器长
d) 查表舍入法
①方法:取尾数p位的最后k-1位和准备舍弃的最高1位,共k位。通过ROM或PLA查表得到k-1位,作为新的尾数p位的最后k-1位
②下溢处理表的内容:当尾数最低k-1位为全”1“时以截断法
设置处理结果;其余情况采用舍入法
③优点:ROM法速度较快,平均误差可调到0;避免再次右规操作
缺点:需要硬件配合,硬件量大
(3)上述4种处理方法中:
最大误差最大的是恒置“1”法,
最大误差最小的是舍入法;
平均误差最大的是截断法;
平均误差可人为调节的是查表舍入法;
下溢处理不需要附加时间开销,即速度最快的是截断法和恒置“1”法,
处理速度最慢的是舍入法;
实现上最花费硬件的是查表舍入法,
最省硬件的是截断法和恒置“1”法。
- 程序在主存中的定位技术
(1)静态再定位:再目的程序装入主存时,由装入程序用软件方法把目的程序的逻辑地址变换成物理地址,程序执行时,物理地址不再改变
(2)动态再定位:在执行每条指令时才形成访存物理地址的方法
①基址寻址:设置基址寄存器和地址加法器硬件,实现逻辑地址到物理地址空间变换的支持
②优越性:地址加法器形成物理地址的速度快于装入程序形成的物理地址速度;具有越界保护措施,如设置上、下界寄存器,判断是否出现地址越界错误
(3)虚实地址映像表:用虚拟存储器增加映像表硬件后,程序空间可以超过实际主存空间,采用基地址寄存器加位移量的方法 - 基址寻址与变址寻址的区别
(1)基址寻址:基址寄存器里的值加上指令格式内的逻辑地址形成物理地址;对逻辑地址空间到物理地址空间变换的支持;通常基址寄存器的内容不变,逻辑地址可变;
(2)变址寻址:变址寄存器的值和指令地址码部分给出的地址之和作为操作数地址;对诸如向量,数组等数据块运算的支持;通常逻辑地址不变,变址寄存器里面的值由用户定义 - 信息按整数边界存储
(1)为了使任何时候所需的信息都只用一个存储周期访问到,要求信息在主存中存放的地址必须是该信息宽度(字节数)的整数倍,防止信息跨主存边界存放
(2)优点:访问周期短;缺点:存储空间浪费 - 哈夫曼压缩思想与指令格式的优化
(1)指令包含操作码和地址码两部分,为了优化指令格式,要使指令的平均字长最短,减少程序总位数以及增加指令字能表示的操作信息和地址信息
(2)哈夫曼压缩思想:当各种时间发生的概率不均等时,对发生概率最高的事件用最短的位数(时间)来表示(处理),而对出现概率较低的事件允许用较长的位数(时间)来表示(处理),就会使表示(处理)的平均位数(时间)缩短
(3)扩展操作码编码 - CISC与RISC的常用技术
(1)CISC(复杂指令系统计算机):进一步增强原有指令的功能以及设置更为复杂的新指令,取代原先由软件子程序完成的功能,实现软件功能的硬化;
a)面向目标程序的优化实现改进
①途径1:对大量已有机器的机器语言程序及其执行情况进行统计各种指令和指令串的使用频度来加以分析和改进。
使用频度分为静态使用频度
(程序中统计出的指令及指令串的使用频度称为静态使用频度。着眼于减少目标程序所占用的存储空间)和动态使用频度
(目标程序执行过程中对指令和指令串统计出的频度称为动态使用频度。着眼于减少目标程序的执行时间)
②途径2:增设强功能复合指令来取代原先由常用宏指令或子程序实现的功能,由微程序解释实现,不仅大大提高了运算速度,减少了程序调用的额外开销,也减少了子程序所占的主存空间。
b)面向高级语言的优化实现改进
①目的:缩短高级语言和机器语言的语义差距,支持高级语言编译,缩短编译程序长度和时间
②途径1:通过对源程序中各种高级语言语句的使用频度进行统计来分析改进
③途径2:如何面向编译,优化代码生成来改进
④途径3:改进指令系统,使它与各种语言间的语义差距都有同等的缩小
⑤途径4:让机器具有分别面向各种高级语言的多种指令系统,多种系统结构的面向问题动态自寻优的计算机系统
⑥途径5:发展高级语言计算机(或称高级语言机器)
c)面向操作系统的优化实现改进
①目的:通过缩短操作系统与计算机系统结构之间的语义差距,来进一步减少运行操作系统的时间和节省操作系统软件所占用的存储空间
②途径1:通过对操作系统中常用指令和指令串的使用频度进行统计分析来改进
③途径2:考虑如何增设专用于操作系统的新指令
④途径3:把操作系统中频繁使用的,对速度影响大的机构型软件子程序硬化或固化,直接用硬件或微程序解释实现
⑤途径4:发展让操作系统由专门的处理机来执行的功能分布处理系统结构
d) CISC的问题:指令系统庞大;许多质量操作繁杂,执行速度很低;编译程序太长,太复杂;部分指令利用率很低
(2)RISC(精简指令系统计算机):通过减少指令种数和简化指令功能来降低硬件设计的复杂度,提高指令的执行速度
a) RISC的基本技术
①按照设计RISC一般原则来设计
②逻辑实现采用硬联和微程序相结合
③在CPU中设置大量工作寄存器并采用重叠寄存器窗口
④指令用流水和延迟转移
⑤采用高速缓冲寄存器cache,设置指令cache和数据cache分别存放指令和数据
⑥优化设计编译系统
b) RISC的问题
①指令少,加重汇编语言程序设计的负担,增加了机器语言程序的长度,占用存储空间多,加大了指令的信息流量
②对浮点运算和虚拟存储器支持不足
③RISC机器的编译程序比CISC的难写 - 总线的分类
(1)按在系统中的位置分为芯片级
,板级
,系统级
(2)按允许信息传送方向分为单向传输
,双向传输(半双向和全双向)
(3)按用法分为专用
和非专用
- 总线的控制技术及通讯技术
(1)控制技术
a) 集中式控制
①优先次序的确定方法:串行链接,定时查询,独立请求
②串行链接获得使用总线权优先次序由“总线可用”线所接不见的物理位置决定,离总线控制器越近,优先级越高;三根总线,总线忙,总线可用,总线请求
③定时查询:查询线上计数值与发出请求的部件号是否一致;总线忙+总线请求+「logn「个定时查询计数线=2+「logn「
④独立请求:1根总线已被分配线+每个部件各有一对总线请求和总线准许线=2×N+1
b) 分布式控制
(2)通讯技术
a) 同步通信:定宽,定距的系统时标同步
b) 异步通信:
分为单向控制(分为单向源控和单向目控)和请求/回答双向控制(分为源控式(互锁和非互锁)和目控) - 中断响应优先级与中断处理程序优先级及分析过程
(1)基本概念:
中断:CPU中止正在执行的程序,转去处理随机提出的请求,待处理完后,再回到预先被打断的程序继续恢复执行的过程
中断系统:相应和处理各种中断的软硬件总体称为中断系统
中断分为内部中断(CPU内的异常引起),外部中断(由中断信号引起)和软件中断(由自陷指令引起);外部中断又分为可屏蔽中断和不可屏蔽中断
中断源:引起中断的各种事件
中断请求:中断源向中断系统发出请求中断的申请
中断响应:允许中断CPU现行程序的运行,转去对该请求进行预处理,包括保存好断电及其现场,调出有关处理该中断的中断服务程序,准备运行(交换新旧程序状态字PSW)
中断现行程序细分为中断(可屏蔽)和异常(不可屏蔽,如自陷,故障,失败)
(2)中断分级
机器校验(第1级),程序性中断和管理程序调用(第2级),外部中断(第3级),输入/输出(第4级),重新启动(最低级)
(3)中断的响应次序与处理次序
中断级屏蔽位寄存器
本级对本级屏蔽
中断响应次序,中断处理完成次序,中断处理次序
(4)通道程序结束引起的中断属于I/O中断;
访管中断属于第2级; - 通道的工作原理及三类通道的流量计算
(1)通道的工作原理:用户只能再目态程序中安排要求输入输出的广义指令,然后进入相应管理程序执行这些输入输出管态指令
a) 目态和管态:
管态又叫特权态,系统态或核心态。CPU在管态下可以执行指令系统的全集。通常,操作系统在管态下运行。
目态又叫常态或用户态。机器处于目态时,程序只能执行非特权指令。
从目态转换为管态的唯一途径是中断。
从管态到目态可以通过修改程序状态字来实现,这将伴随这由操作系统程序到用户程序的转换。
启动I/O指令属于管态指令
(2)三类通道:字节多路
,数组多路
和选择通道
通道流量和通道工作方式,数据传送期内选择一次设备的时间Ts,传送一个字节的时间Td有关
通道的极限流量:
fmaxbyte=1/(Ts+Td)
fmaxblock=K/(Ts+K×Td)
fmaxselect=N/(Ts+N×Td)
设备要求通道的实际最大流量只有小于等于通道所能达到的极限
工作周期小的不能挂载 - 存储器的性能指标
(1)容量Sm:存储器的位数或总字节数
Sm=W×L×m (W:存储体的字长,L每个存储体的字数,m并行工作存储体的个数)
(2)速度
访问时间Tn,存储周期Tm,频宽Bm
(3)价格
总价格C,每位价格c
同等容量下,存储器的访问速度由高到低:双极型→MOS→电荷耦合型→磁泡→定位磁盘→动头磁盘→磁带 - 单体多字、多体单字与多体多字
(1)并行主存系统的三种模式:单体多字,多体单字,多体多字 - 存储器系统、并行存储体系与存储层次
(1)存储系统:存储系统是指计算机中由存放程序和数据的各种存储设备、控制部件及管理信息调度的设备(硬件)和算法(软件)所组成的系统。
(2)存储体系(存储层次):构成存储系统的几种不同的存储器之间,配上辅助软硬件或辅助硬件,使之从应用程序员来看,在逻辑上是一个整体
基本的二级存储体系:虚拟存储器和Cache存储器(主存-辅存存储层次)
Cache存储器对于应用程序员和系统程序员都是透明的
(3)并行主存系统:可以并行读出多个CPU字的单体多字,多体单字,,多体多字的交叉存储主存系统 - 虚拟存储器与高速缓冲存储器
(1)在具有层次结构存储器的计算机系统中,增设地址映像表机构来实现程序在主存中的定位,自动实现部分装入和部分替换功能,能从逻辑上为用户提供一个比物理贮存容量大得多,可寻址的“主存储器”。虚拟存储区的容量与物理主存大小无关,而受限于计算机的地址结构和可用磁盘容量。
(2)存储管理方式:段式,页式,段页式 - 段式存储管理与页式存储管理技术
(1)段式管理:将主存按段分配的存储管理方式
首先分配算法
最佳分配算法
(2)页式管理:将主存空间和程序空间都机械等分成固定大小的页
(3)段页式管理:将主存机械等分成固定大小的页,程序按模块分段,每个段又分为和主存页面大小相同的页 - 地址的映像与变换
(1)地址的映像:将每个虚存单元按什么规则(算法)装入(定位于)主存,建立起多用户虚地址N和贮存地址n之间的对应关系
(2)地址变换:是指程序按照映像关系装入实存后,在执行中,如何将多用户虚地址N变换成对应的实地址 - 全相联映像、直接相联映像与组相联映像
(1)Cache的全相联映像:主存中任意一块都可映像装入到Cache中任意一块位置
(2)Cache的直接相联映像:把主存空间按Cache大小等分成区,每区内的各块只能映像到Cache中唯一一个特定块位置
(3)Cache的组相联映像:将Cache和贮存空间先分成若干个组,共有2^n个组。Cache中多有的组构成Cache的唯一一个区。而主存则分成与Cache同样大小的2^(nd)个区 - 常用替换算法
(1)随机算法:RAND,随机产生页号,命中率低,不采用
(2)先进先出算法:FIFO,选择最早装如主存的页作为被替换的页
(3)近期最少使用算法:LRU,选择近期最少访问的页作为被替换的页
(4)优化替换算法:OPT,将未来的近期内不用的页替换出去的算法,有较高的主存命中率,但是不太现实
(5)页面失效频率法(动态算法):PFF,根据各道程序运行中的主存页面失效率的高低,由操作系统来动态操控 - 堆栈型替换算法
(1)堆栈型替换算法:任何时刻t,在n个实页中的虚页集合总是被包含在给其增加一个实页,即n+1个实页时,在实存中的虚页集合之内的
(2)堆栈型替换算法,命中率H随着主存页数n的增减单调上升,至少不下降。
LRU替换算法属于堆栈型替换算法,操作:将刚访问过的页号置于栈顶,最久未被访问过的页号置于栈底 - 重叠与流水的区别
(1)重叠解释方式:在解释第K条指令的操作完成之前,就开始解释第K+1条指令
(2)重叠和流水的区别:依次重叠时把一条指令的解释分为两个子程序,而流水是分为更多个子过程 - 流水线中的各种相关及解决方案
(1)局部性相关:指的是在机器同时解释的多条指令之间出现了对同一主存单元或寄存器要求“先写后读”;包括指令相关
,访存操作数相关
和通用寄存器组相关
等;
a)指令相关:包含寄存器相关(包括数据相关和名字相关)和控制相关
b)主存空间数相关:相邻两条指令之间出现要求对同一主存单元先写入而后再读出的关联
解决方法:推后读
(2)全局性相关:已进入流水线的转移指令(尤其时条件转移指令)和后续指令之间的相关 - 流水线的分类及三个性能指标的计算方法
(1)流水线分类:
按处理级别:部件级,处理机级,系统级
按具有的功能多少:单功能流水线,多功能流水线
按多功能流水线的各段能否允许同时用于多种不同功能连接流水:静态流水线,动态流水线
按机器所具有的数据表示:标量流水机和向量流水机
按各功能段间是否有反馈电路分为:线性流水和非线性流水
按信息流动控制方式:顺序流动流水线,异步流动流水线
(2)三个性能指标
a) 吞吐率Tp :流水线单位时间里能流出的任务数或结果数
Tpmax = 1/max{各个子过程的时间}
Tp = n/(m×▲t+(n-1)×▲t) :m段流水线,各段时间为▲t,完成n个任务的解释共需要时间m×▲t+(n-1)×▲t
b) 加速比Sp :流水线方式相对于非流水线顺序方式速度提高的比值
c) 效率η:流水线设备的时间利用率,设备实际使用时间占整个设备运行时间的比值
(3)消除瓶颈:
①瓶颈子过程再细分
②重复设置多套瓶颈段并联 - 单功能非线性流水线的调度技术