微機原理與系統設計筆記2 | 8086CPU結構與功能

打算整理彙編語言與介面微機這方面的學習記錄。本部分講解8086CPU的結構和基本功能以及特性。參考資料西電《微機原理與系統設計》周佳社西交《微機原理與介面技術》課本《彙編語言與介面技術》王讓定小甲魚《彙編語言》 1. 微處理器的外部結構 1.1 引腳外部結構就是封裝出來的輸入輸出引腳。8 ...

打算整理彙編語言與介面微機這方面的學習記錄。本部分講解8086CPU的結構和基本功能以及特性。
參考資料
- 西電《微機原理與系統設計》周佳社
- 西交《微機原理與介面技術》
- 課本《彙編語言與介面技術》王讓定
- 小甲魚《彙編語言》

1. 微處理器的外部結構

1.1 引腳

外部結構就是封裝出來的輸入輸出引腳。8086/8088有40個引腳。

8086片內片外的數據匯流排都是16位

8088片內16位，而片外8位

如此前緒論所說，部分引腳專用，部分引腳復用，復用部分需要掌握其時序。

CPU的這些引腳功能：

與存儲器之間交換信息
與I/O設備（介面）之間交換信息
輸入輸出必要的信息

1.2 控制引腳

舉個例子講解一下這些引腳：

當CPU向外部（存儲器/IO介面）寫數據時，上圖的WR引腳應為有效（低電平）

RD是讀信號。
而區分操作存儲器和I/O介面的是M/IO引腳
在此基礎上可以設計邏輯電路來控制更具體的事情，比如WR和M/IO連接一個或門，就能產生IOW信號等。

1.3 地址引腳

A. 定址空間

8086CPU有20條地址線A₁₉_{A<sub>16</sub>、A<sub>15</sub>}A₀，可以定址\(2^{20}\)位元組的空間，也就是1M空間，地址空間大小為1MB。

B. IO埠的概念

操作系統設計過程中，外設部分經常提及埠，這裡正經回憶一下。
外設的狀態存儲在介面電路中的埠寄存器，如果CPU沒有與介面通信，則埠寄存器保持高阻態，不向外/內輸出、輸入。
當地址匯流排上的地址是某介面埠寄存器的地址（選中）時，其中信息通過數據匯流排流入CPU。

匯流排競爭：多個設備埠同時激活。

埠如下圖右下角部分所示：

數據輸入埠
命令埠
狀態輸入埠

具體而言，外設晶元是有手冊的，當我們操作顯卡，就要查VGA相關的手冊，滑鼠和鍵盤就有另一個晶元來管理。

手冊上會詳細說明埠的作用，在程式中用指令向埠賦值即可。

C. 統一編址與獨立編址

上面提到，一個IO埠至少占用一個IO地址----IO埠地址。根據埠地址和存儲器是否一起編址，有：

統一編址
- 缺點：浪費了存儲器的空間。
- 優點：IO驅動程式編寫方便，靈活。
- 例：51系列。
獨立編製
- 優點：節約存儲器的空間。
- 缺點：要多記憶操作IO的指令，IO編程不靈活。
- 例：8086。
- x86的IO訪存指令為 in/out
舉個例子

某個I/O埠的地址為2000H，則訪問如果要輸出數據到該埠，彙編語言應該這樣寫：
```
mov AL,01H
;這裡是要輸出的數據量，僅是一個參考
;該課程中這裡要點一個燈
mov DX,2000H
mov DX,AL
;註意這裡跟存儲器的並不同，沒有中括弧
```

2. 微處理器的內部結構

2.1 作用

2.2 結構

不論CPU型號如何，其內部基本都有以下結構：

ALU：必須，算術邏輯運算
地址寄存器可以充當數據寄存器

數據寄存器不能充當地址寄存器
控制器：負責取指令，放在指令寄存器中，解碼
I/O控制邏輯：與外部I/O打交道，使得CPU可以響應I/O設備發出的中斷請求。

2.3 控制器講解

這部分要與其實跟計組沒多大差別了，要結合CPU"取指執行"的思想來理解。

學到這裡突然想複習流水線 Verilog 什麼的了。

因為上面的圖還是很籠統，怎麼判斷、怎麼控制時序都還沒有涉及。先忍住，把介面部分學完。

上圖並不完整，如果從存儲器中取出的是數據data而不是指令 instructions ，則直接放入數據寄存器或者指定寄存器（也不屬於控制器的範疇了）

2.4 堆棧

來自計操的補充：

說堆特指堆

說堆棧指的是棧

堆棧在存儲器空間中，大小和位置都是編程自定義的。
8086中堆棧必須按字操作

堆棧操作的代表性指令是

push ax
pop ax
;如果是8086的按字操作規定，目的寄存器就不能是AL

堆棧基址寄存器:sp，初始置向棧底+1(也就是棧底再向下的一個存儲單元)，這個位置是程式設定的。
假如執行以下操作：
```
push ax;第1步
push bx;第2步
```
第1步中，sp先-2空出一個字，然後AX分高低八位分別存入這個空字的高低存儲單元。

第2步重覆第1步操作。

如果要pop堆棧中的值，則是上述逆過程，先取出棧頂的值，再sp+2。
堆棧溢出：
- 當一直push，向堆棧區域增加數據，超過堆棧分配空間（超過最高棧頂），則溢出
- 當一直pop，超過棧底，則溢出。
- 堆棧溢出會造成系統crush。

3. 8086/8088CPU 內部結構

2.3節講解的是處理器的工作思路，或是說 “取指執行”的電腦思想。下麵介紹8086CPU的內部結構（仍然符合2.3節的大致思路）。

3.1 BIU

有一個問題，地址匯流排20位，意味著可以定址1MB地址空間；而CPU內部寄存器只有16位。

如何用16位寄存器存放20位的地址信息呢？
8086的設計是：講存儲器分為邏輯段，一個寄存器負責定址段，一個寄存器負責定址段內空間，也就是一個段內最多64KB（\(2^{16}\)byte）空間。
各種段基址寄存器以及指令寄存器就在上圖BIU右上角
這裡的轉化的具體過程就是在上圖的地址產生與匯流排控制單元進行的。
轉化公式為：

CS:IP(CS左移4位+IP)，也就是

(CS << 4) + IP
BIU右下角的指令隊列充當的是2.3節的IR指令寄存器的角色，8086中有6個位元組，8088中4個位元組。

這是兩個CPU內部結構唯一的區別。

總結，BIU負責外部存儲器取出指令、取出數據，並將取出的指令放入指令隊列，對應 “取指”。數據通過ALU匯流排直接送入EU。

3.2 EU

總結放在前面：負責從指令隊列中獲取指令，對該指令解碼並執行，對應“執行”。

這裡可以看出，指令隊列的存在，可以使得兩個部分的性能都得到提升。

而外部匯流排在上圖過程中始終處於忙狀態，匯流排的使用率也上升。

4. 8086的寄存器組織

8086內部共有14個16位寄存器:

通用寄存器（EU左上角）
- 數據寄存器 4個
  - AX,BX,CX,DX
  - 各個寄存器又有特殊功能，但是給我的印象不深：
    - AX—累加器（特殊功能）| AH AL
    - BX—基址寄存器（特）—段內的–DS段的
    - CX—計數器
    - DX—數據寄存器（IO）
- 它們又都可以分為XH和XL。
地址指針寄存器與變址寄存器
- 地址指針寄存器
  - SP:堆棧指針寄存器
  - BP:地址指針寄存器
    BP與BX在做地址指針時的區別：
```
mov BX,002H
mov BP,002H
mov AL,34H
mov [BX],AL;1
mov [BP],AL;2
```
    1處AL值預設放到了數據段的BX偏移處，2處AL值預設放到了堆棧段的BP偏移處。
    
    如果要使它們不預設，可以將上面代碼表示地址的中括弧內加上它們的目的段基址寄存器如：
```
mov SS:[BX],AL
;此時BX表示堆棧偏移
mov DS:[BP],AL
;此時BP表示數據段偏移
```
- 變址寄存器
  - SI：源變址寄存器
  - DI：目的變址寄存器
  - 找到的都是DS段的地址
  - 變址寄存器中“變”的概念來自於8086對字元串的處理。
    
    具體涉及8086指令系統中的字元串操作指令。
    
    如將字元串搬運到存儲器另一個位置，源字元串的位置需要定義在DS:SI，目的字元串的位置定義在DS:DI。
    
    DS:SI==(DS<<4)+SI
    
    當使用movsb或movsw（無操作數指令），自動從源字元串搬運到目的字元串。（兩者的區別是按位元組搬運和按字搬運）
    
    在這個字元串操作過程中，DI和SI是在自動增加的，所以其名字中的“變”不言而喻。
    
    當DI和SI像BP一樣進行普通數據段操作時，不會自己增加。
段寄存器
- 8086彙編程式結構分為若幹邏輯段，彙編後放到存儲器的不同段。
- CS：代碼段基址寄存器
- DS：數據段基址寄存器
- ES：附加數據段基址寄存器
- SS：堆棧段基址寄存器
- 在代碼段開始時，賦值DS ES SS，使其符合自己安排的位置，而CS由操作系統安排。
  
  所以不會出現mov CS,AX
  
  突然感覺這個原理有點古董。
控制寄存器
- IP：指令指針寄存器，相當於2.3節的程式計數器PC
  
  代碼段的偏移地址
- PSW：處理器狀態字寄存器，設置9個狀態位。
  
  6個狀態位表達ALU運算後的程式狀態。
  
  控制標誌：控制CPU的運行狀態
  - DF方向控制，在字元串操作中，DF0，變址寄存器SI DI自增；DF1，SI DI自減
    
    即控制SI DI的變化方向
  - IF中斷允許標誌，IF=1時，CPU可以響應可屏蔽中斷請求（也就是外部中斷）；IF=0時，CPU不響應中斷請求。
    
    中斷是操作系統中很重要的概念，開中斷和閉中斷的指令為sti cli
  - TF陷阱標誌/單步標誌：TF=1時，CPU處於單步執行方式，每次執行一條指令自動執行一次特定的內部中斷，具體應用就是Debug。
- 彙編語言中的pushF表示將PSW標誌寄存器壓棧，popF表示將棧頂出給PSW

5. 8086存儲器和IO組織地址空間

5.1 地址空間

地址線：A19-A16，A15-A10，A9-A0
8086給存儲器編址20根地址線，IO16根地址線（A0~A15）
在早期IBM pc機中，給IO分配A9-A0地址線來定址1KB空間，
- 前512B：為主板上的IO分配地址（000H-1FFH）
- 後512B：給插件板上的IO分配地址（200H-3FFH）

5.2 數據存放格式

三種格式：位元組型、字型、雙字型
位元組型數據：

一個位元組型數據對應一個地址單元。

彙編語言設計中，位元組型數據定義在存儲器中的DS段，具體用DB這個偽指令來定義

偽指令用於彙編器如何來翻譯彙編代碼。
字型數據：

對應兩個相鄰的地址單元。

定義偽指令為DW，如將字型數據5678H放入存儲器0003H和0004H位置，則78H放在字的低地址0003H，56放在字的高地址0004H。

這裡有一個對準和不對準的問題。如果字數據地址為奇地址，則稱為未對準，偶地址則對準（比如上面的例子就是未對準）

對準的數據進行訪存指令花費時間更短。未對準會多花費一個時間周期，這與數據匯流排的傳輸機制有關。

為了防止自己腦袋忘記，提示：對準情況下，高位元組對應高地址，地址單元為奇，走高八位數據線（一個是線，一個是位元組）
雙字型數據：

對應兩個字，也就是4個存儲單元。

定義偽指令為DD。

在彙編語言中使用[BX /BP/ SI/ DI]，是指寄存器所存的內容，也就是地址；使用BX BP SI DI—指的是寄存器本身。

5.3 存儲器的分段與物理地址的形成

為什麼要分段
- 已經在前面提到過了：寄存器16位而地址線20根。
如何分段：
- 一個邏輯段最大64K，每個邏輯段的起始地址必須可以被16整除
  
  因此理論上講，1MB的地址空間，可以分64K(\(2^{16}\))個邏輯段，正好是16位寄存器可以描述的。
物理地址
- 這個上面3.1部分也提到過，要從段基址（段的起始地址）+段偏移的形式重新得到真實的物理地址。
- 物理地址的唯一性：
  
  由於段相互有疊加（按照被16整除的判斷標準），所以一個單元的邏輯地址只是可能不同。但是物理地址一定不同，物理地址是站在存儲器全局為每個單元分配的門牌號。
  
  雖然段在理論上（按16整除）會重疊，但實際上，彙編源程式是自己定義的各個段，操作系統分別將其裝入記憶體，不會發生段覆蓋的情況。
- 編程、調試都是邏輯地址
物理地址（PA）的形成

也就是上面3.1節的轉化公式。

物理地址=段基址X16（16進位左移一位）+段內偏移地址（段內有效地址）。
取指令
- CPU如何實現取指令？
- CS:IP
  
  即 CS(段基地址)X16+IP(段內偏移地址)，取指令所存儲的物理地址
  
  接著8086按照計算後的物理地址去存儲器找指令取出。
  
  課程這裡（11講21分鐘時）提到了無條件跳轉，老師講的是代碼段間的無條件跳轉。
  
  據我所知，這部分比較複雜，老師估計是想強調一下cs:ip的存儲器取指特性，所以具體的後續再提。
  
  特性：CS和IP是用戶不可寫入的，CS是操作系統將代碼從磁碟放入記憶體後初始化的，IP不可寫入但是會改變，除了自增外還會跳轉。
- 為了更明確說明物理地址的形成，再舉一個例子，存儲器寫操作:
```
mov [bx],ax
```
  這就是將ax中的值寫入ds:bx中去，如果硬要扯一下第3部分EU BIU的知識，那就是EU先將16位地址BX沿內部數據匯流排傳送到BIU，BIU停下取指操作，配合EU去進行寫存儲器的操作，BIU將BX放到加法器中產生物理地址，輸出20位物理地址後放到地址線，AX值放到數據線。
  
  如果對齊，一個時間周期完成；如果不對齊，兩個時間周期。
- 堆棧操作(SS:SP)，跟上述過程相似。