在线欧美中文亚洲精品,黑人一区二区三区啪啪网站,97超清视频在线观看

我們每個程序員或許都有一個夢，那就是成為大牛，我們或許都沉浸在各種框架中，以為框架就是一切，以為應(yīng)用層才是最重要的，你錯了。在當(dāng)今計(jì)算機(jī)行業(yè)中，會應(yīng)用是基本素質(zhì) ，如果你懂其原理才能讓你在行業(yè)中走的更遠(yuǎn)，而計(jì)算機(jī)基礎(chǔ)知識又是重中之重。下面，跟隨我的腳步，為你介紹一下計(jì)算機(jī)底層知識。
01 CPU
還不了解 CPU 嗎？現(xiàn)在就帶你了解一下 CPU 是什么
CPU 的全稱是Unit ，它是你的電腦中最硬核的組件，這種說法一點(diǎn)不為過。CPU 是能夠讓你的計(jì)算機(jī)叫計(jì)算機(jī)的核心組件，但是它卻不能代表你的電腦，CPU 與計(jì)算機(jī)的關(guān)系就相當(dāng)于大腦和人的關(guān)系。CPU 的核心是從程序或應(yīng)用程序獲取指令并執(zhí)行計(jì)算。此過程可以分為三個關(guān)鍵階段：提?。?飴牒橢蔥?。CPU從系統(tǒng)的主存中提取指令，然后解碼該指令的實(shí)際內(nèi)容，然后再由 CPU 的相關(guān)部分執(zhí)行該指令。
CPU 內(nèi)部處理過程
下圖展示了一般程序的運(yùn)行流程（以 C 語言為例），可以說了解程序的運(yùn)行流程是掌握程序運(yùn)行機(jī)制的基礎(chǔ)和前提。
在這個流程中，CPU 負(fù)責(zé)的就是解釋和運(yùn)行最終轉(zhuǎn)換成機(jī)器語言的內(nèi)容。
CPU 主要由兩部分構(gòu)成：控制單元和算術(shù)邏輯單元（ALU）
CPU 是計(jì)算機(jī)的心臟和大腦，它和內(nèi)存都是由許多晶體管組成的電子部件。它接收數(shù)據(jù)輸入，執(zhí)行指令并處理信息。它與輸入/輸出（I / O）設(shè)備進(jìn)行通信，這些設(shè)備向 CPU 發(fā)送數(shù)據(jù)和從 CPU 接收數(shù)據(jù) 。
從功能來看，CPU 的內(nèi)部由寄存器、控制器、運(yùn)算器和時鐘四部分組成，各部分之間通過電信號連通。
CPU 是一系列寄存器的集合體
在 CPU 的四個結(jié)構(gòu)中，我們程序員只需要了解寄存器就可以了，其余三個不用過多，為什么這么說？因?yàn)槌绦蚴前鸭拇嫫髯鳛閷ο髞砻枋龅?。
不同類型的 CPU，其內(nèi)部寄存器的種類，數(shù)量以及寄存器存儲的數(shù)值范圍都是不同的。不過，根據(jù)功能的不同，可以將寄存器劃分為下面這幾類
種類功能累加寄存器存儲運(yùn)行的數(shù)據(jù)和運(yùn)算后的數(shù)據(jù) 。標(biāo)志寄存器用于反應(yīng)處理器的狀態(tài)和運(yùn)算結(jié)果的某些特征以及控制指令的執(zhí)行。程序計(jì)數(shù)器程序計(jì)數(shù)器是用于存放下一條指令所在單元的地址的地方 ?；芳拇嫫?存儲數(shù)據(jù)內(nèi)存的起始位置變址寄存器存儲基址寄存器的相對地址通用寄存器存儲任意數(shù)據(jù) 指令寄存器儲存正在被運(yùn)行的指令，CPU內(nèi)部使用，程序員無法對該寄存器進(jìn)行讀寫棧寄存器存儲棧區(qū)域的起始位置
其中程序計(jì)數(shù)器、累加寄存器、標(biāo)志寄存器、指令寄存器和棧寄存器都只有一個，其他寄存器一般有多個。
下面就對各個寄存器進(jìn)行說明
程序計(jì)數(shù)器
程序計(jì)數(shù)器( )是用來存儲下一條指令所在單元的地址。
程序執(zhí)行時，PC的初值為程序第一條指令的地址，在順序執(zhí)行程序時，控制器首先按程序計(jì)數(shù)器所指出的指令地址從內(nèi)存中取出一條指令，然后分析和執(zhí)行該指令，同時將PC的值加1指向下一條要執(zhí)行的指令。
我們還是以一個事例為準(zhǔn)來詳細(xì)的看一下程序計(jì)數(shù)器的執(zhí)行過程
這是一段進(jìn)行相加的操作，程序啟動，在經(jīng)過編譯解析后會由操作系統(tǒng)把硬盤中的程序復(fù)制到內(nèi)存中，示例中的程序是將 123 和 456 執(zhí)行相加操作，并將結(jié)果輸出到顯示器上。
地址 0100 是程序運(yùn)行的起始位置。等操作系統(tǒng)把程序從硬盤復(fù)制到內(nèi)存后，會將程序計(jì)數(shù)器作為設(shè)定為起始位置 0100，然后執(zhí)行程序，每執(zhí)行一條指令后，程序計(jì)數(shù)器的數(shù)值會增加1（或者直接指向下一條指令的地址），然后，CPU 就會根據(jù)程序計(jì)數(shù)器的數(shù)值，從內(nèi)存中讀取命令并執(zhí)行，也就是說，程序計(jì)數(shù)器控制著程序的流程。
條件分支和循環(huán)機(jī)制
高級語言中的條件控制流程主要分為三種：順序執(zhí)行、條件分支、循環(huán)判斷三種，順序執(zhí)行是按照地址的內(nèi)容順序的執(zhí)行指令。條件分支是根據(jù)條件執(zhí)行任意地址的指令。循環(huán)是重復(fù)執(zhí)行同一地址的指令。
下面以條件分支為例來說明程序的執(zhí)行過程（循環(huán)也很相似）
程序的開始過程和順序流程是一樣的， CPU 從0100處開始執(zhí)行命令，在0100和0101都是順序執(zhí)行，PC 的值順序+1，執(zhí)行到0102地址的指令時，判斷0106寄存器的數(shù)值大于0 ，跳轉(zhuǎn)（jump）到0104地址的指令，將數(shù)值輸出到顯示器中，然后結(jié)束程序，0103 的指令被跳過了，這就和我們程序中的 if() 判斷是一樣的，在不滿足條件的情況下，指令會直接跳過。所以 PC 的執(zhí)行過程也就沒有直接+1，而是下一條指令的地址。
標(biāo)志寄存器
條件和循環(huán)分支會使用到 jump（跳轉(zhuǎn)指令），會根據(jù)當(dāng)前的指令來判斷是否跳轉(zhuǎn)，上面我們提到了標(biāo)志寄存器，無論當(dāng)前累加寄存器的運(yùn)算結(jié)果是正數(shù)、負(fù)數(shù)還是零，標(biāo)志寄存器都會將其保存
CPU 在進(jìn)行運(yùn)算時，標(biāo)志寄存器的數(shù)值會根據(jù)當(dāng)前運(yùn)算的結(jié)果自動設(shè)定，運(yùn)算結(jié)果的正、負(fù)和零三種狀態(tài)由標(biāo)志寄存器的三個位表示。標(biāo)志寄存器的第一個字節(jié)位、第二個字節(jié)位、第三個字節(jié)位各自的結(jié)果都為1時，分別代表著正數(shù)、零和負(fù)數(shù) 。
CPU 的執(zhí)行機(jī)制比較有意思，假設(shè)累加寄存器中存儲的 XXX 和通用寄存器中存儲的 YYY 做比較，執(zhí)行比較的背后，CPU 的運(yùn)算機(jī)制就會做減法運(yùn)算。而無論減法運(yùn)算的結(jié)果是正數(shù)、零還是負(fù)數(shù)，都會保存到標(biāo)志寄存器中。結(jié)果為正表示 XXX 比 YYY 大，結(jié)果為零表示 XXX 和 YYY 相等，結(jié)果為負(fù)表示 XXX 比 YYY 小。程序比較的指令，實(shí)際上是在 CPU 內(nèi)部做減法運(yùn)算。
函數(shù)調(diào)用機(jī)制
接下來，我們繼續(xù)介紹函數(shù)調(diào)用機(jī)制，哪怕是高級語言編寫的程序，函數(shù)調(diào)用處理也是通過把程序計(jì)數(shù)器的值設(shè)定成函數(shù)的存儲地址來實(shí)現(xiàn)的。函數(shù)執(zhí)行跳轉(zhuǎn)指令后，必須進(jìn)行返回處理，單純的指令跳轉(zhuǎn)沒有意義，下面是一個實(shí)現(xiàn)函數(shù)跳轉(zhuǎn)的例子
圖中將變量 a 和 b 分別賦值為 123 和 456，調(diào)用 MyFun(a,b) 方法，進(jìn)行指令跳轉(zhuǎn) 。圖中的地址是將 C 語言編譯成機(jī)器語言后運(yùn)行時的地址，由于1行 C 程序在編譯后通常會變?yōu)槎嘈袡C(jī)器語言，所以圖中的地址是分散的。在執(zhí)行完 MyFun(a,b)指令后，程序會返回到 MyFun(a,b) 的下一條指令，CPU 繼續(xù)執(zhí)行下面的指令。
函數(shù)的調(diào)用和返回很重要的兩個指令是 call 和指令，再將函數(shù)的入口地址設(shè)定到程序計(jì)數(shù)器之前，call 指令會把調(diào)用函數(shù)后要執(zhí)行的指令地址存儲在名為棧的主存內(nèi) 。函數(shù)處理完畢后，再通過函數(shù)的出口來執(zhí)行指令。指令的功能是把保存在棧中的地址設(shè)定到程序計(jì)數(shù)器。MyFun 函數(shù)在被調(diào)用之前，0154 地址保存在棧中，MyFun 函數(shù)處理完成后，會把 0154 的地址保存在程序計(jì)數(shù)器中。這個調(diào)用過程如下
在一些高級語言的條件或者循環(huán)語句中，函數(shù)調(diào)用的處理會轉(zhuǎn)換成 call 指令，函數(shù)結(jié)束后的處理則會轉(zhuǎn)換成指令。
通過地址和索引實(shí)現(xiàn)數(shù)組
接下來我們看一下基址寄存器和變址寄存器，通過這兩個寄存器，我們可以對主存上的特定區(qū)域進(jìn)行劃分，來實(shí)現(xiàn)類似數(shù)組的操作，首先，我們用十六進(jìn)制數(shù)將計(jì)算機(jī)內(nèi)存上的–的地址劃分出來。那么，凡是該范圍的內(nèi)存地址，只要有一個 32 位的寄存器，便可查看全部地址。但如果想要想數(shù)組那樣分割特定的內(nèi)存區(qū)域以達(dá)到連續(xù)查看的目的的話，使用兩個寄存器會更加方便。
例如，我們用兩個寄存器（基址寄存器和變址寄存器）來表示內(nèi)存的值
這種表示方式很類似數(shù)組的構(gòu)造，數(shù)組是指同樣長度的數(shù)據(jù)在內(nèi)存中進(jìn)行連續(xù)排列的數(shù)據(jù)構(gòu)造。用數(shù)組名表示數(shù)組全部的值，通過索引來區(qū)分?jǐn)?shù)組的各個數(shù)據(jù)元素，例如: a[0] – a[4]，[]內(nèi)的 0 – 4 就是數(shù)組的下標(biāo) 。
CPU 指令執(zhí)行過程
幾乎所有的馮·諾伊曼型計(jì)算機(jī)的CPU，其工作都可以分為5個階段：取指令、指令譯碼、執(zhí)行指令、訪存取數(shù)、結(jié)果寫回。
02 內(nèi)存
CPU 和內(nèi)存就像是一堆不可分割的戀人一樣，是無法拆散的一對兒，沒有內(nèi)存，CPU 無法執(zhí)行程序指令，那么計(jì)算機(jī)也就失去了意義；只有內(nèi)存，無法執(zhí)行指令，那么計(jì)算機(jī)照樣無法運(yùn)行。
那么什么是內(nèi)存呢？內(nèi)存和 CPU 如何進(jìn)行交互？下面就來介紹一下
什么是內(nèi)存
內(nèi)存（）是計(jì)算機(jī)中最重要的部件之一，它是程序與CPU進(jìn)行溝通的橋梁。計(jì)算機(jī)中所有程序的運(yùn)行都是在內(nèi)存中進(jìn)行的，因此內(nèi)存對計(jì)算機(jī)的影響非常大，內(nèi)存又被稱為主存，其作用是存放 CPU 中的運(yùn)算數(shù)據(jù)，以及與硬盤等外部存儲設(shè)備交換的數(shù)據(jù) 。只要計(jì)算機(jī)在運(yùn)行中，CPU 就會把需要運(yùn)算的數(shù)據(jù)調(diào)到主存中進(jìn)行運(yùn)算，當(dāng)運(yùn)算完成后CPU再將結(jié)果傳送出來，主存的運(yùn)行也決定了計(jì)算機(jī)的穩(wěn)定運(yùn)行。
內(nèi)存的物理結(jié)構(gòu)
內(nèi)存的內(nèi)部是由各種 IC 電路組成的，它的種類很龐大，但是其主要分為三種存儲器
內(nèi)存 IC 是一個完整的結(jié)構(gòu)，它內(nèi)部也有電源、地址信號、數(shù)據(jù)信號、控制信號和用于尋址的 IC 引腳來進(jìn)行數(shù)據(jù)的讀寫。下面是一個虛擬的 IC 引腳示意圖
圖中 VCC 和 GND 表示電源，A0 – A9 是地址信號的引腳，D0 – D7 表示的是控制信號、RD 和 WR 都是好控制信號，我用不同的顏色進(jìn)行了區(qū)分，將電源連接到 VCC 和 GND 后，就可以對其他引腳傳遞 0 和 1 的信號，大多數(shù)情況下，+5V 表示1，0V 表示 0 。
我們都知道內(nèi)存是用來存儲數(shù)據(jù)，那么這個內(nèi)存 IC 中能存儲多少數(shù)據(jù)呢？D0 – D7 表示的是數(shù)據(jù)信號，也就是說，一次可以輸入輸出 8 bit = 1 byte 的數(shù)據(jù) 。A0 – A9 是地址信號共十個，表示可以指定 00000 00000 – 11111 11111 共 2 的 10次方 = 1024個地址。每個地址都會存放 1 byte 的數(shù)據(jù)，因此我們可以得出內(nèi)存 IC 的容量就是 1 KB 。
內(nèi)存的讀寫過程
讓我們把點(diǎn)放在內(nèi)存 IC 對數(shù)據(jù)的讀寫過程上來吧！我們來看一個對內(nèi)存IC 進(jìn)行數(shù)據(jù)寫入和讀取的模型
來詳細(xì)描述一下這個過程，假設(shè)我們要向內(nèi)存 IC 中寫入 1byte 的數(shù)據(jù)的話，它的過程是這樣的：
內(nèi)存的現(xiàn)實(shí)模型
為了便于記憶，我們把內(nèi)存模型映射成為我們現(xiàn)實(shí)世界的模型，在現(xiàn)實(shí)世界中，內(nèi)存的模型很想我們生活的樓房。在這個樓房中， 1層可以存儲一個字節(jié)的數(shù)據(jù) ，樓層號就是地址，下面是內(nèi)存和樓層整合的模型圖
我們知道，程序中的數(shù)據(jù)不僅只有數(shù)值，還有數(shù)據(jù)類型的概念，從內(nèi)存上來看，就是占用內(nèi)存大?。ㄕ加寐ゲ閌?┑囊饉?。即使物理上強(qiáng)制以 1 個字節(jié)為單位來逐一讀寫數(shù)據(jù)的內(nèi)存，在程序中，通過指定其數(shù)據(jù)類型，也能實(shí)現(xiàn)以特定字節(jié)數(shù)為單位來進(jìn)行讀寫。
03 二進(jìn)制
我們都知道，計(jì)算機(jī)的底層都是使用二進(jìn)制數(shù)據(jù)進(jìn)行數(shù)據(jù)流傳輸?shù)模敲礊槭裁磿褂枚M(jìn)制表示計(jì)算機(jī)呢？或者說，什么是二進(jìn)制數(shù)呢？在拓展一步，如何使用二進(jìn)制進(jìn)行加減乘除？下面就來看一下
什么是二進(jìn)制數(shù)
那么什么是二進(jìn)制數(shù)呢？為了說明這個問題，我們先把這個數(shù)轉(zhuǎn)換為十進(jìn)制數(shù)看一下，二進(jìn)制數(shù)轉(zhuǎn)換為十進(jìn)制數(shù)，直接將各位置上的值 * 位權(quán)即可，那么我們將上面的數(shù)值進(jìn)行轉(zhuǎn)換
也就是說，二進(jìn)制數(shù)代表的轉(zhuǎn)換成十進(jìn)制就是 39，這個 39 并不是 3 和 9 兩個數(shù)字連著寫，而是 3 * 10 + 9 * 1，這里面的 10 , 1 就是位權(quán)，以此類推，上述例子中的位權(quán)從高位到低位依次就是 7 6 5 4 3 2 1 0 。這個位權(quán)也叫做次冪，那么最高位就是2的7次冪，2的6次冪等等。二進(jìn)制數(shù)的運(yùn)算每次都會以2為底，這個2 指得就是基數(shù)，那么十進(jìn)制數(shù)的基數(shù)也就是 10。在任何情況下位權(quán)的值都是數(shù)的位數(shù) – 1，那么第一位的位權(quán)就是 1 – 1 = 0，第二位的位權(quán)就睡 2 – 1 = 1，以此類推。
那么我們所說的二進(jìn)制數(shù)其實(shí)就是用0和1兩個數(shù)字來表示的數(shù)，它的基數(shù)為2 ，它的數(shù)值就是每個數(shù)的位數(shù) * 位權(quán)再求和得到的結(jié)果，我們一般來說數(shù)值指的就是十進(jìn)制數(shù)，那么它的數(shù)值就是 3 * 10 + 9 * 1 = 39 。
移位運(yùn)算和乘除的關(guān)系
在了解過二進(jìn)制之后，下面我們來看一下二進(jìn)制的運(yùn)算，和十進(jìn)制數(shù)一樣，加減乘除也適用于二進(jìn)制數(shù)，只要注意逢 2 進(jìn)位即可。二進(jìn)制數(shù)的運(yùn)算，也是計(jì)算機(jī)程序所特有的運(yùn)算，因此了解二進(jìn)制的運(yùn)算是必須要掌握的。
首先我們來介紹移位運(yùn)算，移位運(yùn)算是指將二進(jìn)制的數(shù)值的各個位置上的元素坐左移和右移操作，見下圖
補(bǔ)數(shù)
剛才我們沒有介紹右移的情況，是因?yàn)橛乙浦罂粘鰜淼母呶粩?shù)值，有 0 和 1 兩種形式。要想?yún)^(qū)分什么時候補(bǔ)0什么時候補(bǔ)1，首先就需要掌握二進(jìn)制數(shù)表示負(fù)數(shù)的方法。
二進(jìn)制數(shù)中表示負(fù)數(shù)值時，一般會把最高位作為符號來使用，因此我們把這個最高位當(dāng)作符號位。符號位是 0 時表示正數(shù)，是 1 時表示負(fù)數(shù) 。那么 -1 用二進(jìn)制數(shù)該如何表示呢？可能很多人會這么認(rèn)為：因?yàn)?1 的二進(jìn)制數(shù)是 0000 0001，最高位是符號位，所以正確的表示 -1 應(yīng)該是 1000 0001，但是這個答案真的對嗎？
計(jì)算機(jī)世界中是沒有減法的，計(jì)算機(jī)在做減法的時候其實(shí)就是在做加法，也就是用加法來實(shí)現(xiàn)的減法運(yùn)算。比如 100 – 50 ，其實(shí)計(jì)算機(jī)來看的時候應(yīng)該是 100 + (-50)，為此，在表示負(fù)數(shù)的時候就要用到二進(jìn)制補(bǔ)數(shù)，補(bǔ)數(shù)就是用正數(shù)來表示的負(fù)數(shù) 。
為了獲得補(bǔ)數(shù) ，我們需要將二進(jìn)制的各數(shù)位的數(shù)值全部取反，然后再將結(jié)果 + 1 即可，先記住這個結(jié)論，下面我們來演示一下。
具體來說，就是需要先獲取某個數(shù)值的二進(jìn)制數(shù)，然后對二進(jìn)制數(shù)的每一位做取反操作(0 —> 1 , 1 —> 0)，最后再對取反后的數(shù) +1，這樣就完成了補(bǔ)數(shù)的獲取。
補(bǔ)數(shù)的獲取，雖然直觀上不易理解，但是邏輯上卻非常嚴(yán)謹(jǐn)，比如我們來看一下 1 – 1 的這個過程，我們先用上面的這個 1000 0001(它是1的補(bǔ)數(shù)，不知道的請看上文，正確性先不管，只是用來做一下計(jì)算)來表示一下
奇怪， 1 – 1 會變成 130 ，而不是0，所以可以得出結(jié)論 1000 0001 表示 -1 是完全錯誤的。
那么正確的該如何表示呢？其實(shí)我們上面已經(jīng)給出結(jié)果了，那就是 1111 1111，來論證一下它的正確性
我們可以看到 1 – 1 其實(shí)實(shí)際上就是 1 + (-1)，對 -1 進(jìn)行上面的取反 + 1 后變?yōu)?1111 1111, 然后與 1 進(jìn)行加法運(yùn)算，得到的結(jié)果是九位的 1 0000 0000，結(jié)果發(fā)生了溢出，計(jì)算機(jī)會直接忽略掉溢出位，也就是直接拋掉最高位 1，變?yōu)?0000 0000 。也就是 0，結(jié)果正確，所以 1111 1111 表示的就是 -1。
所以負(fù)數(shù)的二進(jìn)制表示就是先求其補(bǔ)數(shù)，補(bǔ)數(shù)的求解過程就是對原始數(shù)值的二進(jìn)制數(shù)各位取反，然后將結(jié)果 + 1 。
算數(shù)右移和邏輯右移的區(qū)別
在了解完補(bǔ)數(shù)后，我們重新考慮一下右移這個議題，右移在移位后空出來的最高位有兩種情況 0 和 1 。
將二進(jìn)制數(shù)作為帶符號的數(shù)值進(jìn)行右移運(yùn)算時，移位后需要在最高位填充移位前符號位的值( 0 或 1) 。這就被稱為算數(shù)右移。如果數(shù)值使用補(bǔ)數(shù)表示的負(fù)數(shù)值，那么右移后在空出來的最高位補(bǔ) 1，就可以正確的表示 1/2,1/4,1/8等的數(shù)值運(yùn)算。如果是正數(shù)，那么直接在空出來的位置補(bǔ) 0 即可。
下面來看一個右移的例子。將 -4 右移兩位，來各自看一下移位示意圖
如上圖所示，在邏輯右移的情況下，-4 右移兩位會變成 63，顯然不是它的 1/4，所以不能使用邏輯右移，那么算數(shù)右移的情況下，右移兩位會變?yōu)?-1，顯然是它的 1/4 ，故而采用算數(shù)右移。
那么我們可以得出來一個結(jié)論：左移時，無論是圖形還是數(shù)值，移位后，只需要將低位補(bǔ) 0 即可；右移時，需要根據(jù)情況判斷是邏輯右移還是算數(shù)右移。
下面介紹一下符號擴(kuò)展：將數(shù)據(jù)進(jìn)行符號擴(kuò)展是為了產(chǎn)生一個位數(shù)加倍、但數(shù)值大小不變的結(jié)果，以滿足有些指令對操作數(shù)位數(shù)的要求，例如倍長于除數(shù)的被除數(shù) ，再如將數(shù)據(jù)位數(shù)加長以減少計(jì)算過程中的誤差。
以8位二進(jìn)制為例，符號擴(kuò)展就是指在保持值不變的前提下將其轉(zhuǎn)換成為16位和32位的二進(jìn)制數(shù) 。將0111 1111這個正的 8位二進(jìn)制數(shù)轉(zhuǎn)換成為 16位二進(jìn)制數(shù)時，很容易就能夠得出0 1111這個正確的結(jié)果，但是像 1111 1111這樣的補(bǔ)數(shù)來表示的數(shù)值，該如何處理？直接將其表示成為1 1111就可以了。也就是說，不管正數(shù)還是補(bǔ)數(shù)表示的負(fù)數(shù) ，只需要將 0 和 1 填充高位即可。
04 內(nèi)存和磁盤的關(guān)系
我們大家知道，計(jì)算機(jī)的五大基礎(chǔ)部件是存儲器、控制器、運(yùn)算器、輸入和輸出設(shè)備，其中從存儲功能的角度來看，可以把存儲器分為內(nèi)存和磁盤，我們上面介紹過內(nèi)存，下面就來介紹一下磁盤以及磁盤和內(nèi)存的關(guān)系
程序不讀入內(nèi)存就無法運(yùn)行
計(jì)算機(jī)最主要的存儲部件是內(nèi)存和磁盤。磁盤中存儲的程序必須加載到內(nèi)存中才能運(yùn)行，在磁盤中保存的程序是無法直接運(yùn)行的，這是因?yàn)樨?fù)責(zé)解析和運(yùn)行程序內(nèi)容的 CPU 是需要通過程序計(jì)數(shù)器來指定內(nèi)存地址從而讀出程序指令的。
磁盤構(gòu)造
磁盤緩存
我們上面提到，磁盤往往和內(nèi)存是互利共生的關(guān)系，相互協(xié)作，彼此持有良好的合作關(guān)系。每次內(nèi)存都需要從磁盤中讀取數(shù)據(jù) ，必然會讀到相同的內(nèi)容，所以一定會有一個角色負(fù)責(zé)存儲我們經(jīng)常需要讀到的內(nèi)容。我們大家做軟件的時候經(jīng)常會用到緩存技術(shù)，那么硬件層面也不例外，磁盤也有緩存，磁盤的緩存叫做磁盤緩存。
磁盤緩存指的是把從磁盤中讀出的數(shù)據(jù)存儲到內(nèi)存的方式，這樣一來，當(dāng)接下來需要讀取相同的內(nèi)容時，就不會再通過實(shí)際的磁盤，而是通過磁盤緩存來讀取。某一種技術(shù)或者框架的出現(xiàn)勢必要解決某種問題的，那么磁盤緩存就大大改善了磁盤訪問的速度。
虛擬內(nèi)存
虛擬內(nèi)存是內(nèi)存和磁盤交互的第二個媒介。虛擬內(nèi)存是指把磁盤的一部分作為假想內(nèi)存來使用。這與磁盤緩存是假想的磁盤（實(shí)際上是內(nèi)存）相對，虛擬內(nèi)存是假想的內(nèi)存（實(shí)際上是磁盤）。
虛擬內(nèi)存是計(jì)算機(jī)系統(tǒng)內(nèi)存管理的一種技術(shù) 。它使得應(yīng)用程序認(rèn)為它擁有連續(xù)可用的內(nèi)存（一個完整的地址空間），但是實(shí)際上，它通常被分割成多個物理碎片，還有部分存儲在外部磁盤管理器上，必要時進(jìn)行數(shù)據(jù)交換。
通過借助虛擬內(nèi)存，在內(nèi)存不足時仍然可以運(yùn)行程序。例如，在只剩 5MB 內(nèi)存空間的情況下仍然可以運(yùn)行 10MB 的程序。由于 CPU 只能執(zhí)行加載到內(nèi)存中的程序，因此，虛擬內(nèi)存的空間就需要和內(nèi)存中的空間進(jìn)行置換（swap），然后運(yùn)行程序。
虛擬內(nèi)存與內(nèi)存的交換方式
虛擬內(nèi)存的方法有分頁式和分段式兩種。采用的是分頁式。該方式是指在不考慮程序構(gòu)造的情況下，把運(yùn)行的程序按照一定大小的頁進(jìn)行分割，并以頁為單位進(jìn)行置換。在分頁式中，我們把磁盤的內(nèi)容讀到內(nèi)存中稱為 Page In ，把內(nèi)存的內(nèi)容寫入磁盤稱為 Page Out 。計(jì)算機(jī)的頁大小為 4KB，也就是說，需要把應(yīng)用程序按照 4KB 的頁來進(jìn)行切分，以頁（page）為單位放到磁盤中，然后進(jìn)行置換。
為了實(shí)現(xiàn)內(nèi)存功能，在磁盤上提供了虛擬內(nèi)存使用的文件（page file，頁文件）。該文件由生成和管理，文件的大小和虛擬內(nèi)存大小相同，通常大小是內(nèi)存的 1 – 2 倍。
磁盤的物理結(jié)構(gòu)
之前我們介紹了CPU、內(nèi)存的物理結(jié)構(gòu)，現(xiàn)在我們來介紹一下磁盤的物理結(jié)構(gòu) 。磁盤的物理結(jié)構(gòu)指的是磁盤存儲數(shù)據(jù)的形式。
磁盤是通過其物理表面劃分成多個空間來使用的。劃分的方式有兩種：可變長方式和扇區(qū)方式。前者是將物理結(jié)構(gòu)劃分成長度可變的空間，后者是將磁盤結(jié)構(gòu)劃分為固定長度的空間。一般所使用的硬盤和軟盤都是使用扇區(qū)這種方式。扇區(qū)中，把磁盤表面分成若干個同心圓的空間就是磁道，把磁道按照固定大小的存儲空間劃分而成的就是扇區(qū)
扇區(qū)是對磁盤進(jìn)行物理讀寫的最小單位。中使用的磁盤，一般是一個扇區(qū) 512 個字節(jié) 。不過，在邏輯方面對磁盤進(jìn)行讀寫的單位是扇區(qū)整數(shù)倍簇。根據(jù)磁盤容量不同功能， 1簇可以是 512 字節(jié)（1 簇 = 1扇區(qū)）、1KB（1簇 = 2扇區(qū)）、2KB、4KB、8KB、16KB、32KB( 1 簇 = 64 扇區(qū)) 。簇和扇區(qū)的大小是相等的。
05 壓縮算法
我們想必都有過壓縮和解壓縮文件的經(jīng)歷，當(dāng)文件太大時，我們會使用文件壓縮來降低文件的占用空間。比如微信上傳文件的限制是100 MB，我這里有個文件夾無法上傳，但是我解壓完成后的文件一定會小于 100 MB，那么我的文件就可以上傳了。
此外，我們把相機(jī)拍完的照片保存到計(jì)算機(jī)上的時候，也會使用壓縮算法進(jìn)行文件壓縮，文件壓縮的格式一般是JPEG 。
那么什么是壓縮算法呢？壓縮算法又是怎么定義的呢？在認(rèn)識算法之前我們需要先了解一下文件是如何存儲的
文件存儲
文件是將數(shù)據(jù)存儲在磁盤等存儲媒介的一種形式。程序文件中最基本的存儲數(shù)據(jù)單位是字節(jié) 。文件的大小不管是 xxxKB、xxxMB等來表示，就是因?yàn)槲募且宰止?jié) B = Byte 為單位來存儲的。
文件就是字節(jié)數(shù)據(jù)的集合。用 1 字節(jié)（8 位）表示的字節(jié)數(shù)據(jù)有 256 種，用二進(jìn)制表示的話就是 0000 0000 – 1111 1111。如果文件中存儲的數(shù)據(jù)是文字，那么該文件就是文本文件。如果是圖形，那么該文件就是圖像文件。在任何情況下，文件中的字節(jié)數(shù)都是連續(xù)存儲的。
壓縮算法的定義
上面介紹了文件的集合體其實(shí)就是一堆字節(jié)數(shù)據(jù)的集合，那么我們就可以來給壓縮算法下一個定義。
壓縮算法（）指的就是數(shù)據(jù)壓縮的算法，主要包括壓縮和還原（解壓縮）的兩個步驟。
其實(shí)就是在不改變原有文件屬性的前提下，降低文件字節(jié)空間和占用空間的一種算法。
根據(jù)壓縮算法的定義，我們可將其分成不同的類型：
有損和無損
無損壓縮：能夠無失真地從壓縮后的數(shù)據(jù)重構(gòu)，準(zhǔn)確地還原原始數(shù)據(jù) ?？捎糜趯?shù)據(jù)的準(zhǔn)確性要求嚴(yán)格的場合，如可執(zhí)行文件和普通文件的壓縮、磁盤的壓縮，也可用于多媒體數(shù)據(jù)的壓縮。該方法的壓縮比較小。如差分編碼、RLE、編碼、LZW編碼、算術(shù)編碼。
有損壓縮：有失真，不能完全準(zhǔn)確地恢復(fù)原始數(shù)據(jù)，重構(gòu)的數(shù)據(jù)只是原始數(shù)據(jù)的一個近似 ?？捎糜趯?shù)據(jù)的準(zhǔn)確性要求不高的場合，如多媒體數(shù)據(jù)的壓縮。該方法的壓縮比較大。例如預(yù)測編碼、音感編碼、分形壓縮、小波壓縮、JPEG/MPEG 。
對稱性
如果編解碼算法的復(fù)雜性和所需時間差不多，則為對稱的編碼方法，多數(shù)壓縮算法都是對稱的。但也有不對稱的，一般是編碼難而解碼容易，如編碼和分形編碼。但用于密碼學(xué)的編碼方法則相反，是編碼容易，而解碼則非常難。
幀間與幀內(nèi)
在視頻編碼中會同時用到幀內(nèi)與幀間的編碼方法，幀內(nèi)編碼是指在一幀圖像內(nèi)獨(dú)立完成的編碼方法，同靜態(tài)圖像的編碼，如 JPEG；而幀間編碼則需要參照前后幀才能進(jìn)行編解碼，并在編碼過程中考慮對幀之間的時間冗余的壓縮，如 MPEG 。
實(shí)時性
在有些多媒體的應(yīng)用場合，需要實(shí)時處理或傳輸數(shù)據(jù)（如現(xiàn)場的數(shù)字錄音和錄影、播放MP3/RM/VCD/DVD、視頻/音頻點(diǎn)播、網(wǎng)絡(luò)現(xiàn)場直播、可視電話、視頻會議），編解碼一般要求延時 ≤50 ms 。這就需要簡單/快速/高效的算法和高速/復(fù)雜的CPU/DSP芯片。
分級處理
有些壓縮算法可以同時處理不同分辨率、不同傳輸速率、不同質(zhì)量水平的多媒體數(shù)據(jù)，如、MPEG-2/4 。
這些概念有些抽象，主要是為了讓大家了解一下壓縮算法的分類，下面我們就對具體的幾種常用的壓縮算法來分析一下它的特點(diǎn)和優(yōu)劣
幾種常用壓縮算法的理解
RLE 算法的機(jī)制
接下來就讓我們正式看一下文件的壓縮機(jī)制。首先讓我們來嘗試對這 17 個半角字符的文件（文本文件）進(jìn)行壓縮。雖然這些文字沒有什么實(shí)際意義，但是很適合用來描述 RLE 的壓縮機(jī)制。
由于半角字符（其實(shí)就是英文字符）是作為 1 個字節(jié)保存在文件中的，所以上述的文件的大小就是 17 字節(jié) 。如圖
那么，如何才能壓縮該文件呢？大家不妨也考慮一下，只要是能夠使文件小于 17 字節(jié)，我們可以使用任何壓縮算法。
最顯而易見的一種壓縮方式我覺得你已經(jīng)想到了，就是把相同的字符去重化，也就是字符 * 重復(fù)次數(shù) 的方式進(jìn)行壓縮。所以上面文件壓縮后就會變成下面這樣
從圖中我們可以看出，的17個字符成功被壓縮成了的12個字符，也就是 12 / 17 = 70%，壓縮比為 70%，壓縮成功了。
像這樣，把文件內(nèi)容用數(shù)據(jù) * 重復(fù)次數(shù) 的形式來表示的壓縮方法成為 RLE(Run, 行程長度編碼) 算法。RLE 算法是一種很好的壓縮方法，經(jīng)常用于壓縮傳真的圖像等。因?yàn)閳D像文件的本質(zhì)也是字節(jié)數(shù)據(jù)的集合體，所以可以用 RLE 算法進(jìn)行壓縮
哈夫曼算法和莫爾斯編碼
下面我們來介紹另外一種壓縮算法，即哈夫曼算法。在了解哈夫曼算法之前，你必須舍棄半角英文數(shù)字的1個字符是1個字節(jié)(8位)的數(shù)據(jù) 。下面我們就來認(rèn)識一下哈夫曼算法的基本思想。
文本文件是由不同類型的字符組合而成的，而且不同字符出現(xiàn)的次數(shù)也是不一樣的。例如，在某個文本文件中，A 出現(xiàn)了 100次左右，Q僅僅用到了 3 次，類似這樣的情況很常見。哈夫曼算法的關(guān)鍵就在于多次出現(xiàn)的數(shù)據(jù)用小于 8 位的字節(jié)數(shù)表示，不常用的數(shù)據(jù)則可以使用超過 8 位的字節(jié)數(shù)表示。A 和 Q 都用 8 位來表示時，原文件的大小就是 100次 * 8 位 + 3次 * 8 位 = 824位，假設(shè) A 用 2 位，Q 用 10 位來表示就是 2 * 100 + 3 * 10 = 230 位。
不過要注意一點(diǎn)，最終磁盤的存儲都是以8位為一個字節(jié)來保存文件的。
哈夫曼算法比較復(fù)雜，在深入了解之前我們先吃點(diǎn)甜品，了解一下莫爾斯編碼，你一定看過美劇或者戰(zhàn)爭片的電影，在戰(zhàn)爭中的通信經(jīng)常采用莫爾斯編碼來傳遞信息，例如下面
接下來我們來講解一下莫爾斯編碼，下面是莫爾斯編碼的示例，大家把 1 看作是短點(diǎn)(嘀)，把 11 看作是長點(diǎn)(嗒)即可。
莫爾斯編碼一般把文本中出現(xiàn)最高頻率的字符用短編碼來表示。如表所示，假如表示短點(diǎn)的位是 1，表示長點(diǎn)的位是 11 的話，那么 E（嘀）這一數(shù)據(jù)的字符就可以用 1 來表示，C（滴答滴答）就可以用 9 位的來表示。在實(shí)際的莫爾斯編碼中，如果短點(diǎn)的長度是 1 ，長點(diǎn)的長度就是 3，短點(diǎn)和長點(diǎn)的間隔就是1 。這里的長度指的就是聲音的長度。比如我們想用上面的例子來用莫爾斯編碼重寫，在莫爾斯曼編碼中，各個字符之間需要加入表示時間間隔的符號。這里我們用 00 加以區(qū)分。
所以，這個文本就變?yōu)榱?A * 6 次 + B * 2次 + C * 1次 + D * 2次 + E * 5次 + F * 1次 + 字符間隔 * 16 = 4 位 * 6次 + 8 位 * 2次 + 9 位 * 1 次 + 6位 * 2次 + 1位 * 5次 + 8 位 * 1次 + 2位 * 16次 = 106位 = 14字節(jié) 。
所以使用莫爾斯電碼的壓縮比為 14 / 17 = 82% 。效率并不太突出。
用二叉樹實(shí)現(xiàn)哈夫曼算法
剛才已經(jīng)提到，莫爾斯編碼是根據(jù)日常文本中各字符的出現(xiàn)頻率來決定表示各字符的編碼數(shù)據(jù)長度的。不過，在該編碼體系中，對這種文本來說并不是效率最高的。
下面我們來看一下哈夫曼算法。哈夫曼算法是指，為各壓縮對象文件分別構(gòu)造最佳的編碼體系，并以該編碼體系為基礎(chǔ)來進(jìn)行壓縮。因此，用什么樣的編碼（哈夫曼編碼）對數(shù)據(jù)進(jìn)行分割，就要由各個文件而定。用哈夫曼算法壓縮過的文件中，存儲著哈夫曼編碼信息和壓縮過的數(shù)據(jù) 。
接下來，我們在對中的 A – F 這些字符，按照出現(xiàn)頻率高的字符用盡量少的位數(shù)編碼來表示這一原則進(jìn)行整理。按照出現(xiàn)頻率從高到低的順序整理后，結(jié)果如下，同時也列出了編碼方案。
在上表的編碼方案中，隨著出現(xiàn)頻率的降低，字符編碼信息的數(shù)據(jù)位數(shù)也在逐漸增加，從最開始的 1位、2位依次增加到3位。不過這個編碼體系是存在問題的，你不知道100這個3位的編碼，它的意思是用 1、0、0這三個編碼來表示 E、A、A 呢？還是用10、0來表示 B、A 呢？還是用100來表示 C 呢。
而在哈夫曼算法中，通過借助哈夫曼樹的構(gòu)造編碼體系，即使在不使用字符區(qū)分符號的情況下，也可以構(gòu)建能夠明確進(jìn)行區(qū)分的編碼體系。不過哈夫曼樹的算法要比較復(fù)雜，下面是一個哈夫曼樹的構(gòu)造過程。
自然界樹的從根開始生葉的，而哈夫曼樹則是葉生枝
哈夫曼樹能夠提升壓縮比率
使用哈夫曼樹之后，出現(xiàn)頻率越高的數(shù)據(jù)所占用的位數(shù)越少，這也是哈夫曼樹的核心思想。通過上圖的步驟二可以看出，枝條連接數(shù)據(jù)時，我們是從出現(xiàn)頻率較低的數(shù)據(jù)開始的。這就意味著出現(xiàn)頻率低的數(shù)據(jù)到達(dá)根部的枝條也越多。而枝條越多則意味著編碼的位數(shù)隨之增加。
接下來我們來看一下哈夫曼樹的壓縮比率，用上圖得到的數(shù)據(jù)表示為 0110 10101 111，40位 = 5 字節(jié) 。壓縮前的數(shù)據(jù)是 17 字節(jié)，壓縮后的數(shù)據(jù)竟然達(dá)到了驚人的5 字節(jié)，也就是壓縮比率 = 5 / 17 = 29% 如此高的壓縮率mysql 命令行執(zhí)行存儲過程，簡直是太驚艷了。
大家可以參考一下，無論哪種類型的數(shù)據(jù)，都可以用哈夫曼樹作為壓縮算法
文件類型壓縮前壓縮后壓縮比率文本文件 14862字節(jié) 4119字節(jié) 28% 圖像文件 96062字節(jié) 9456字節(jié) 10% EXE文件 24576字節(jié) 4652字節(jié) 19%
可逆壓縮和非可逆壓縮
最后，我們來看一下圖像文件的數(shù)據(jù)形式。圖像文件的使用目的通常是把圖像數(shù)據(jù)輸出到顯示器、打印機(jī)等設(shè)備上。常用的圖像格式有 : BMP、JPEG、TIFF、GIF 格式等。
圖像文件可以使用前面介紹的 RLE 算法和哈夫曼算法，因?yàn)閳D像文件在多數(shù)情況下并不要求數(shù)據(jù)需要還原到和壓縮之前一摸一樣的狀態(tài) ，允許丟失一部分?jǐn)?shù)據(jù) 。我們把能還原到壓縮前狀態(tài)的壓縮稱為可逆壓縮，無法還原到壓縮前狀態(tài)的壓縮稱為非可逆壓縮。
一般來說，JPEG格式的文件是非可逆壓縮，因此還原后有部分圖像信息比較模糊。GIF 是可逆壓縮
06 操作系統(tǒng)
操作系統(tǒng)環(huán)境
程序中包含著運(yùn)行環(huán)境這一內(nèi)容，可以說運(yùn)行環(huán)境 = 操作系統(tǒng) + 硬件，操作系統(tǒng)又可以被稱為軟件，它是由一系列的指令組成的。我們不介紹操作系統(tǒng)，我們主要來介紹一下硬件的識別。
我們肯定都玩兒過游戲，你玩兒游戲前需要干什么？是不是需要先看一下自己的筆記本或者電腦是不是能肝的起游戲？下面是一個游戲的配置（懷念一下 wow）
圖中的主要配置如下
從程序的運(yùn)行環(huán)境這一角度來考量的話，CPU 的種類是特別重要的參數(shù)，為了使程序能夠正常運(yùn)行，必須滿足 CPU 所需的最低配置。
CPU 只能解釋其自身固有的語言。不同的 CPU 能解釋的機(jī)器語言的種類也是不同的。機(jī)器語言的程序稱為本地代碼( code)，程序員用 C 等高級語言編寫的程序，僅僅是文本文件。文本文件(排除文字編碼的問題)在任何環(huán)境下都能顯示和編輯。我們稱之為源代碼。通過對源代碼進(jìn)行編譯，就可以得到本地代碼。下圖反映了這個過程。
-image-.png
操作系統(tǒng)克服了CPU以外的硬件差異
計(jì)算機(jī)的硬件并不僅僅是由 CPU 組成的，還包括用于存儲程序指令的數(shù)據(jù)和內(nèi)存，以及通過 I/O 連接的鍵盤、顯示器、硬盤、打印機(jī)等外圍設(shè)備。
在軟件中，鍵盤輸入、顯示器輸出等并不是直接向硬件發(fā)送指令。而是通過向發(fā)送指令實(shí)現(xiàn)的。因此，程序員就不用注意內(nèi)存和 I/O 地址的不同構(gòu)成了。操作的是硬件而不是軟件，軟件通過操作系統(tǒng)可以達(dá)到控制硬件的目的。
不同操作系統(tǒng)的 API 差異性
接下來我們看一下操作系統(tǒng)的種類。同樣機(jī)型的計(jì)算機(jī)，可安裝的操作系統(tǒng)類型也會有多種選擇。例如：AT 兼容機(jī)除了可以安裝之外，還可以采用 Unix 系列的 Linux 以及（也是一種Unix操作系統(tǒng)）等多個操作系統(tǒng) 。當(dāng)然，應(yīng)用軟件則必須根據(jù)不同的操作系統(tǒng)類型來專門開發(fā) 。CPU 的類型不同，所對應(yīng)機(jī)器的語言也不同,同樣的道理，操作系統(tǒng)的類型不同，應(yīng)用程序向操作系統(tǒng)傳遞指令的途徑也不同。
應(yīng)用程序向系統(tǒng)傳遞指令的途徑稱為 API() 。以及 Linux 操作系統(tǒng)的 API ，提供了任何應(yīng)用程序都可以利用的函數(shù)組合。因?yàn)椴煌僮飨到y(tǒng)的 API 是有差異的。所以，如何要將同樣的應(yīng)用程序移植到另外的操作系統(tǒng)，就必須要覆蓋應(yīng)用所用到的 API 部分。
鍵盤輸入、鼠標(biāo)輸入、顯示器輸出、文件輸入和輸出等同外圍設(shè)備進(jìn)行交互的功能，都是通過 API 提供的。
這也就是為什么應(yīng)用程序不能直接移植到 Linux 操作系統(tǒng)上的原因，API 差異太大了。
在同類型的操作系統(tǒng)下，不論硬件如何，API 幾乎相同。但是，由于不同種類 CPU 的機(jī)器語言不同，因此本地代碼也不盡相同。
操作系統(tǒng)功能的歷史
操作系統(tǒng)其實(shí)也是一種軟件，任何新事物的出現(xiàn)肯定都有它的歷史背景，那么操作系統(tǒng)也不是憑空出現(xiàn)的，肯定有它的歷史背景。
在計(jì)算機(jī)尚不存在操作系統(tǒng)的年代，完全沒有任何程序，人們通過各種按鈕來控制計(jì)算機(jī) ，這一過程非常麻煩。于是，有人開發(fā)出了僅具有加載和運(yùn)行功能的監(jiān)控程序，這就是操作系統(tǒng)的原型。通過事先啟動監(jiān)控程序，程序員可以根據(jù)需要將各種程序加載到內(nèi)存中運(yùn)行。雖然仍舊比較麻煩，但比起在沒有任何程序的狀態(tài)下進(jìn)行開發(fā)，工作量得到了很大的緩解。
隨著時代的發(fā)展，人們在利用監(jiān)控程序編寫程序的過程中發(fā)現(xiàn)很多程序都有公共的部分。例如，通過鍵盤進(jìn)行文字輸入，顯示器進(jìn)行數(shù)據(jù)展示等，如果每編寫一個新的應(yīng)用程序都需要相同的處理的話，那真是太浪費(fèi)時間了。因此，基本的輸入輸出部分的程序就被追加到了監(jiān)控程序中。初期的操作系統(tǒng)就是這樣誕生了。
類似的想法可以共用，人們又發(fā)現(xiàn)有更多的應(yīng)用程序可以追加到監(jiān)控程序中，比如硬件控制程序，編程語言處理器(匯編、編譯、解析)以及各種應(yīng)用程序等，結(jié)果就形成了和現(xiàn)在差異不大的操作系統(tǒng)，也就是說，其實(shí)操作系統(tǒng)是多個程序的集合體。
操作系統(tǒng)的特征
操作系統(tǒng)是世界上用戶數(shù)量最龐大的群體，作為操作系統(tǒng)的資深用戶，你都知道操作系統(tǒng)有哪些特征嗎？下面列舉了一些操作系統(tǒng)的特性
這些是對程序員來講比較有意義的一些特征，下面針對這些特征來進(jìn)行分別的介紹
32位操作系統(tǒng)
這里表示的32位操作系統(tǒng)表示的是處理效率最高的數(shù)據(jù)大小。處理數(shù)據(jù)的基本單位是 32 位。這與最一開始在 MS-DOS 等16位操作系統(tǒng)不同，因?yàn)樵?6位操作系統(tǒng)中處理32位數(shù)據(jù)需要兩次，而32位操作系統(tǒng)只需要一次就能夠處理32位的數(shù)據(jù)，所以一般在上的應(yīng)用，它們的最高能夠處理的數(shù)據(jù)都是 32 位的。
比如，用 C 語言來處理整數(shù)數(shù)據(jù)時，有8位的 char 類型，16位的short類型，以及32位的long類型三個選項(xiàng)，使用位數(shù)較大的 long 類型進(jìn)行處理的話，增加的只是內(nèi)存以及磁盤的開銷，對性能影響不大。
現(xiàn)在市面上大部分都是64位操作系統(tǒng)了，64位操作系統(tǒng)也是如此。
通過 API 函數(shù)集來提供系統(tǒng)調(diào)用
是通過名為 API 的函數(shù)集來提供系統(tǒng)調(diào)用的。API是聯(lián)系應(yīng)用程序和操作系統(tǒng)之間的接口，全稱叫做,應(yīng)用程序接口。
當(dāng)前主流的32位版API 也稱為 Win32 API ，之所以這樣命名，是需要和不同的操作系統(tǒng)進(jìn)行區(qū)分，比如最一開始的 16 位版的 Win16 API，和后來流行的 Win64 API。
API 通過多個 DLL 文件來提供mysql 命令行執(zhí)行存儲過程，各個 API 的實(shí)體都是用 C 語言編寫的函數(shù) 。所以，在 C 語言環(huán)境下，使用 API 更加容易，比如 API 所用到的 () 函數(shù)，就被保存在了提供的 .dll 這個 DLL 文件中。
提供采用了 GUI 的用戶界面
GUI( User ) 指得就是圖形用戶界面，通過點(diǎn)擊顯示器中的窗口以及圖標(biāo)等可視化的用戶界面，舉個例子：Linux 操作系統(tǒng)就有兩個版本，一種是簡潔版，直接通過命令行控制硬件，還有一種是可視化版，通過光標(biāo)點(diǎn)擊圖形界面來控制硬件。
通過實(shí)現(xiàn)打印輸出
指的是顯示器上輸出的內(nèi)容可以直接通過打印機(jī)打印輸出。在中，顯示器和打印機(jī)被認(rèn)作同等的圖形輸出設(shè)備處理的，該功能也為提供了條件。
借助功能，程序員可以輕松不少。最初，為了是現(xiàn)在顯示器中顯示和在打印機(jī)中打印，就必須分別編寫各自的程序，而在中，可以借助基本上在一個程序中就可以做到顯示和打印這兩個功能了。
提供多任務(wù)功能
多任務(wù)指的就是同時能夠運(yùn)行多個應(yīng)用程序的功能，是通過時鐘分割技術(shù)來實(shí)現(xiàn)多任務(wù)功能的。時鐘分割指的是短時間間隔內(nèi)，多個程序切換運(yùn)行的方式。在用戶看來，就好像是多個程序在同時運(yùn)行，其底層是 CPU 時間切片，這也是多線程多任務(wù)的核心。
提供網(wǎng)絡(luò)功能和數(shù)據(jù)庫功能
中，網(wǎng)絡(luò)功能是作為標(biāo)準(zhǔn)功能提供的。數(shù)據(jù)庫(數(shù)據(jù)庫服務(wù)器)功能有時也會在后面追加。網(wǎng)絡(luò)功能和數(shù)據(jù)庫功能雖然并不是操作系統(tǒng)不可或缺的，但因?yàn)樗鼈兒筒僮飨到y(tǒng)很接近，所以被統(tǒng)稱為中間件而不是應(yīng)用。意思是處于操作系統(tǒng)和應(yīng)用的中間層，操作系統(tǒng)和中間件組合在一起，稱為系統(tǒng)軟件。應(yīng)用不僅可以利用操作系統(tǒng)，也可以利用中間件的功能。
相對于操作系統(tǒng)一旦安裝就不能輕易更換，中間件可以根據(jù)需要進(jìn)行更換，不過，對于大部分應(yīng)用來說，更換中間件的話，會造成應(yīng)用也隨之更換，從這個角度來說，更?換中間件也不是那么容易。
通過即插即用實(shí)現(xiàn)設(shè)備驅(qū)動的自動設(shè)定
即插即用(Plug-and-Play)指的是新的設(shè)備連接(plug) 后就可以直接使用的機(jī)制，新設(shè)備連接計(jì)算機(jī)后，計(jì)算機(jī)就會自動安裝和設(shè)定用來控制該設(shè)備的驅(qū)動程序
設(shè)備驅(qū)動是操作系統(tǒng)的一部分，提供了同硬件進(jìn)行基本的輸入輸出的功能。鍵盤、鼠標(biāo)、顯示器、磁盤裝置等，這些計(jì)算機(jī)中必備的硬件的設(shè)備驅(qū)動，一般都是隨操作系統(tǒng)一起安裝的。
有時 DLL 文件也會同設(shè)備驅(qū)動文件一起安裝。這些 DLL 文件中存儲著用來利用該新追加的硬件API，通過 API ，可以制作出運(yùn)行該硬件的心應(yīng)用。
07 匯編語言和本地代碼
我們在之前的文章中探討過，計(jì)算機(jī) CPU 只能運(yùn)行本地代碼(機(jī)器語言)程序，用 C 語言等高級語言編寫的代碼，需要經(jīng)過編譯器編譯后，轉(zhuǎn)換為本地代碼才能夠被 CPU 解釋執(zhí)行。
但是本地代碼的可讀性非常差，所以需要使用一種能夠直接讀懂的語言來替換本地代碼，那就是在各本地代碼中，附帶上表示其功能的英文縮寫，比如在加法運(yùn)算的本地代碼加上add() 的縮寫、在比較運(yùn)算符的本地代碼中加上cmp()的縮寫等，這些通過縮寫來表示具體本地代碼指令的標(biāo)志稱為助記符，使用助記符的語言稱為匯編語言。這樣，通過閱讀匯編語言，也能夠了解本地代碼的含義了。
不過，即使是使用匯編語言編寫的源代碼，最終也必須要轉(zhuǎn)換為本地代碼才能夠運(yùn)行，負(fù)責(zé)做這項(xiàng)工作的程序稱為編譯器，轉(zhuǎn)換的這個過程稱為匯編。在將源代碼轉(zhuǎn)換為本地代碼這個功能方面，匯編器和編譯器是同樣的。
用匯編語言編寫的源代碼和本地代碼是一一對應(yīng)的。因而，本地代碼也可以反過來轉(zhuǎn)換成匯編語言編寫的代碼。把本地代碼轉(zhuǎn)換為匯編代碼的這一過程稱為反匯編，執(zhí)行反匯編的程序稱為反匯編程序。
哪怕是 C 語言編寫的源代碼，編譯后也會轉(zhuǎn)換成特定 CPU 用的本地代碼。而將其反匯編的話，就可以得到匯編語言的源代碼，并對其內(nèi)容進(jìn)行調(diào)查。不過，本地代碼變成 C 語言源代碼的反編譯，要比本地代碼轉(zhuǎn)換成匯編代碼的反匯編要困難，這是因?yàn)?，C 語言代碼和本地代碼不是一一對應(yīng)的關(guān)系。
通過編譯器輸出匯編語言的源代碼
我們上面提到本地代碼可以經(jīng)過反匯編轉(zhuǎn)換成為匯編代碼，但是只有這一種轉(zhuǎn)換方式嗎？顯然不是，C 語言編寫的源代碼也能夠通過編譯器編譯稱為匯編代碼，下面就來嘗試一下。
首先需要先做一些準(zhǔn)備，需要先下載C++ 5.5 編譯器，為了方便，我這邊直接下載好了讀者直接從我的百度網(wǎng)盤提取即可（鏈接:/s/… 密碼:hz1u）
下載完畢，需要進(jìn)行配置，下面是配置說明（/view/…
首先用記事本等文本編輯器編寫如下代碼
// 返回兩個參數(shù)值之和的函數(shù)int AddNum(int a,int b){return a + b;}// 調(diào)用 AddNum 函數(shù)的函數(shù)void MyFunc(){int c;c = AddNum(123,456);}
編寫完成后將其文件名保存為 .c ，C 語言源文件的擴(kuò)展名，通常用.c 來表示，上面程序是提供兩個輸入?yún)?shù)并返回它們之和。
在操作系統(tǒng)下打開命令提示符，切換到保存 .c 的文件夾下，然后在命令提示符中輸入
bcc32 -c -S Sample4.c
bcc32 是啟動C++ 的命令，-c 的選項(xiàng)是指僅進(jìn)行編譯而不進(jìn)行鏈接，-S 選項(xiàng)被用來指定生成匯編語言的源代碼
作為編譯的結(jié)果，當(dāng)前目錄下會生成一個名為.asm 的匯編語言源代碼。匯編語言源文件的擴(kuò)展名，通常用.asm 來表示，下面就讓我們用編輯器打開看一下 .asm 中的內(nèi)容
.386p ifdef ??version if??version GT 500H .mmx endif endif model flat ifndef ??version ?debug macro endm endif ?debug S "Sample4.c" ?debug T "Sample4.c"_TEXT segment dword public use32 'CODE'_TEXT ends_DATA segment dword public use32 'DATA'_DATA ends_BSS segment dword public use32 'BSS'_BSS endsDGROUP group _BSS,_DATA_TEXT segment dword public use32 'CODE'_AddNum proc near?live1@0:;; int AddNum(int a,int b){;pushebp movebp,esp;;;return a + b;; @1: moveax,dword ptr [ebp+8] addeax,dword ptr [ebp+12];; }; @3:@2: popebp ret _AddNum endp_MyFunc proc near?live1@48:;; void MyFunc(){;pushebp movebp,esp;;int c;;c = AddNum(123,456);; @4: push456 push123 call_AddNum addesp,8;; }; @5: popebp ret _MyFunc endp_TEXT ends public _AddNum public _MyFunc ?debug D "Sample4.c" 20343 45835 end
這樣，編譯器就成功的把 C 語言轉(zhuǎn)換成為了匯編代碼了。
不會轉(zhuǎn)換成本地代碼的偽指令
第一次看到匯編代碼的讀者可能感覺起來比較難，不過實(shí)際上其實(shí)比較簡單，而且可能比 C 語言還要簡單，為了便于閱讀匯編代碼的源代碼，需要注意幾個要點(diǎn)
匯編語言的源代碼，是由轉(zhuǎn)換成本地代碼的指令（后面講述的操作碼）和針對匯編器的偽指令構(gòu)成的。偽指令負(fù)責(zé)把程序的構(gòu)造以及匯編的方法指示給匯編器（轉(zhuǎn)換程序）。不過偽指令是無法匯編轉(zhuǎn)換成為本地代碼的。下面是上面程序截取的偽指令
_TEXT segment dword public use32 'CODE'_TEXT ends_DATA segment dword public use32 'DATA'_DATA ends_BSS segment dword public use32 'BSS'_BSS endsDGROUP group _BSS,_DATA_AddNum proc near_AddNum endp_MyFunc proc near_MyFunc endp_TEXT ends end
由偽指令和 ends 圍起來的部分，是給構(gòu)成程序的命令和數(shù)據(jù)的集合體上加一個名字而得到的，稱為段定義。段定義的英文表達(dá)具有區(qū)域的意思，在這個程序中，段定義指的是命令和數(shù)據(jù)等程序的集合體的意思，一個程序由多個段定義構(gòu)成。
上面代碼的開始位置，定義了3個名稱分別為 _TEXT、_DATA、_BSS 的段定義，_TEXT 是指定的段定義， _DATA 是被初始化（有初始值）的數(shù)據(jù)的段定義，_BSS 是尚未初始化的數(shù)據(jù)的段定義。這種定義的名稱是由C++ 定義的，是由C++ 編譯器自動分配的，所以程序段定義的順序就成為了 _TEXT、_DATA、_BSS，這樣也確保了內(nèi)存的連續(xù)性
_TEXT segment dword public use32 'CODE'_TEXT ends_DATA segment dword public use32 'DATA'_DATA ends_BSS segment dword public use32 'BSS'_BSS ends
段定義() 是用來區(qū)分或者劃分范圍區(qū)域的意思。匯編語言的偽指令表示段定義的起始，ends 偽指令表示段定義的結(jié)束。段定義是一段連續(xù)的內(nèi)存空間
而group 這個偽指令表示的是將 _BSS和_DATA 這兩個段定義匯總名為的組
DGROUP group _BSS,_DATA
圍起和的 _TEXT和 _TEXT ends，表示和是屬于 _TEXT 這一段定義的。
_TEXT segment dword public use32 'CODE'_TEXT ends
因此，即使在源代碼中指令和數(shù)據(jù)是混雜編寫的，經(jīng)過編譯和匯編后，也會轉(zhuǎn)換成為規(guī)整的本地代碼。
proc 和endp 圍起來的部分，以及 proc 和endp 圍起來的部分，分別表示函數(shù)和函數(shù)的范圍。
_AddNum proc near_AddNum endp_MyFunc proc near_MyFunc endp
編譯后在函數(shù)名前附帶上下劃線_ ，是C++ 的規(guī)定。在 C 語言中編寫的函數(shù)，在內(nèi)部是以這個名稱處理的。偽指令 proc 和 endp 圍起來的部分，表示的是過程() 的范圍。在匯編語言中，這種相當(dāng)于 C 語言的函數(shù)的形式稱為過程。
末尾的 end 偽指令，表示的是源代碼的結(jié)束。
匯編語言的語法是操作碼 + 操作數(shù)
在匯編語言中，一行表示一對 CPU 的一個指令。匯編語言指令的語法結(jié)構(gòu)是操作碼 + 操作數(shù)，也存在只有操作碼沒有操作數(shù)的指令。
操作碼表示的是指令動作，操作數(shù)表示的是指令對象。操作碼和操作數(shù)一起使用就是一個英文指令。比如從英語語法來分析的話，操作碼是動詞，操作數(shù)是賓語。比如這個句子 Give me money這個英文指令的話，Give 就是操作碼，me 和 money 就是操作數(shù) 。匯編語言中存在多個操作數(shù)的情況，要用逗號把它們分割，就像是 Give me,money 這樣。
能夠使用何種形式的操作碼，是由 CPU 的種類決定的，下面對操作碼的功能進(jìn)行了整理。
本地代碼需要加載到內(nèi)存后才能運(yùn)行，內(nèi)存中存儲著構(gòu)成本地代碼的指令和數(shù)據(jù) 。程序運(yùn)行時， CPU會從內(nèi)存中把數(shù)據(jù)和指令讀出來，然后放在 CPU 內(nèi)部的寄存器中進(jìn)行處理。
如果 CPU 和內(nèi)存的關(guān)系你還不是很了解的話，請閱讀作者的另一篇文章程序員需要了解的硬核知識之CPU 詳細(xì)了解。
寄存器是 CPU 中的存儲區(qū)域，寄存器除了具有臨時存儲和計(jì)算的功能之外，還具有運(yùn)算功能，x86 系列的主要種類和角色如下圖所示
指令解析
下面就對 CPU 中的指令進(jìn)行分析
最常用的 mov 指令
指令中最常使用的是對寄存器和內(nèi)存進(jìn)行數(shù)據(jù)存儲的 mov 指令，mov 指令的兩個操作數(shù) ，分別用來指定數(shù)據(jù)的存儲地和讀出源。操作數(shù)中可以指定寄存器、常數(shù)、標(biāo)簽(附加在地址前)，以及用方括號([]) 圍起來的這些內(nèi)容。如果指定了沒有用([]) 方括號圍起來的內(nèi)容，就表示對該值進(jìn)行處理；如果指定了用方括號圍起來的內(nèi)容，方括號的值則會被解釋為內(nèi)存地址，然后就會對該內(nèi)存地址對應(yīng)的值進(jìn)行讀寫操作。讓我們對上面的代碼片段進(jìn)行說明
movebp,esp moveax,dword ptr [ebp+8]
mov ebp,esp 中，esp 寄存器中的值被直接存儲在了 ebp 中，也就是說，如果 esp 寄存器的值是100的話那么 ebp 寄存器的值也是 100 。
而在 mov eax,dword ptr [ebp+8] 這條指令中，ebp 寄存器的值 + 8 后會被解析稱為內(nèi)存地址。如果 ebp
寄存器的值是100的話，那么 eax 寄存器的值就是 100 + 8 的地址的值。dword ptr 也叫做word簡單解釋一下就是從指定的內(nèi)存地址中讀出4字節(jié)的數(shù)據(jù)
對棧進(jìn)行 push 和 pop
程序運(yùn)行時，會在內(nèi)存上申請分配一個稱為棧的數(shù)據(jù)空間。棧（stack）的特性是后入先出，數(shù)據(jù)在存儲時是從內(nèi)存的下層（大的地址編號）逐漸往上層（小的地址編號）累積，讀出時則是按照從上往下進(jìn)行讀取的。
棧是存儲臨時數(shù)據(jù)的區(qū)域，它的特點(diǎn)是通過 push 指令和 pop 指令進(jìn)行數(shù)據(jù)的存儲和讀出。向棧中存儲數(shù)據(jù)稱為入棧，從棧中讀出數(shù)據(jù)稱為出棧，32位 x86 系列的 CPU 中，進(jìn)行1次 push 或者 pop，即可處理 32 位（4字節(jié)）的數(shù)據(jù) 。
函數(shù)的調(diào)用機(jī)制
下面我們一起來分析一下函數(shù)的調(diào)用機(jī)制，我們以上面的 C 語言編寫的代碼為例。首先，讓我們從函數(shù)調(diào)用函數(shù)的匯編語言部分開始，來對函數(shù)的調(diào)用機(jī)制進(jìn)行說明。棧在函數(shù)的調(diào)用中發(fā)揮了巨大的作用，下面是經(jīng)過處理后的函數(shù)的匯編處理內(nèi)容
_MyFuncprocnear pushebp; 將 ebp 寄存器的值存入棧中(1)movebp,esp ; 將 esp 寄存器的值存入 ebp 寄存器中(2) push456; 將 456 入棧(3) push123; 將 123 入棧(4) call_AddNum ; 調(diào)用 AddNum 函數(shù)(5) addesp,8; esp 寄存器的值 + 8(6) popebp; 讀出棧中的數(shù)值存入 esp 寄存器中(7) ret; 結(jié)束 MyFunc 函數(shù)，返回到調(diào)用源(8)_MyFuncendp
代碼解釋中的(1)、(2)、(7)、(8)的處理適用于 C 語言中的所有函數(shù)，我們會在后面展示函數(shù)處理內(nèi)容時進(jìn)行說明。這里希望大家先(3) – (6) 這一部分，這對了解函數(shù)調(diào)用機(jī)制至關(guān)重要。
(3) 和 (4) 表示的是將傳遞給函數(shù)的參數(shù)通過 push 入棧。在 C 語言源代碼中，雖然記述為函數(shù) (123,456) ，但入棧時則會先按照 456 ， 123 這樣的順序。也就是位于后面的數(shù)值先入棧。這是 C 語言的規(guī)定。(5) 表示的 call 指令，會把程序流程跳轉(zhuǎn)到函數(shù)指令的地址處。在匯編語言中，函數(shù)名表示的就是函數(shù)所在的內(nèi)存地址。函數(shù)處理完畢后，程序流程必須要返回到編號(6) 這一行。call 指令運(yùn)行后，call 指令的下一行(也就指的是 (6) 這一行)的內(nèi)存地址(調(diào)用函數(shù)完畢后要返回的內(nèi)存地址)會自動的 push 入棧。該值會在函數(shù)處理的最后通過 ret 指令 pop 出棧，然后程序會返回到 (6) 這一行。
(6) 部分會把棧中存儲的兩個參數(shù) (456 和 123) 進(jìn)行銷毀處理。雖然通過兩次的 pop 指令也可以實(shí)現(xiàn)，不過采用 esp 寄存器 + 8 的方式會更有效率(處理 1 次即可) 。對棧進(jìn)行數(shù)值的輸入和輸出時，數(shù)值的單位是4字節(jié) 。因此，通過在負(fù)責(zé)棧地址管理的 esp 寄存器中加上4的2倍8，就可以達(dá)到和運(yùn)行兩次 pop 命令同樣的效果。雖然內(nèi)存中的數(shù)據(jù)實(shí)際上還殘留著，但只要把 esp 寄存器的值更新為數(shù)據(jù)存儲地址前面的數(shù)據(jù)位置，該數(shù)據(jù)也就相當(dāng)于銷毀了。
我在編譯 .c 文件時，出現(xiàn)了下圖的這條消息
圖中的意思是指 c 的值在定義了但是一直未被使用，這其實(shí)是一項(xiàng)編譯器優(yōu)化的功能，由于存儲著函數(shù)返回值的變量 c 在后面沒有被用到，因此編譯器就認(rèn)為該變量沒有意義，進(jìn)而也就沒有生成與之對應(yīng)的匯編語言代碼。
下圖是調(diào)用這一函數(shù)前后棧內(nèi)存的變化
函數(shù)的內(nèi)部處理
上面我們用匯編代碼分析了一下 .c 整個過程的代碼，現(xiàn)在我們著重分析一下函數(shù)的源代碼部分，分析一下參數(shù)的接收、返回值和返回等機(jī)制
_AddNumprocnear pushebp-----------(1) movebp,esp-----------(2) moveax,dword ptr[ebp+8]-----------(3) addeax,dword ptr[ebp+12]-----------(4) popebp-----------(5) ret----------------------------------(6)_AddNumend
ebp 寄存器的值在(1)中入棧，在(5)中出棧，這主要是為了把函數(shù)中用到的 ebp 寄存器的內(nèi)容，恢復(fù)到函數(shù)調(diào)用前的狀態(tài) 。
(2) 中把負(fù)責(zé)管理?xiàng)５刂返?esp 寄存器的值賦值到了 ebp 寄存器中。這是因?yàn)?nbsp;，在 mov 指令中方括號內(nèi)的參數(shù) ，是不允許指定 esp 寄存器的。因此，這里就采用了不直接通過 esp，而是用 ebp 寄存器來讀寫棧內(nèi)容的方法。
(3) 使用[ebp + 8] 指定棧中存儲的第1個參數(shù)123，并將其讀出到 eax 寄存器中。像這樣，不使用 pop 指令，也可以參照棧的內(nèi)容。而之所以從多個寄存器中選擇了 eax 寄存器，是因?yàn)?eax 是負(fù)責(zé)運(yùn)算的累加寄存器。
通過(4) 的 add 指令，把當(dāng)前 eax 寄存器的值同第2個參數(shù)相加后的結(jié)果存儲在 eax 寄存器中。[ebp + 12] 是用來指定第2個參數(shù)456的。在 C 語言中，函數(shù)的返回值必須通過 eax 寄存器返回，這也是規(guī)定。也就是函數(shù)的參數(shù)是通過棧來傳遞，返回值是通過寄存器返回的。
(6) 中 ret 指令運(yùn)行后，函數(shù)返回目的地內(nèi)存地址會自動出棧，據(jù)此，程序流程就會跳轉(zhuǎn)返回到(6) (Call ) 的下一行。這時，函數(shù)入口和出口處棧的狀態(tài)變化，就如下圖所示
全局變量和局部變量
在熟悉了匯編語言后，接下來我們來了解一下全局變量和局部變量，在函數(shù)外部定義的變量稱為全局變量，在函數(shù)內(nèi)部定義的變量稱為局部變量，全局變量可以在任意函數(shù)中使用，局部變量只能在函數(shù)定義局部變量的內(nèi)部使用。下面，我們就通過匯編語言來看一下全局變量和局部變量的不同之處。
下面定義的 C 語言代碼分別定義了局部變量和全局變量，并且給各變量進(jìn)行了賦值，我們先看一下源代碼部分
// 定義被初始化的全局變量int a1 = 1;int a2 = 2;int a3 = 3;int a4 = 4;int a5 = 5;// 定義沒有初始化的全局變量int b1,b2,b3,b4,b5;// 定義函數(shù)void MyFunc(){// 定義局部變量int c1,c2,c3,c4,c5,c6,c7,c8,c9,c10;// 給局部變量賦值c1 = 1;c2 = 2;c3 = 3;c4 = 4;c5 = 5;c6 = 6;c7 = 7;c8 = 8;c9 = 9;c10 = 10;// 把局部變量賦值給全局變量a1 = c1;a2 = c2;a3 = c3;a4 = c4;a5 = c5;b1 = c6;b2 = c7;b3 = c8;b4 = c9;b5 = c10;}
上面的代碼挺暴力的，不過沒關(guān)系，能夠便于我們分析其匯編源碼就好，我們用C++ 編譯后的匯編代碼如下，編譯完成后的源碼比較長，這里我們只拿出來一部分作為分析使用（我們改變了一下段定義順序，刪除了部分注釋）
_DATA segment dword public use32 'DATA'align 4_a1 label dworddd 1align 4_a2 label dworddd 2align 4_a3 label dworddd 3align 4_a4 label dworddd 4align 4_a5 label dworddd 5_DATA ends_BSS segment dword public use32 'BSS' align 4_b1 label dworddb 4 dup(?)align 4_b2 label dworddb 4 dup(?)align 4_b3 label dworddb 4 dup(?)align 4_b4 label dworddb 4 dup(?)align 4_b5 label dworddb 4 dup(?)_BSS ends_TEXT segment dword public use32 'CODE'_MyFunc proc near pushebp movebp,esp addesp,-20 pushebx pushesi moveax,1 movedx,2 movecx,3 movebx,4 movesi,5 movdword ptr [ebp-4],6 movdword ptr [ebp-8],7 movdword ptr [ebp-12],8 movdword ptr [ebp-16],9 movdword ptr [ebp-20],10 movdword ptr [_a1],eax movdword ptr [_a2],edx movdword ptr [_a3],ecx movdword ptr [_a4],ebx movdword ptr [_a5],esi moveax,dword ptr [ebp-4] movdword ptr [_b1],eax movedx,dword ptr [ebp-8] movdword ptr [_b2],edx movecx,dword ptr [ebp-12] movdword ptr [_b3],ecx moveax,dword ptr [ebp-16] movdword ptr [_b4],eax movedx,dword ptr [ebp-20] movdword ptr [_b5],edx popesi popebx movesp,ebp popebp ret _MyFuncendp_TEXTends
【程序員不得不了解的七大模塊硬核知識，你都知道哪些呢？】編譯后的程序，會被歸類到名為段定義的組。
_DATA segment dword public use32 'DATA'..._DATA ends
_BSS segment dword public use32 'BSS' ..._BSS ends
_TEXT segment dword public use32 'CODE'_MyFunc proc near..._MyFuncendp_TEXTends
我們在分析上面匯編代碼之前，先來認(rèn)識一下更多的匯編指令，此表是對上面部分操作碼及其功能的接續(xù)
操作碼操作數(shù) 功能 add A,B 把A和B的值相加，并把結(jié)果賦值給A call A 調(diào)用函數(shù)A cmp A,B 對A和B進(jìn)行比較，比較結(jié)果會自動存入標(biāo)志寄存器中 inc A 對A的值 + 1 ige 標(biāo)簽名和 cmp 命令組合使用。跳轉(zhuǎn)到標(biāo)簽行 jl 標(biāo)簽名和 cmp 命令組合使用。跳轉(zhuǎn)到標(biāo)簽行 jle 標(biāo)簽名和 cmp 命令組合使用。跳轉(zhuǎn)到標(biāo)簽行 jmp 標(biāo)簽名和 cmp 命令組合使用。跳轉(zhuǎn)到標(biāo)簽行 mov A,B 把 B 的值賦給 A pop A 從棧中讀取數(shù)值并存入A push A 把A的值存入棧中 ret 無將處理返回到調(diào)用源 xor A,B A和B的位進(jìn)行亦或比較，并將結(jié)果存入A中
我們首先來看一下 _DATA 段定義的內(nèi)容。_a1 label dword 定義了 _a1 這個標(biāo)簽。標(biāo)簽表示的是相對于段定義起始位置的位置。由于_a1 在 _DATA 段定義的開頭位置，所以相對位置是0 。_a1 就相當(dāng)于是全局變量a1 。編譯后的函數(shù)名和變量名前面會加一個(_) ，這也是C++ 的規(guī)定。dd 1 指的是，申請分配了4字節(jié)的內(nèi)存空間，存儲著1這個初始值。dd指的是word表示有兩個長度為2的字節(jié)領(lǐng)域(word)，也就是4字節(jié)的意思。
C++ 中，由于int 類型的長度是4字節(jié)，因此匯編器就把 int a1 = 1 變換成了 _a1 label dword 和 dd 1 。同樣，這里也定義了相當(dāng)于全局變量的 a2 – a5 的標(biāo)簽 _a2 – _a5，它們各自的初始值 2 – 5 也被存儲在各自的4字節(jié)中。
接下來，我們來說一說 _BSS 段定義的內(nèi)容。這里定義了相當(dāng)于全局變量 b1 – b5 的標(biāo)簽 _b1 – _b5 。其中的db 4dup(?) 表示的是申請分配了4字節(jié)的領(lǐng)域，但值尚未確定（這里用 ? 來表示）的意思。db( byte) 表示有1個長度是1字節(jié)的內(nèi)存空間。因而，db 4 dup(?) 的情況下，就是4字節(jié)的內(nèi)存空間。
注意：db 4 dup(?) 不要和 dd 4 混淆了，前者表示的是4個長度是1字節(jié)的內(nèi)存空間。而 db 4 表示的則是雙字節(jié)( = 4 字節(jié)) 的內(nèi)存空間中存儲的值是 4
臨時確保局部變量使用的內(nèi)存空間
我們知道，局部變量是臨時保存在寄存器和棧中的。函數(shù)內(nèi)部利用棧進(jìn)行局部變量的存儲，函數(shù)調(diào)用完成后，局部變量值被銷毀，但是寄存器可能用于其他目的。所以，局部變量只是函數(shù)在處理期間臨時存儲在寄存器和棧中的。
回想一下上述代碼是不是定義了10個局部變量？這是為了表示存儲局部變量的不僅僅是棧，還有寄存器。為了確保 c1 – c10 所需的域，寄存器空閑的時候就會使用寄存器，寄存器空間不足的時候就會使用棧。
讓我們繼續(xù)來分析上面代碼的內(nèi)容。_TEXT段定義表示的是函數(shù)的范圍。在函數(shù)中定義的局部變量所需要的內(nèi)存領(lǐng)域。會被盡可能的分配在寄存器中。大家可能認(rèn)為使用高性能的寄存器來替代普通的內(nèi)存是一種資源浪費(fèi)，但是編譯器不這么認(rèn)為，只要寄存器有空間，編譯器就會使用它。由于寄存器的訪問速度遠(yuǎn)高于內(nèi)存，所以直接訪問寄存器能夠高效的處理。局部變量使用寄存器，是C++ 編譯器最優(yōu)化的運(yùn)行結(jié)果。
代碼清單中的如下內(nèi)容表示的是向寄存器中分配局部變量的部分
moveax,1movedx,2movecx,3movebx,4movesi,5
僅僅對局部變量進(jìn)行定義是不夠的，只有在給局部變量賦值時，才會被分配到寄存器的內(nèi)存區(qū)域。上述代碼相當(dāng)于就是給5個局部變量 c1 – c5 分別賦值為 1 – 5 。eax、edx、ecx、ebx、esi 是 x86 系列32位 CPU 寄存器的名稱。至于使用哪個寄存器，是由編譯器來決定的。
x86 系列 CPU 擁有的寄存器中，程序可以操作的是十幾，其中空閑的最多會有幾個。因而，局部變量超過寄存器數(shù)量的時候，可分配的寄存器就不夠用了，這種情況下，編譯器就會把棧派上用?。?美創(chuàng)媧⑹Ｓ嗟木植勘淞?。
在上述代碼這一部分，給局部變量c1 – c5 分配完寄存器后，可用的寄存器數(shù)量就不足了。于是，剩下的5個局部變量c6 – c10 就被分配給了棧的內(nèi)存空間。如下面代碼所示
movdword ptr [ebp-4],6movdword ptr [ebp-8],7movdword ptr [ebp-12],8movdword ptr [ebp-16],9movdword ptr [ebp-20],10
函數(shù)入口 add esp,-20 指的是，對棧數(shù)據(jù)存儲位置的 esp 寄存器(棧指針)的值做減20的處理。為了確保內(nèi)存變量 c6 – c10 在棧中，就需要保留5個 int 類型的局部變量（4字節(jié) * 5 = 20 字節(jié)）所需的空間。mov ebp,esp這行指令表示的意思是將 esp 寄存器的值賦值到 ebp 寄存器。之所以需要這么處理，是為了通過在函數(shù)出口處 mov esp ebp 這一處理，把 esp 寄存器的值還原到原始狀態(tài)，從而對申請分配的?？臻g進(jìn)行釋放，這時棧中用到的局部變量就消失了。這也是棧的清理處理。在使用寄存器的情況下，局部變量則會在寄存器被用于其他用途時自動消失，如下圖所示。
movdword ptr [ebp-4],6 movdword ptr [ebp-8],7 movdword ptr [ebp-12],8 movdword ptr [ebp-16],9 movdword ptr [ebp-20],10
這五行代碼是往棧空間代入數(shù)值的部分，由于在向棧申請內(nèi)存空間前，借助了 mov ebp, esp 這個處理，esp 寄存器的值被保存到了 esp 寄存器中，因此，通過使用[ebp – 4]、[ebp – 8]、[ebp – 12]、[ebp – 16]、[ebp – 20] 這樣的形式，就可以申請分配20字節(jié)的棧內(nèi)存空間切分成5個長度為4字節(jié)的空間來使用。例如，mov dword ptr [ebp-4],6 表示的就是，從申請分配的內(nèi)存空間的下端(ebp寄存器指示的位置)開始向前4字節(jié)的地址([ebp – 4]) 中，存儲著6這一4字節(jié)數(shù)據(jù) 。
循環(huán)控制語句的處理
上面說的都是順序流程，那么現(xiàn)在就讓我們分析一下循環(huán)流程的處理，看一下 for 循環(huán)以及 if 條件分支等 c 語言程序的流程控制是如何實(shí)現(xiàn)的，我們還是以代碼以及編譯后的結(jié)果為例，看一下程序控制流程的處理過程。
// 定義MySub 函數(shù)void MySub(){// 不做任何處理}// 定義MyFunc 函數(shù)void Myfunc(){int i;for(int i = 0;i < 10;i++){// 重復(fù)調(diào)用MySub十次MySub();}}
上述代碼將局部變量 i 作為循環(huán)條件，循環(huán)調(diào)用十次MySub 函數(shù)，下面是它主要的匯編代碼
xorebx, ebx; 將寄存器清0@4call_MySub; 調(diào)用MySub函數(shù)incebx; ebx寄存器的值 + 1cmpebx,10; 將ebx寄存器的值和10進(jìn)行比較jlshort @4 ; 如果小于10就跳轉(zhuǎn)到 @4
C 語言中的 for 語句是通過在括號中指定循環(huán)計(jì)數(shù)器的初始值(i = 0)、循環(huán)的繼續(xù)條件(i < 10)、循環(huán)計(jì)數(shù)器的更新(i++) 這三種形式來進(jìn)行循環(huán)處理的。與此相對的匯編代碼就是通過比較指令(cmp) 和跳轉(zhuǎn)指令(jl)來實(shí)現(xiàn)的。
下面我們來對上述代碼進(jìn)行說明
函數(shù)中用到的局部變量只有 i ，變量 i 申請分配了 ebx 寄存器的內(nèi)存空間。for 語句括號中的 i = 0 被轉(zhuǎn)換為 xor ebx,ebx 這一處理， xor 指令會對左起第一個操作數(shù)和右起第二個操作數(shù)進(jìn)行 XOR 運(yùn)算，然后把結(jié)果存儲在第一個操作數(shù)中。由于這里把第一個操作數(shù)和第二個操作數(shù)都指定為了 ebx，因此就變成了對相同數(shù)值的 XOR 運(yùn)算。也就是說不管當(dāng)前寄存器的值是什么，最終的結(jié)果都是0 。類似的，我們使用 mov ebx,0 也能得到相同的結(jié)果，但是 xor 指令的處理速度更快，而且編譯器也會啟動最優(yōu)化功能。
XOR 指的就是異或操作，它的運(yùn)算規(guī)則是如果a、b兩個值不相同，則異或結(jié)果為1 。如果a、b兩個值相同，異或結(jié)果為0 。
相同數(shù)值進(jìn)行 XOR 運(yùn)算，運(yùn)算結(jié)果為0 。XOR 的運(yùn)算規(guī)則是，值不同時結(jié)果為1，值相同時結(jié)果為0 。例如和進(jìn)行運(yùn)算，就會分別對各個數(shù)字位進(jìn)行 XOR 運(yùn)算。因?yàn)槊總€數(shù)字位都相同，所以運(yùn)算結(jié)果為0 。
ebx 寄存器的值初始化后，會通過 call 指定調(diào)用函數(shù) ，從函數(shù)返回后，會執(zhí)行inc ebx 指令，對 ebx 的值進(jìn)行 + 1 操作，這個操作就相當(dāng)于 i++ 的意思，++ 表示的就是當(dāng)前數(shù)值 + 1 。
這里需要知道 i++ 和 ++i 的區(qū)別
i++ 是先賦值，復(fù)制完成后再對 i執(zhí)行 + 1 操作
++i 是先進(jìn)行 +1 操作，完成后再進(jìn)行賦值
inc 下一行的 cmp 是用來對第一個操作數(shù)和第二個操作數(shù)的數(shù)值進(jìn)行比較的指令。cmp ebx,10 就相當(dāng)于 C 語言中的 i < 10 這一處理，意思是把 ebx 寄存器的值與10進(jìn)行比較。匯編語言中比較指令的結(jié)果，會存儲在 CPU 的標(biāo)志寄存器中。不過，標(biāo)志寄存器的值，程序是無法直接參考的。那如何判斷比較結(jié)果呢？
匯編語言中有多個跳轉(zhuǎn)指令，這些跳轉(zhuǎn)指令會根據(jù)標(biāo)志寄存器的值來判斷是否進(jìn)行跳轉(zhuǎn)操作，例如最后一行的 jl ，它會根據(jù) cmp ebx,10 指令所存儲在標(biāo)志寄存器中的值來判斷是否跳轉(zhuǎn)，jl 這條指令表示的就是 jump on less than(小于的話就跳轉(zhuǎn)) 。發(fā)現(xiàn)如果 i 比 10 小，就會跳轉(zhuǎn)到 @4 所在的指令處繼續(xù)執(zhí)行。
那么匯編代碼的意思也可以用 C 語言來改寫一下，加深理解
i ^= i;L4: MySub();i++;if(i < 10) goto L4;
代碼第一行 i ^= i 指的就是 i 和 i 進(jìn)行異或運(yùn)算，也就是 XOR 運(yùn)算， MySub() 函數(shù)用 L4 標(biāo)簽來替代，然后進(jìn)行 i 自增操作，如果i 的值小于 10 的話，就會一直循環(huán) MySub() 函數(shù) 。
條件分支的處理方法
條件分支的處理方式和循環(huán)的處理方式很相似，使用的也是 cmp 指令和跳轉(zhuǎn)指令。下面是用 C 語言編寫的條件分支的代碼
// 定義MySub1 函數(shù)void MySub1(){ // 不做任何處理}// 定義MySub2 函數(shù)void MySub2(){// 不做任何處理}// 定義MySub3 函數(shù)void MySub3(){ // 不做任何處理}// 定義MyFunc 函數(shù)void MyFunc(){ int a = 123; // 根據(jù)條件調(diào)用不同的函數(shù) if(a > 100){MySub1(); } else if(a < 50){MySub2(); } else {MySub3(); }}
很簡單的一個實(shí)現(xiàn)了條件判斷的 C 語言代碼，那么我們把它用C++ 編譯之后的結(jié)果如下
_MyFunc proc near pushebpmovebp,esp moveax,123; 把123存入 eax 寄存器中 cmpeax,100; 把 eax 寄存器的值同100進(jìn)行比較 jleshort @8; 比100小時，跳轉(zhuǎn)到@8標(biāo)簽 call_MySub1; 調(diào)用MySub1函數(shù) jmpshort @11; 跳轉(zhuǎn)到@11標(biāo)簽@8: cmpeax,50; 把 eax 寄存器的值同50進(jìn)行比較 jgeshort @10; 比50大時，跳轉(zhuǎn)到@10標(biāo)簽 call_MySub2; 調(diào)用MySub2函數(shù) jmpshort @11; 跳轉(zhuǎn)到@11標(biāo)簽@10: call_MySub3; 調(diào)用MySub3函數(shù)@11: popebp ret _MyFunc endp
上面代碼用到了三種跳轉(zhuǎn)指令，分別是jle(jump on less or equal) 比較結(jié)果小時跳轉(zhuǎn) ， jge(jump onor equal) 比較結(jié)果大時跳轉(zhuǎn)，還有不管結(jié)果怎樣都會進(jìn)行跳轉(zhuǎn)的jmp，在這些跳轉(zhuǎn)指令之前還有用來比較的指令 cmp，構(gòu)成了上述匯編代碼的主要邏輯形式。
了解程序運(yùn)行邏輯的必要性
通過對上述匯編代碼和 C 語言源代碼進(jìn)行比較，想必大家對程序的運(yùn)行方式有了新的理解，而且，從匯編源代碼中獲取的知識，也有助于了解 Java 等高級語言的特性，比如 Java 中就有關(guān)鍵字修飾的變量，那么這個變量的底層就是使用 C 語言編寫的，還有一些 Java 中的語法糖只有通過匯編代碼才能知道其運(yùn)行邏輯。在某些情況下，對于查找 bug 的原因也是有幫助的。
上面我們了解到的編程方式都是串行處理的，那么串行處理有什么特點(diǎn)呢？
串行處理最大的一個特點(diǎn)就是專心只做一件事情，一件事情做完之后才會去做另外一件事情。
計(jì)算機(jī)是支持多線程的，多線程的核心就是 CPU切換，如下圖所示
我們還是舉個實(shí)際的例子，讓我們來看一段代碼
// 定義全局變量int counter = 100;// 定義MyFunc1()void MyFunc(){counter *= 2;}// 定義MyFunc2()void MyFunc2(){counter *= 2;}
上述代碼是更新的值的 C 語言程序， () 和 () 的處理內(nèi)容都是把的值擴(kuò)大至原來的二倍，然后再把的值賦值給。這里，我們假設(shè)使用多線程處理，同時調(diào)用了一次和函數(shù) ，這時，全局變量的值，理應(yīng)編程 100 * 2 * 2 = 400 。如果你開啟了多個線程的話，你會發(fā)現(xiàn)的數(shù)值有時也是 200，對于為什么出現(xiàn)這種情況，如果你不了解程序的運(yùn)行方式，是很難找到原因的。
我們將上面的代碼轉(zhuǎn)換成匯編語言的代碼如下
mov eax,dword ptr[_counter]; 將 counter 的值讀入 eax 寄存器add eax,eax; 將 eax 寄存器的值擴(kuò)大2倍。mov dword ptr[_counter],eax; 將 eax 寄存器的值存入 counter 中。
在多線程程序中，用匯編語言表示的代碼每運(yùn)行一行，處理都有可能切換到其他線程中。因而，假設(shè)函數(shù)在讀出數(shù)值100后，還未來得及將它的二倍值200寫入時，正巧函數(shù)讀出了的值100，那么結(jié)果就將變?yōu)?200。
為了避免該bug，我們可以采用以函數(shù)或 C 語言代碼的行為單位來禁止線程切換的鎖定方法，或者使用某種線程安全的方式來避免該問題的出現(xiàn) 。
現(xiàn)在基本上沒有人用匯編語言來編寫程序了，因?yàn)?C、Java等高級語言的效率要比匯編語言快很多。不過，匯編語言的經(jīng)驗(yàn)還是很重要的，通過借助匯編語言，我們可以更好的了解計(jì)算機(jī)運(yùn)行機(jī)制。
本文到此結(jié)束，希望對大家有所幫助。

程序員不得不了解的七大模塊硬核知識，你都知道哪些呢？

程序員不得不了解的七大模塊硬核知識，你都知道哪些呢？