人妻无码久久一区二区三区免费,欧美视频精品免费覌看,成人无码av网站在线观看

美國(guó)服務(wù)器目前主流的Linux系統(tǒng)主機(jī)都是馮諾依曼架構(gòu)，即共享內(nèi)存的計(jì)算模型，這種過(guò)程計(jì)算模型對(duì)并行計(jì)算并不友好。這種美國(guó)服務(wù)器架構(gòu)中，有如下設(shè)計(jì)特點(diǎn)：

1）多個(gè)美國(guó)服務(wù)器CPU核改善處理器的計(jì)算處理能力

2）多級(jí)cache改善美國(guó)服務(wù)器CPU訪問(wèn)主存的效率

3）各個(gè)CPU都有本地內(nèi)存(NUMA(非一致性內(nèi)存訪問(wèn)))，進(jìn)一步改善CPU訪問(wèn)主存的效率

4）store buffer模塊改善cache write由于應(yīng)答延遲而造成的寫(xiě)停頓問(wèn)題

5）invalidate queue模塊改善使無(wú)效應(yīng)答的時(shí)延，把使無(wú)效命令放入queue后就立即發(fā)送應(yīng)答

6）外設(shè)DMA支持直接訪問(wèn)主存，改善美國(guó)服務(wù)器CPU使用效率

這些硬件體系設(shè)計(jì)特點(diǎn)也引入很多問(wèn)題，最大的問(wèn)題就是cache一致性問(wèn)題和亂序執(zhí)行問(wèn)題。cache一致性問(wèn)題由cache一致性協(xié)議MESI解決，MESI由硬件保證，對(duì)軟件來(lái)說(shuō)是透明的。

MESI協(xié)議保證所有CPU對(duì)單個(gè)cache line中單個(gè)變量修改的順序保持一致，但不保證不同變量的修改在所有CPU上看到的是相同順序。這就造成了亂序。不僅如此，亂序的原因還有很多：

1）store buffer引起的延遲處理，會(huì)造成亂序

2）invalidate queue引起的延遲處理，會(huì)造成亂序

3）編譯優(yōu)化，會(huì)造成亂序

4）分支預(yù)測(cè)、多流水線等CPU硬件優(yōu)化技術(shù)，會(huì)造成亂序

5）外設(shè)DMA，會(huì)造成數(shù)據(jù)亂序

這種情況造成，就連簡(jiǎn)單的++運(yùn)算操作的原子性都無(wú)法保證，而這些問(wèn)題必須采用多核并行編程新的技術(shù)手段來(lái)解決。

多核并行編程關(guān)鍵技術(shù)

1、鎖技術(shù)

美國(guó)服務(wù)器Linux kernel提供了多種鎖機(jī)制，如自旋鎖、信號(hào)量、互斥量、讀寫(xiě)鎖、順序鎖等。各種鎖的簡(jiǎn)單比較如下：

1）自旋鎖，不休眠，無(wú)進(jìn)程上下文切換開(kāi)銷，可以用在中斷上下文和臨界區(qū)小的場(chǎng)合

2）信號(hào)量，會(huì)休眠，支持同時(shí)多個(gè)并發(fā)體進(jìn)入臨界區(qū)，可以用在可能休眠或者長(zhǎng)的臨界區(qū)的場(chǎng)合

3）互斥量，類似與信號(hào)量，但只支持同時(shí)只有一個(gè)并發(fā)體進(jìn)入臨界區(qū)

4)讀寫(xiě)鎖，支持讀并發(fā)，寫(xiě)寫(xiě)/讀寫(xiě)間互斥，讀會(huì)延遲寫(xiě)，對(duì)讀友好，適用讀側(cè)重場(chǎng)合

5)順序鎖，支持讀并發(fā)，寫(xiě)寫(xiě)/讀寫(xiě)間互斥，寫(xiě)會(huì)延遲讀，對(duì)寫(xiě)友好，適用寫(xiě)側(cè)重場(chǎng)合

鎖技術(shù)雖然能有效地提供并行執(zhí)行下的競(jìng)態(tài)保護(hù)，但鎖的并行可擴(kuò)展性很差，無(wú)法充分發(fā)揮多核的性能優(yōu)勢(shì)。鎖的粒度太粗會(huì)限制擴(kuò)展性，粒度太細(xì)會(huì)導(dǎo)致巨大的系統(tǒng)開(kāi)銷，而且設(shè)計(jì)難度大，容易造成死鎖。以下技術(shù)手段或指導(dǎo)原則能解決或減輕這些問(wèn)題的風(fēng)險(xiǎn)：

1）按統(tǒng)一的層次順序使用鎖，解決死鎖問(wèn)題

2）指數(shù)后退，解決活鎖/饑餓問(wèn)題

3）范圍鎖，解決鎖驚群?jiǎn)栴}

4）優(yōu)先級(jí)繼承，解決優(yōu)先級(jí)反轉(zhuǎn)問(wèn)題

2、原子技術(shù)

原子技術(shù)主要是解決cache不一致性和亂序執(zhí)行對(duì)原子訪問(wèn)的破壞問(wèn)題。主要的原子原語(yǔ)有：

1）ACCESS_ONECE()：只限制編譯器對(duì)內(nèi)存訪問(wèn)的優(yōu)化

2)barrier()：只限制編譯器的亂序優(yōu)化

3)smb_wmb()：寫(xiě)內(nèi)存屏障，刷新store buffer，同時(shí)限制編譯器和美國(guó)服務(wù)器CPU的亂序優(yōu)化

4）smb_rmb()：讀內(nèi)存屏障，刷新invalidate queue，同時(shí)限制編譯器和美國(guó)服務(wù)器CPU的亂序優(yōu)化

5）smb_mb()：讀寫(xiě)內(nèi)存屏障，同時(shí)刷新store buffer和invalidate queue，同時(shí)限制編譯器和CPU的亂序優(yōu)化

6）atomic_inc()/atomic_read()：美國(guó)服務(wù)器整型原子操作

3、無(wú)鎖技術(shù)

原子技術(shù)是無(wú)鎖技術(shù)中的一種，除此之外，無(wú)鎖技術(shù)還包括RCU、Hazard pointer等，這些無(wú)鎖技術(shù)都基于內(nèi)存屏障實(shí)現(xiàn)的：

1）Hazard pointer主要用于對(duì)象的生命周期管理，類似引用計(jì)數(shù)，但比引用計(jì)數(shù)有更好的并行可擴(kuò)展性。

2）RCU適用的場(chǎng)景很多，其可以替代：讀寫(xiě)鎖、引用計(jì)數(shù)、垃圾回收器、等待事物結(jié)束等，而且有更好的并行擴(kuò)展性。但RCU也有一些不適用的場(chǎng)景，如寫(xiě)側(cè)重、臨界區(qū)長(zhǎng)、臨界區(qū)內(nèi)休眠等場(chǎng)景。

不過(guò)，所有的無(wú)鎖原語(yǔ)也只能解決讀端的并行可擴(kuò)展性問(wèn)題，寫(xiě)端的并行可擴(kuò)展性只能通過(guò)數(shù)據(jù)分割技術(shù)來(lái)解決。

4、數(shù)據(jù)分割技術(shù)

分割數(shù)據(jù)結(jié)構(gòu)，減少共享數(shù)據(jù)，是解決并行可擴(kuò)展性的根本辦法。對(duì)分割友好(即并行友好)的數(shù)據(jù)結(jié)構(gòu)有：

1）數(shù)組

2）哈希表

3）基樹(shù)/稀疏數(shù)組

4）跳躍列表

使用這些便于分割的數(shù)據(jù)結(jié)構(gòu)，有利于通過(guò)數(shù)據(jù)分割來(lái)改善并行可擴(kuò)展性。除了使用合適的數(shù)據(jù)結(jié)構(gòu)外，合理的分割指導(dǎo)規(guī)則也很重要：

1）讀寫(xiě)分割：把以讀為主的數(shù)據(jù)與以寫(xiě)為主的數(shù)據(jù)分開(kāi)

2）路徑分割：按獨(dú)立的代碼執(zhí)行路徑來(lái)分割數(shù)據(jù)

3）專項(xiàng)分割：把經(jīng)常更新的數(shù)據(jù)綁定到指定的CPU/線程中

4）所有權(quán)分割：按美國(guó)服務(wù)器CPU/線程個(gè)數(shù)對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行分割，把數(shù)據(jù)分割到per-cpu/per-thread中

以上這些美國(guó)服務(wù)器Linux系統(tǒng)多核并行編程內(nèi)容，基本上涵蓋了Linux kernel中所有的并發(fā)編程關(guān)鍵技術(shù)。當(dāng)然并行編程還有很多其他技術(shù)沒(méi)有應(yīng)用到Linux kernel中的，如無(wú)副作用的并行函數(shù)式編程技術(shù)、消息傳遞、MapReduce等等。

關(guān)注美聯(lián)科技，了解更多IDC資訊！