注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫經典并行與量子并行:提升并挖掘計算系統(tǒng)的潛在性能

經典并行與量子并行:提升并挖掘計算系統(tǒng)的潛在性能

經典并行與量子并行:提升并挖掘計算系統(tǒng)的潛在性能

定 價:¥129.00

作 者: 劉宇航
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111750826 出版時間: 2024-10-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字數(shù):  

內容簡介

  本書深入淺出介紹后摩爾時代的并行計算核心技術,理論與實踐并重,同時兼顧數(shù)學模型、結構模型、編程模型。本書具有以下特色:從概念上明確算勢與算力的聯(lián)系與區(qū)別,強調在后摩爾時代背景下從潛在能力(算勢)到實際能力(算力)的充分轉化的重要性;注重量化分析和理論推導,單列一章對計算性能模型和存儲性能進行了介紹;注重并行應用程序的設計,單列一章介紹并對比分析了共享存儲編程與非共享存儲編程的基本原理;注重融會貫通,培養(yǎng)整體觀念,分別考察了共享存儲結構和分布式存儲結構,揭示潛在的可利用的并行硬件資源以及對應的編程方法;編制了大量的原創(chuàng)的有助于提高讀者理解深度和應用知識能力的例題;在國內外同類教材或專著中,率先以算勢和算力的統(tǒng)一的視角,系統(tǒng)對比了經典并行計算與量子并行計算,促進兩個領域的溝通融合。

作者簡介

  劉宇航 中國科學院計算技術研究所副研究員,《中國計算機學會通訊》編委、專欄作家,中國計算機學會職業(yè)倫理和公共政策工作委員會常務委員,中國計算機學會高級會員。研究方向為計算機體系結構、高性能計算、存儲系統(tǒng)、智能并發(fā)系統(tǒng)等。在包括HPCA、SC、DAC、TPDS等國內外高水平的期刊和學術會議上累計發(fā)表論文60余篇,專著3部,發(fā)明專利10余項,一系列關鍵技術實際落地應用到國產智能手機等一線芯片或系統(tǒng),致力于構建信息技術新體系以解決卡脖子技術難題。

圖書目錄

推薦序一
推薦序二
前言
第1章 計算概念的譜系
1.1 引言/ 2 
1.2 計算概念譜系化的意義/ 3 
1.3 計算概念的譜系/ 4 
1.3.1 算勢/ 5 
1.3.2 算力/ 7 
1.3.3 算術/ 10 
1.3.4 算法/ 11 
1.3.5 算禮/ 13 
1.4 計算概念譜系組分的相互關系/ 14 
1.5 從場的角度認識算勢與算力的異同/ 16 
1.6 證明與計算之間的關系/ 20 
1.7 本章小結/ 23 
1.8 思考題/ 23 
參考文獻/ 23 
第2章 并行處理的意義及挑戰(zhàn)
2.1 引言/ 26 
2.2 并行計算機與應用和工藝的關系/ 26 
2.3 并行處理的普遍性/ 28 
2.4 多核微處理器技術/ 31 
2.5 并行處理需要應對的挑戰(zhàn)/ 35 
2.6 并行處理的學科任務/ 40 
2.7 本章小結/ 41 
2.8 思考題/ 41 
參考文獻/ 41 
第3章 并行處理的一般原理
3.1 引言/ 44 
3.2 馮·諾依曼結構/ 44 
3.3 通過實例說明指令級并行與數(shù)據(jù)依賴/ 47 
3.4 通過實例說明線程級并行/ 49 
3.5 延遲隱藏和延遲減少/ 55 
3.6 并行處理技術的圖形化表示/ 60 
3.7 費林分類法/ 63 
3.8 指令級并行/ 65 
3.8.1 流水線技術/ 65 
3.8.2 指令的動態(tài)調度/ 65 
3.8.3 多發(fā)射技術/ 66 
3.9 并行計算機系統(tǒng)的分類/ 67 
3.9.1 向量計算機/ 67 
3.9.2 多處理機/ 68 
3.9.3 多主機/ 68 
3.9.4 大規(guī)模并行處理計算機/ 68 
3.10 并行結構的類型/ 69 
3.10.1 單處理器的并行結構/ 69 
3.10.2 多處理器的并行結構/ 69 
3.10.3 處理機結構創(chuàng)新的歷史/ 70 
3.10.4 多核共享內存模型/ 73 
3.10.5 多核消息傳遞模型/ 76 
3.11 本章小結/ 80 
3.12 思考題/ 81 
參考文獻/ 81 
第4章 計算性能模型和存儲性能模型
4.1 引言/ 84 
4.2 并行執(zhí)行時間效率模型/ 85 
4.3 可擴展定律/ 103 
4.3.1 阿姆達爾定律/ 103 
4.3.2 古斯塔夫森-巴西斯定律/ 104 
4.3.3 存儲受限的擴展定律(孫-倪定律)/ 106 
4.4 并行計算模型/ 112 
4.4.1 PRAM模型/ 112 
4.4.2 BSP模型/ 114 
4.4.3 LogP模型/ 117 
4.5 程序性能指標/ 120 
4.5.1 單道程序工作負載的性能指標/ 120 
4.5.2 多道程序工作負載的性能指標/ 122 
4.6 存儲系統(tǒng)的性能指標/ 123 
4.6.1 平均存儲訪問時間/ 123 
4.6.2 存儲延遲與存儲帶寬/ 124 
4.6.3 單位時鐘周期完成的存儲訪問數(shù)量/ 126 
4.6.4 并發(fā)平均存儲訪問時間/ 127 
4.6.5 存儲級并行性/ 130 
4.6.6 并發(fā)感知的局部性/ 131 
4.7 基準測試/ 133 
4.7.1 基準測試的定義和分類/ 133 
4.7.2 基準測試運行的規(guī)范/ 134 
4.7.3 基準測試程序組的要求/ 134 
4.7.4 基準測試的開發(fā)者/ 135 
4.7.5 性能測試結果的總結/ 136 
4.8 性能評估方式/ 136 
4.8.1 Roofline模型/ 136 
4.8.2 模擬器/ 151 
4.8.3 需要避免的4個陷阱/ 160 
4.9 本章小結/ 161 
4.10 思考題/ 161 
參考文獻/ 161 
第5章 共享存儲結構與編程
5.1 引言/ 164 
5.2 共享存儲體系結構的類型/ 165 
5.3 并行編程模型/ 168 
5.3.1 抽象與實現(xiàn)的區(qū)別及其實例/ 168 
5.3.2 通信與協(xié)作/ 176 
5.3.3 通信層面三種并行編程模型的特點/ 187 
5.3.4 混合編程模型/ 188 
5.4 并行處理的流程/ 189 
5.4.1 思路和實例/ 189 
5.4.2 問題分解/ 193 
5.4.3 任務分配/ 193 
5.4.4 協(xié)調/ 194 
5.4.5 進程映射/ 194 
5.5 并行編程優(yōu)化/ 205 
5.5.1 靜態(tài)分配與動態(tài)分配/ 206 
5.5.2 延遲與帶寬/ 214 
5.5.3 內在通信與人為通信/ 217 
5.6 減少通信的技術/ 221 
5.6.1 利用時間局部性/ 221 
5.6.2 利用空間局部性/ 222 
5.7 共享內存體系結構/ 228 
5.8 共享內存體系結構編程——OpenMP/ 242 
5.9 實驗——OpenMP/ 274
5.9.1 實驗——OpenMP求sinx/ 274 
5.9.2 實驗——OpenMP求π值/ 278 
5.9.3 實驗——OpenMP求斐波那契數(shù)列第n項/ 283 
5.9.4 實驗——Gauss-Seidel迭代算法的并行實現(xiàn)及其優(yōu)化/ 291 
5.10 本章小結/ 296 
5.11 思考題/ 296 參考文獻/ 296 
第6章 分布式存儲結構與編程
6.1 引言/ 300 
6.2 向量處理機體系結構/ 300 
6.2.1 結構特點/ 300 
6.2.2 性能分析/ 305 
6.2.3 向量指令并行/ 307 
6.2.4 向量鏈/ 307 
6.2.5 向量分解strip-mining技術/ 308 
6.2.6 向量條件執(zhí)行/ 308 
6.2.7 壓縮/展開操作/ 309 
6.2.8 向量歸約/ 310 
6.2.9 存儲訪問/ 311 
6.2.10 分散和聚集/ 312 
6.3 SIMD編程/ 327 
6.3.1 SIMD簡介/ 327 
6.3.2 實現(xiàn)向量化的幾種方法/ 327 
6.3.3 向量化編譯指令/ 328 
6.3.4 向量化過程中的主要挑戰(zhàn)/ 330 
6.3.5 編譯器向量化方式/ 335 
6.3.6 循環(huán)變換/ 339 
6.3.7 數(shù)據(jù)地址對齊/ 341 
6.3.8 別名/ 341 
6.3.9 條件語句/ 342 
6.3.10 原生SIMD支持/ 342 
6.4 CUDA編程/ 343 
6.4.1 異構計算的定義/ 344 
6.4.2 CUDA/ 345 
6.4.3 GPU的并發(fā)控制/ 346 
6.4.4 GPU的內存管理/ 347 
6.4.5 SIMT/ 348 
6.4.6 CUDA編程/ 349 
6.4.7 CUDA與GPU硬件之間的映射/ 355 
6.4.8 深流水線設計/ 356 
6.4.9 GPU內存/ 356 
6.4.10 GPU并發(fā)策略/ 358 
6.4.11 庫函數(shù)介紹/ 358 
6.5 MPI編程/ 363 
6.5.1 MPI在編程模型內的分類定位/ 363 
6.5.2 信息交互模型與通信方式/ 364 
6.5.3 MPI基本函數(shù)/ 367 
6.5.4 MPI程序執(zhí)行(以C on linux為例)/ 370 
6.5.5 MPI集群通信函數(shù)/ 370 
6.6 實驗——編寫MPI并行程序/ 379 
6.6.1 編寫MPI程序并行計算平均值/ 379 
6.6.2 編寫MPI程序并行計算矩陣向量乘法/ 381 
6.6.3 編寫MPI程序并行計算圓周率/ 383 
6.7 實驗——基于CUDA并發(fā)的矩陣乘法/ 386 
6.8 本章小結/ 391 
6.9 思考題/ 392 
第7章 并行計算機系統(tǒng)的互連網(wǎng)絡
7.1 引言/ 394 
7.2 互連網(wǎng)絡的基本概念/ 394 
7.2.1 互連網(wǎng)絡分層架構/ 394 
7.2.2 互連網(wǎng)絡相關參數(shù)/ 395 
7.3 互連網(wǎng)絡物理層/ 397 
7.3.1 消息結構/ 397 
7.3.2 物理層流控制/ 397 
7.4 互連網(wǎng)絡交換層/ 398 
7.4.1 互連網(wǎng)絡交換層功能與架構/ 398 
7.4.2 互連網(wǎng)絡交換層技術/ 399 
7.5 互連網(wǎng)絡路由層/ 402 
7.5.1 互連網(wǎng)絡拓撲結構/ 402 
7.5.2 互連網(wǎng)絡路由方式/ 409 
7.5.3 路由協(xié)議結構/ 410 
7.5.4 蝴蝶形拓撲結構路由算法/ 411 
7.5.5 維序路由算法/ 412 
7.5.6 死鎖問題/ 413 
7.6 互連網(wǎng)絡軟件層/ 415 
7.6.1 互連網(wǎng)絡軟件層架構/ 415 
7.6.2 性能分析/ 417 
7.7 本章小結/ 418 
7.8 思考題/ 419 
第8章 并行計算機系統(tǒng)的資源調度
8.1 引言/ 422 
8.2 相關工作/ 425 
8.2.1 延遲敏感型應用延遲測量與建模/ 426 
8.2.2 數(shù)據(jù)中心干擾的測度方法/ 427 
8.2.3 資源管理使能技術/ 427
8.2.4 資源調度策略/ 429
8.3 延遲敏感型應用分析與建模/ 432 
8.3.1 延遲敏感型應用概述/ 433 
8.3.2 延遲敏感型應用延遲的組成及影響因素/ 435 
8.3.3 平均延遲與尾延遲的關系/ 436 
8.3.4 Littles law的尾延遲形式/ 441 
8.4 數(shù)據(jù)中心干擾的測度/ 444 
8.4.1 信息熵與系統(tǒng)熵/ 445 
8.4.2 場景1:僅存在延遲敏感型應用時/ 445 
8.4.3 場景2:僅存在盡力交付型應用時/ 446 
8.4.4 場景3:延遲敏感型和盡力交付型應用混合運行時/ 447 
8.4.5 系統(tǒng)熵的優(yōu)點/ 447 
8.5 資源調度策略/ 449 
8.5.1 調度方法/ 450 
8.5.2 實驗驗證/ 453 
8.6 本章小結/ 459 
8.7 思考題/ 460 
參考文獻/ 460 
第9章 并行輸入輸出
9.1 引言/ 468 
9.2 I/O軟件棧/ 468 
9.3 并行文件系統(tǒng)/ 469 
9.4 常見并行文件系統(tǒng)/ 475 
9.4.1 并行虛擬文件系統(tǒng)PVFS/ 475 
9.4.2 通用并行文件系統(tǒng)GPFS/ 478 
9.4.3 集群文件系統(tǒng)Lustre/ 479 
9.5 POSIX/ 482 
9.6 MPI-I/O/ 483 
9.6.1 MPI-I/O的特性/ 483 
9.6.2 MPI-I/O示例/ 485 
9.6.3 MPI-I/O的底層讀寫優(yōu)化/ 487 
9.7 PnetCDF/ 490 
9.8 本章小結/ 495 
9.9 思考題/ 496 
參考文獻/ 496 
第10章 高速緩存一致性、同步和事務性內存
10.1 引言/ 498 
10.2 高速緩存一致性/ 498 
10.2.1 基于總線的一致性協(xié)議/ 500 
10.2.2 基于目錄的一致性協(xié)議/ 502 
10.3 目錄結構/ 503 
10.3.1 全映射位向量目錄/ 503 
10.3.2 有限指針目錄/ 504 
10.3.3 鏈式目錄/ 505 
10.3.4 粗糙向量目錄/ 506 
10.3.5 樹形壓縮向量目錄/ 506 
10.3.6 單級混合目錄/ 507 
10.3.7 多級目錄/ 508 
10.4 實現(xiàn)高速緩存一致的典型系統(tǒng)/ 511 
10.4.1 Dash/ 511 
10.4.2 Origin 2000/ 512 
10.4.3 Alewife/ 513 
10.4.4 Exemplar X/ 514 
10.4.5 NUMA-Q/ 514 
10.5 同步原語和鎖機制/ 515 
10.5.1 同步原語/ 515 
10.5.2 互斥鎖的實現(xiàn)/ 516 
10.5.3 柵障/ 520 
10.5.4 實驗——無鎖算法/ 524 
10.5.5 并行軟件優(yōu)化/ 533 
10.6 事務性內存/ 537 
10.6.1 事務性內存的特性/ 537 
10.6.2 事務性內存的優(yōu)點/ 538 
10.6.3 事務性內存的實現(xiàn)/ 543 
10.7 本章小結/ 549 
10.8 思考題/ 549 
參考文獻/ 550 
第11章 量子并行計算
11.1 引言/ 554 
11.2 對量子力學的基本理解/ 555 
11.2.1 量子力學與經典力學有本質區(qū)別/ 555 
11.2.2 量子計算的優(yōu)勢在于并行/ 555 
11.2.3 量子的概念/ 555 
11.2.4 不確定性原理/ 556 
11.2.5 對疊加態(tài)的理解/ 558 
11.2.6 張量積/ 561 
11.2.7 左矢與右矢/ 561 
11.3 幾種重要的熵及其聯(lián)系/ 563 
11.3.1

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號