伊莉討論區

標題: 「脈動陣列」理論促進高效能平行運算發展 [打印本頁]

作者: super3g    時間: 2025-2-14 12:45 AM     標題: 「脈動陣列」理論促進高效能平行運算發展

「脈動陣列」理論促進高效能平行運算發展

[color=rgba(0, 0, 0, 0.87)]人工智慧(AI)正值當前科技浪潮的高峰,生成式AI不僅能自己寫出流暢文章,還能創作令人驚豔的圖片和影像,更能為產業帶來前所未有的升級。中央研究院孔祥重院士是臺灣AI領域的代表人物,目前為美國哈佛大學比爾蓋茲講座教授,也是「臺灣人工智慧學校」的校長。他在 1979 年提出「脈動陣列」理論(Systolic Array),促進高效能平行運算的基礎,為現行諸多AI算力加速器提供了一個有效的方案。

革命性的平行演算法

[color=rgba(0, 0, 0, 0.87)]1979 年,孔祥重院士和他的研究生 Charles Leiserson 提出了脈動陣列,這種高效能的平行計算架構,名稱來自醫學術語「心臟收縮期」(systole),因為運作方式就像心臟有節奏地收縮和快速輸血,數據不停地從一個小節點傳送到下一個節點,在陣列中不斷地傳遞和暫存,最後匯集成一個大的運算結果。這種計算方式能夠讓龐大的計算量同時進行,而且每個處理單元都能夠獨立計算,大幅提高了計算效率。

[color=rgba(0, 0, 0, 0.87)]傳統架構的處理單元在每次操作後,都要把數據傳送回主記憶體更新資料,存取一次記憶體就各需要花 100 奈秒,於是每秒最多只能執行五百萬次的操作。然而,脈動陣列架構具有多個處理單元並行計算,最後再把數據傳送回主記憶體,在當時可提升至每秒三千萬次的操作。這種架構有效地增加了計算密度和資料處理速度,對於高效能運算和 AI 晶片設計相當重要。

[color=rgba(0, 0, 0, 0.87)]脈動陣列的簡單示意圖(一維架構)上圖為傳統架構,處理單元(PE)每次操作後,都要回到主記憶體更新資料,存取一次記憶體就各需要花 100 奈秒,於是每秒最多只能執行五百萬次的操作。下圖為脈動陣列,有多個處理單元並行工作,最後再送回主記憶體,在當時可提升至每秒三千萬次的操作。這種架構有效地增加了計算密度和資料處理速度,對於高效能運算和 AI 晶片設計相當重要。  圖|研之有物(資料來源|孔祥重)

[color=rgba(0, 0, 0, 0.87)]脈動陣列的優點是,允許資料在處理單元之間直接傳遞和暫存,而無需頻繁地把數據傳送回主記憶體中存取,節省大量資料存取時間。 此外,由於每個處理單元都是獨立運作,個別不同的「小型計算」可以同時進行,效率非常高,因此特別適合處理需要大量重複計算的工作,例如圖像處理、深度學習等。

[color=rgba(0, 0, 0, 0.87)]目前的超級電腦和AI晶片,很多都採用類似的高效能運算設計,例如 Google 張量處理單元(Tensor Processing Unit, TPU)這是專門用在神經網路任務的處理器,晶片裡面有設計一塊256×256的矩陣乘法單元,就是脈動陣列架構。

[color=rgba(0, 0, 0, 0.87)]TPU 裡面的矩陣乘法單元示意圖(脈動陣列)。2017 年 Google 設計 256×256 的矩陣(圖中藍色大方塊),裡面有 65,536 個處理單元。紅色的控制單元負責協調資料流向,資料輸入後依序通過內部處理單元,計算結果會累加成部分和(Partial Sums),最後再由底部的處理單元輸出結果。

運算效能的提升開啟了AI時代

[color=rgba(0, 0, 0, 0.87)]脈動陣列已經成為當前AI硬體的核心運算架構之一。在 2023 年,美國電腦協會(Association for Computing Machinery, ACM)選出了 68 位對當代數位社會有重大貢獻的學者,並賦予會士(ACM Fellow)榮譽,孔祥重以電腦架構和平行運算的控制方法獲得表彰。此外,孔祥重也獲得 IEEE 分散式處理技術社群(TCDP)頒發的 2023 年傑出技術成就獎,表彰他在脈動陣列的開創貢獻。

[color=rgba(0, 0, 0, 0.87)]隨著高效能運算能力的提升、大量的網路文字資料,以及深度學習演算法的發展之下,AI領域在 2022 年 11 月出現突破性的進展:ChatGPT 誕生了,這種運用大型語言模型技術的生成式AI,引爆了 AI 的浪潮。

[color=rgba(0, 0, 0, 0.87)]當前的生成式 AI 不需要標籤化的數據就能學習,現採用例如自監督學習或強化式學習等方法。換句話說,人類有多少文章和知識,AI 就可以有多少訓練資料。有足夠的文本數據之後,生成式 AI 就能將文字轉換成向量,並不斷自我學習。你給它一個文字組合,它「算對」下一個向量,並以此「猜對」下一個字的機率也會愈來愈高,之後再生成通順的語句或文章。

[color=rgba(0, 0, 0, 0.87)]面對生成式AI的未來發展,孔祥重院士認為這是一場軍備競賽,其中最重要的就是把訓練資料的質和量提高。目前人類放進AI的資料量可能還不到未來幾年後的千分之一,隨著訓練資料的增加,AI的準確度和智力將顯著提高。但是,要讓AI發揮功能,背後還需要大量的高效能計算機器。因此,未來AI的突破將取決於誰能夠先累積更多高品質的數據,並設計及擁有更多更有效率的計算機器。這場資料與計算能力的競賽,將決定AI技術的發展方向和各國的AI競爭力。

(本文節錄自中央研究院「研之有物」科普平臺)




歡迎光臨 伊莉討論區 (http://a404.file-static.com/) Powered by Discuz!