一片晶圓僅做一顆芯片!史上最大芯片誕生!1.2萬億個晶體管

2019-08-20 13:09:03 來源:編譯:易建芯 原文出處:venturebeat


1.2萬億個晶體管,一片12英寸晶圓僅能做一顆芯片,史上最大芯片誕生!專門面向AI任務!
 

這顆巨型芯片,面積42225 平方毫米,擁有1.2 萬億個晶體管,400000 個核心,片上內存18G字節,內存帶寬19PByte/s,fabric帶寬100Pbit/s。是目前芯片面積最大的英偉達GPU的56.7倍!
 

一塊12英寸晶圓僅做一顆芯片
 

是目前芯片面積最大的英偉達GPU的56.7倍!
 

這就是有史以來最大的芯片——Cerebras Wafer Scale Engine!是由人工智能初創公司Cerebras Systems公司推出,擁有1.2萬億個晶體管。1971年英特爾首款4004處理器擁有2,300個晶體管,最近的Advanced Micro Devices處理器擁有320億個晶體管。
 

如何制造?
 

大多數芯片實際上是在12英寸硅晶元片上創建的芯片集合,每塊硅晶圓片可以集成成百上千顆芯片。但Cerebras Systems芯片是在單個晶圓上互連的單芯片。這些互連設計使其全部保持高速運行,因此萬億個晶體管全部一起工作。
 

通過這種方式,Cerebras Wafer Scale Engine是有史以來最大的處理器,它專門設計用于處理人工智能應用。該公司本周正在加利福尼亞州帕洛阿爾托的斯坦福大學舉行的Hot Chips會議上討論這項設計。
 

三星實際上已經制造了一個閃存芯片,即eUFS,擁有2萬億個晶體管。但Cerebras芯片專為加工而設計,擁有400,000個核心,42,225平方毫米。它比最大的Nvidia圖形處理單元大 56.7倍,該單元的尺寸為815平方毫米和211億個晶體管。
 

WSE還包含3,000倍的高速片上存儲器,并且具有10,000倍的存儲器帶寬。
 

芯片來自Andrew Feldman領導的團隊,后者曾創建微型服務器公司SeaMicro,并以3.34億美元的價格出售給Advanced Micro Devices。Cerebras Systems的聯合創始人兼首席硬件架構師Sean Lie將概述熱芯片上的Cerebras Wafer Scale Engine。加利福尼亞州Los Altos公司擁有194名員工。
 

上圖:安德魯費爾德曼與原始的SeaMicro盒子。
 

芯片尺寸在AI中非常重要,因為大芯片可以更快地處理信息,在更短的時間內產生答案。減少洞察時間或“培訓時間”,使研究人員能夠測試更多想法,使用更多數據并解決新問題。谷歌,Facebook,OpenAI,騰訊,百度和許多其他人認為,今天人工智能的基本限制是培訓模型需要很長時間。因此,縮短培訓時間消除了整個行業進步的主要瓶頸。
 

當然,芯片制造商通常不會制造這么大的芯片。在單個晶片的制造過程中通常會出現一些雜質。如果一種雜質會導致一塊芯片發生故障,實際制造出的芯片產量有一定良率,不可能100%都能用。但Cerebras設計的芯片留有冗余,一種雜質不會導致整個芯片都不能用。
 

性能優勢及用途
 

一個芯片提供超級計算機級的計算能力
 

“Cerebras WSE”專為人工智能設計而設計,其中包含了不少基礎創新,解決了限制芯片尺寸的長達數十年的技術挑戰 - 如芯片良率,功率傳送、封裝等,推動了最先進技術的發展。和包裝,每個架構決策都是為了優化AI工作的性能。結果是,Cerebras WSE根據工作量提供了數百或數千倍的現有解決方案的性能,只需很小的功耗和空間。”Cerebras Systems首席執行官的Fieldman說。
 

通過加速神經網絡訓練的所有元素來實現這些性能提升。神經網絡是一種多級計算反饋回路。輸入在循環中移動速度越快,循環學習的速度越快,即訓練時間越短??梢酝ㄟ^加速循環內的計算和通信來加速輸入的循環速度。
 

Linley Group首席分析師Linley Gwennap在一份聲明中說:“Cerebras憑借其晶圓級技術實現了巨大的飛躍,在單片硅片上實現了比任何人想象的更多的處理性能。為了實現這一壯舉,該公司已經解決了一系列惡性工程挑戰,這些挑戰幾十年來阻礙了該行業,包括實施高速芯片芯片通信,解決制造缺陷,封裝如此大的芯片,以及提供高成本 - 密度電源和冷卻。通過將各種學科的頂級工程師聚集在一起,Cerebras在短短幾年內創造了新技術并交付了一個產品,這是一項令人印象深刻的成就。”
 

Cerebras WSE芯片面積比目前最大的GPU大56.7倍, 并提供更多核心進行計算,有更多核心靠近內存,因此內核可以高效運行。由于這些大量的內核和內存位于單個芯片上,因此所有通信都在芯片上進行,通信帶寬高、延遲低,因此核心組可以以最高效率進行協作。
 

Cerebras WSE中的46,225平方毫米的芯片面積上包含40萬個AI優化核心,無緩存、無開銷的計算內核,以及18G字節的本地化分布式超高速SRAM內存。內存帶寬為每秒9PB(9000TB)。這些核心通過細粒度、全硬件、片上網絡連接在一起,可提供每秒100Pb(100*1000Tb)的總帶寬。更多核心、更多本地內存和低延遲高帶寬結構,共同構成了面向AI加速任務的最佳架構。
 

“雖然AI在一般意義上被使用,但沒有兩個數據集或兩個AI任務是相同的。新的AI工作負載不斷涌現,數據集也在不斷變大,”Tirias Research首席分析師兼創始人Jim McGregor在一份聲明中表示。
 

“隨著AI的發展,芯片和平臺解決方案也在不斷發展。Cerebras WSE是半導體和平臺設計方面的一項驚人的工程成就,它在單個晶圓級的解決方案中提供了超級計算機級的計算能力、高性能內存和帶寬。”
 

Cerebras 表示,如果沒有多年來與臺積電(TSMC)的密切合作,他們不可能取得這個創紀錄的成就。臺積電是全球最大的半導體代工廠,在先進工藝技術方面處于領先地位。WSE芯片臺積電采用先進的16nm制程技術制造。
 

更加深入的學習計算


WSE包含400,000個AI優化的計算核心。被稱為稀疏線性代數核心的SLAC,計算核心靈活,可編程,并針對支持所有神經網絡計算的稀疏線性代數進行了優化。SLAC的可編程性確保內核可以在不斷變化的機器學習領域中運行所有神經網絡算法。
 

由于稀疏線性代數核心針對神經網絡計算基元進行了優化,因此它們可實現業界最佳利用率 - 通常是圖形處理單元的三倍或四倍。此外,WSE核心包括Cerebras發明的稀疏性收集技術,以加速稀疏工作負載(包含零的工作負載)的計算性能,如深度學習。
 

WSE包含40萬個AI優化的計算內核(compute cores)。這種計算內核被稱為稀疏線性代數核(Sparse Linear Algebra Cores, SLAC),具有靈活性、可編程性,并針對支持所有神經網絡計算的稀疏線性代數進行了優化。SLAC的可編程性保證了內核能夠在不斷變化的機器學習領域運行所有的神經網絡算法。
 

由于稀疏線性代數內核是為神經網絡計算進行優化的,因此它們可實現業界最佳利用率——通常是GPU的3倍或4倍。此外,WSE核心還包括Cerebras發明的稀疏捕獲技術,以加速在稀疏工作負載(包含0的工作負載)上的計算性能,比如深度學習。
 

零在深度學習計算中很普遍。通常,要相乘的向量和矩陣中的大多數元素都是0。然而,乘以0是浪費硅,功率和時間的行為,因為沒有新的信息。
 

因為GPU和TPU是密集的執行引擎——引擎的設計永遠不會遇到0——所以它們即使在0時也會乘以每一個元素。當50-98%的數據為零時,如深度學習中經常出現的情況一樣,大多數乘法都被浪費了。由于Cerebras的稀疏線性代數核心永遠不會乘以零,所有的零數據都被過濾掉,可以在硬件中跳過,從而可以在其位置上完成有用的工作。
 

高效,高性能的片上存儲器-比GPU大3000倍


內存是每一種計算機體系結構的關鍵組成部分??拷嬎愕膬却嬉馕吨斓挠嬎?、更低的延遲和更好的數據移動效率。高性能的深度學習需要大量的計算和頻繁的數據訪問。這就要求計算核心和內存之間要非常接近,而在GPU中卻不是這樣,GPU中絕大多數內存都很慢,而且離計算核心很遠。
 

Cerebras Wafer Scale Engine包含了比迄今為止任何芯片都要多的內核和本地內存,并且在一個時鐘周期內擁有18GB的片上內存。WSE上的核心本地內存的集合提供了每秒9PB的內存帶寬——比最好的GPU大3000倍的片上內存和10000倍的內存帶寬。
 

帶寬,低延遲通信結構


Swarm通信結構是WSE上使用的處理器間通信結構,它以傳統通信技術功耗的一小部分實現了帶寬的突破和低延遲。Swarm提供了一個低延遲、高帶寬的2D網格,它將WSE上的所有400,000個核連接起來,每秒的帶寬總計達100 petabits。
 

路由、可靠的消息傳遞和同步都在硬件中處理。消息會自動激活每個到達消息的應用程序處理程序。Swarm為每個神經網絡提供了一個獨特的、優化的通信路徑。軟件根據正在運行的特定用戶定義的神經網絡的結構,配置通過400,000個核心的最優通信路徑,以連接處理器。
 

典型的消息通過一個具有納秒延遲的硬件鏈接。一個大腦WSE的總帶寬是每秒100 pb。不需要TCP/IP和MPI等通信軟件,因此可以避免性能損失。這種結構的通信能量成本遠低于1皮焦耳每比特,這比圖形處理單元低了近兩個數量級。結合了巨大的帶寬和極低的延遲,群通信結構使大腦WSE比任何當前可用的解決方案學習得更快。

 

  1. EETOP 官方微信

  2. 創芯大講堂 在線教育

  3. 創芯老字號 半導體快訊

相關文章

全部評論

  • 最新資訊
  • 最熱資訊
@2003-2021 EETOP

京ICP備10050787號   京公網安備:11010502037710

X
免费大片一级a一级久久