創(chuàng)寶來科技芯資訊:全球首款 GDDR7 DRAM面世,三星造!
發(fā)布時(shí)間:2023/7/21
去年,三星公布了為 GPU 和服務(wù)器開發(fā) GDDR7 DRAM的計(jì)劃。今年早些時(shí)候,該公司透露了有關(guān)這些存儲(chǔ)芯片的更多細(xì)節(jié)。今天,三星宣布已完成 GDDR7 DRAM 芯片的開發(fā),該芯片將用于未來的汽車、游戲機(jī)、個(gè)人電腦、服務(wù)器和工作站。它是世界上第一家完成此類先進(jìn)存儲(chǔ)芯片開發(fā)的公司。
三星的GDDR7 DRAM 擁有破紀(jì)錄的 1.5TBps 帶寬,比 GDDR6 DRAM 高出 40%。得益于 PAM3(脈沖幅度調(diào)制)信號(hào)方法的增強(qiáng),它的每引腳速度為 32Gbps。PAM3 是一種新的內(nèi)存標(biāo)準(zhǔn),允許在同一信令周期內(nèi)發(fā)送多 50% 的數(shù)據(jù)。GDDR6 等上一代內(nèi)存芯片使用 NRZ(不歸零)信號(hào)發(fā)送方法。這些新型內(nèi)存芯片的能效也比 GDDR6 DRAM 芯片高出 20%。三星還為其新芯片提供了較低電壓的選擇,該芯片專門針對(duì)筆記本電腦和其他此類設(shè)備而設(shè)計(jì)。
為了減少熱量產(chǎn)生,除了 IC 架構(gòu)優(yōu)化之外,三星還在封裝中使用了新型 EMC(環(huán)氧樹脂模塑料)材料,它具有高導(dǎo)熱性。所有這些改進(jìn)使熱阻降低了 70%,從而提供了更穩(wěn)定的產(chǎn)品,即使在高壓力的操作條件下也能表現(xiàn)良好。三星的重要客戶將于今年開始測(cè)試DGGR7 DRAM芯片進(jìn)行驗(yàn)證。我們預(yù)計(jì)這些新芯片將用于Nvidia 的RTX 50 系列 GPU。
三星電子內(nèi)存產(chǎn)品規(guī)劃團(tuán)隊(duì)執(zhí)行副總裁 Yongcheol Bae 表示:“我們的 GDDR7 DRAM 將有助于提升工作站、PC 和游戲機(jī)等需要出色圖形性能的領(lǐng)域的用戶體驗(yàn),并且預(yù)計(jì)將擴(kuò)展到未來人工智能、高性能計(jì)算 (HPC) 和汽車等應(yīng)用。下一代圖形 DRAM 將根據(jù)行業(yè)需求推向市場(chǎng),我們計(jì)劃繼續(xù)保持在該領(lǐng)域的領(lǐng)先地位?!?/span>
當(dāng)三星去年 10 月嘲笑GDDR7 內(nèi)存的持續(xù)開發(fā)時(shí), Cadence 沒有透露即將推出的規(guī)范的任何其他技術(shù)細(xì)節(jié)。但他們最近透露了有關(guān)該技術(shù)的一些額外細(xì)節(jié)。事實(shí)證明,GDDR7 內(nèi)存將使用 PAM3 和 NRZ 信號(hào),并將支持許多其他功能,目標(biāo)是達(dá)到每個(gè)引腳高達(dá) 36 Gbps 的數(shù)據(jù)速率。
簡(jiǎn)短的 GDDR 歷史課
在較高的層面上,近年來 GDDR 內(nèi)存的發(fā)展相當(dāng)簡(jiǎn)單:更新的內(nèi)存迭代提高了信號(hào)速率,增加了突發(fā)大小(burst size)以跟上這些信號(hào)速率,并提高了通道利用率。但是這些都沒有顯著增加存儲(chǔ)單元的內(nèi)部時(shí)鐘。例如,GDDR5X 和后來的 GDDR6 將其突發(fā)大小增加到 16 字節(jié),然后切換到雙通道 32 字節(jié)訪問粒度。雖然每一代技術(shù)都面臨著挑戰(zhàn),但最終行業(yè)參與者已經(jīng)能夠通過每個(gè)版本的 GDDR 提高內(nèi)存總線的頻率,以保持性能的提升。
但即使是“簡(jiǎn)單”的頻率增加也越來越變得不那么簡(jiǎn)單了。這促使該行業(yè)尋找除了加快時(shí)鐘之外的解決方案。
借助 GDDR6X,美光和 NVIDIA 將傳統(tǒng)的不歸零 (NRZ/PAM2) 編碼替換為四級(jí)脈沖幅度調(diào)制 (PAM4) 編碼。PAM4 使用四個(gè)信號(hào)電平將有效數(shù)據(jù)傳輸速率提高到每個(gè)周期兩個(gè)數(shù)據(jù)位,從而實(shí)現(xiàn)更高的數(shù)據(jù)傳輸速率。實(shí)際上,由于 GDDR6X 在 PAM4 模式下運(yùn)行時(shí)具有 8 字節(jié) (BL8) 的突發(fā)長(zhǎng)度(burst length),因此在相同數(shù)據(jù)速率(或者更確切地說,信號(hào)速率)下它并不比 GDDR6 快,而是設(shè)計(jì)為能夠達(dá)到比 GDDR6 可以輕松實(shí)現(xiàn)的更高的數(shù)據(jù)速率。
四級(jí)脈沖幅度調(diào)制在信號(hào)丟失方面優(yōu)于 NRZ。對(duì)于給定的數(shù)據(jù)速率,由于 PAM4 需要 NRZ 信號(hào)傳輸波特率的一半,因此產(chǎn)生的信號(hào)損失顯著減少。隨著更高頻率的信號(hào)在通過導(dǎo)線/走線時(shí)衰減得更快——而且按照數(shù)字邏輯標(biāo)準(zhǔn),內(nèi)存走線的距離相對(duì)較長(zhǎng)——能夠在本質(zhì)上是較低頻率的總線上運(yùn)行,最終使一些工程和走線更容易實(shí)現(xiàn)更高的數(shù)據(jù)速率。
權(quán)衡(trade-off )是 PAM4 信號(hào)通常對(duì)隨機(jī)和感應(yīng)噪聲更敏感;為了換取較低頻率的信號(hào),您必須能夠正確識(shí)別兩倍的狀態(tài)。實(shí)際上,這會(huì)導(dǎo)致給定頻率下的誤碼率更高。為了降低BER,需要在Rx端進(jìn)行均衡,在Tx端進(jìn)行預(yù)補(bǔ)償,這會(huì)增加功耗。雖然它未用于 GDDR6X 內(nèi)存,但在更高頻率(例如 PCIe 6.0)下,前向糾錯(cuò) (FEC) 也是一項(xiàng)實(shí)際要求。
當(dāng)然,GDDR6X 內(nèi)存子系統(tǒng)需要全新的內(nèi)存控制器,以及用于處理器和內(nèi)存芯片的全新物理接口 (PHY)。這些復(fù)雜的實(shí)現(xiàn)在很大程度上是四級(jí)編碼直到最近才幾乎完全用于高端數(shù)據(jù)中心網(wǎng)絡(luò)的主要原因,在這些網(wǎng)絡(luò)中有支持使用這種尖端技術(shù)的利潤(rùn)。
GDDR7:PAM3 編碼高達(dá) 36 Gbps/pin
考慮到上述在使用 PAM4 信號(hào)或 NRZ 信號(hào)時(shí)的權(quán)衡,事實(shí)證明支持 GDDR7 內(nèi)存標(biāo)準(zhǔn)的 JEDEC 成員反而采取了一些折衷的立場(chǎng)。GDDR7 內(nèi)存設(shè)置為使用 PAM3 編碼進(jìn)行高速傳輸,而不是使用 PAM4。
顧名思義,PAM3 介于 NRZ/PAM2 和 PAM4 之間,使用三級(jí)脈沖幅度調(diào)制(-1、0、+1)信號(hào),允許它每個(gè)周期傳輸 1.5 位(或者更確切地說是 3 位以上)兩個(gè)周期)。PAM3 提供比 NRZ 更高的每周期數(shù)據(jù)傳輸速率——減少了遷移到更高內(nèi)存總線頻率的需要以及由此帶來的信號(hào)丟失挑戰(zhàn)——同時(shí)需要比 PAM4 更寬松的信噪比。總的來說,GDDR7 承諾比 GDDR6 具有更高的性能,同時(shí)比 GDDR6X 具有更低的功耗和實(shí)施成本。
對(duì)于那些記分的人來說,這實(shí)際上是我們看到的第二個(gè)使用 PAM3 的主要消費(fèi)技術(shù)。出于類似的技術(shù)原因,USB4 v2(又名 80Gbps USB)也在使用 PAM3。那么 PAM3 到底是什么?
PAM3 是一種數(shù)據(jù)線可以承載 -1、0 或 +1 的技術(shù)。該系統(tǒng)所做的實(shí)際上是將兩個(gè) PAM3 傳輸組合成一個(gè) 3 位數(shù)據(jù)信號(hào),例如 000 是一個(gè) -1 后跟一個(gè) -1。這變得很復(fù)雜,所以這里有一個(gè)表格:
當(dāng)我們將 NRZ 與 PAM3 和 PAM4 進(jìn)行比較時(shí),我們可以看到 PAM3 的數(shù)據(jù)傳輸速率處于 NRZ 和 PAM4 的中間。在這種情況下使用 PAM3 的原因是為了在沒有 PAM4 需要啟用的額外限制的情況下實(shí)現(xiàn)更高的帶寬。
話雖如此,三星承諾的具有 36 Gbps 數(shù)據(jù)傳輸速率的 256 位內(nèi)存子系統(tǒng)將使用多少功率還有待觀察。GDDR7 規(guī)范本身尚未獲得批準(zhǔn),硬件本身仍在構(gòu)建中(這正是 Cadence 等工具發(fā)揮作用的地方)。但請(qǐng)記住,AI、HPC 和圖形的帶寬需求量很大,帶寬將永遠(yuǎn)受到歡迎。
優(yōu)化效率和功耗
除了提高吞吐量外,GDDR7 有望采用多種方式來優(yōu)化內(nèi)存效率和功耗。特別是,GDDR7 將支持四種不同的讀取時(shí)鐘 (RCK) 模式,以便僅在需要時(shí)啟用它:
始終運(yùn)行:始終運(yùn)行并在睡眠模式下停止;
禁用:停止運(yùn)行;
Start with RCK Start command:主機(jī)可以在讀出數(shù)據(jù)之前通過發(fā)出RCK Start命令來啟動(dòng)RCK,并在需要時(shí)使用RCK Stop命令停止。
Start with Read:當(dāng) DRAM 收到任何涉及讀出數(shù)據(jù)的命令時(shí),RCK 自動(dòng)開始運(yùn)行。它可以使用 RCK Stop 命令停止。
此外,GDDR7 內(nèi)存子系統(tǒng)將能夠并行發(fā)出兩個(gè)獨(dú)立的命令。例如,Bank X 可以通過在 CA[2:0] 上發(fā)出 Refresh per bank 命令來刷新,而 Bank Y 可以通過同時(shí)在 CA[4:3] 上發(fā)出讀取命令來讀取。此外,GDDR7 將支持線性反饋移位寄存器 (LFSR) 數(shù)據(jù)訓(xùn)練模式,以確定適當(dāng)?shù)碾妷弘娖胶蜁r(shí)序,以確保一致的數(shù)據(jù)傳輸。在這種模式下,主機(jī)將跟蹤每個(gè)單獨(dú)的眼睛(連接),這將允許它應(yīng)用適當(dāng)?shù)碾妷阂愿玫貎?yōu)化功耗。
最后,GDDR7 將能夠根據(jù)帶寬需求在 PAM3 編碼和 NRZ 編碼之間切換。在高帶寬場(chǎng)景中,將使用 PAM3,而在低帶寬場(chǎng)景中,內(nèi)存和內(nèi)存控制器可以切換到更節(jié)能的 NRZ。
雖然 GDDR7 承諾在不大幅增加功耗的情況下顯著提高性能,但技術(shù)觀眾最大的問題可能是 新型內(nèi)存何時(shí)可用。由于沒有來自 JEDEC 的硬性承諾,因此沒有預(yù)計(jì) GDDR7 發(fā)布的具體時(shí)間表。但考慮到所涉及的工作和 Cadence 驗(yàn)證系統(tǒng)的發(fā)布,預(yù)計(jì) GDDR7 將與 AMD 和 NVIDIA 的下一代 GPU 一起進(jìn)入現(xiàn)場(chǎng)并不是沒有道理的。請(qǐng)記住,這兩家公司傾向于以大約兩年的節(jié)奏推出新的 GPU 架構(gòu),這意味著我們將在 2024 年晚些時(shí)候開始看到 GDDR7 出現(xiàn)在設(shè)備上。
當(dāng)然,鑒于如今有如此多的 AI 和 HPC 公司致力于帶寬需求高的產(chǎn)品,其中一兩家可能會(huì)更快發(fā)布依賴 GDDR7 顯存的解決方案。但 GDDR7 的大規(guī)模采用幾乎肯定會(huì)與 AMD 和 NVIDIA 的下一代圖形卡的量產(chǎn)同時(shí)發(fā)生。