在AMD的ZEN架構出現一開始,就是定義一個基本原則,一個core的架構,從laptop到desktop到server,這個也符合2015年AMD的股價,基本上沒有錢做其他的路線了,而它的金主Intel的確風光呀,收購FPGA,AI公司,架構上,mobile,laptop,desktop,server上面都是百花齊放,每個方向至少兩個不同的方向。記得我剛進Xilinx的時候,大家說Intel的FPGA的PCIE Gen4一直出不來,主要原因是Intel內部至少有兩個team在做PCIE,一個做4.0, 一個做5.0.
這個一招鮮吃遍天的做法,已經被ARM玩得爐火純青了。一個架構的design,可以在mobile,也可以在server上。當年死在沙灘上的calxeda就是這樣的。
因此。對于第一代的ZEN的架構,在Desktop上的確獲得很大的成功,但是在server上面讓中國的頭號云計算玩家甚是失望。一個core的架構,來通吃整個市場,需要通過power和clocking的控制來實現。在下圖中,基本也就在Desktop實現了突破。
通過小die來提升良率,使用CCX進行互聯(lián),這個是沒有免費午餐的。但是,AMD因為比較專一,在CCX的設計上的確是翻身了。
架構上面,和傳統(tǒng)的單die的CPU設計也有區(qū)別。使用ARM架構常用的Core和IO 分離的架構。
通過IF互聯(lián)的代價也很明確,就是天生NUMA。這個也是AMD的系統(tǒng)優(yōu)化一直強調的NPS (NUMA Nodes per Socket)。local 和remote 之間的差距有點不忍直視。但是,既然走了這一步,AMD拼命加L3 cache的行為就說明他們還是明白“失之東隅 收之桑榆”的祖訓的。
本文的重點是Chiplets,在AMD ISCA2021的paper 中,說明了Fabless公司面臨的惡劣環(huán)境。
Mooer定律沒死,但是的確老了,14nm之后的成本曲線變了。因此AMD早在14nm就開始改架構了。這個是AMD Zen成功的關鍵。
Die的大小增加了10%,但是成本只有6成,漂亮。
這個時候,最大的32Core 已經被對手的28好不少了,但是AMD的已經看到了ARM 服務器那種夸張的數量。怎么才能拉垮等等呢?
TSMC的7nm是生逢其時。
另一個關鍵的因素是剝離了IO,讓IO 和Core獨立發(fā)展。原因很簡單,因為IO部分拿到的制成紅利不多。
因此,在這個里面也充分說明了AMD精打細算的特質。在有人問到為什么要CPU上chiplets,而不是GPU時, 人家說了大實話,一個cpu的計算單元很大,8個少一個,就是損失了12%, 但是GPU里面的計算單元很很多,少幾個沒啥關系,不是有什么1080/1070/1060/1050/1040嗎?
因此2代Zen真的是省上加省。
同時,增加了IO Die,對于訪存延時也有了改觀。
雖然本地的延時大了4ns,但是remote的降低了,滿足全世界人民的愿望:“不患寡,患不均”。大家都一起拉垮吧。
因此,Zen2 在desktop,laptop和Server上做到了復興,南海邊的Hyperscale大獲成功,據說他們的口號是“省一半”。
說到省,另一個沒有想到的是Desktop 的io die也被拿去了做chipset。這個太高明了,以后ARM服務器出來之后,估計大部分的人IO Die可以直接做PCIE switch。
因此,在中國打壓吃喝玩樂,單投硬科技的場景下,Chiplets成了一個香餑餑,這國人最迷信的“彎道超車”的白日夢中,chiplets一級本炒的火熱了。好多沒做過個芯片的,都要做先整個chiplets。但是chiplets真的好嗎?請看AMD誠實的告白:
What,你的Core不一樣?
但是,AMD的用戶和超市排隊買便宜雞蛋的大媽一樣,我們有時間,有興趣折騰。老板這個時候說了,便宜是硬道理,你們工程師自己去適配,這樣不就鍛煉了隊伍嗎? 同樣,我這個系列就不放引用了,你們讀了文章,還自己去找出處,也鍛煉了大腦和翻墻的技巧。
審核編輯:劉清
-
FPGA
+關注
關注
1625文章
21620瀏覽量
601238 -
amd
+關注
關注
25文章
5421瀏覽量
133807 -
TSMC
+關注
關注
3文章
177瀏覽量
84431 -
chiplet
+關注
關注
6文章
416瀏覽量
12541
原文標題:AMD CPU之路--Chiplets
文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論