來源:本文由半導體行業(yè)觀察翻譯自nextplatform,作者Paul Teich謝謝。
高通在幾周之前發(fā)布了 Centriq 服務器片上系統(tǒng)(SoC)。那場活動的中心是 Centriq 的技術規(guī)格和定價,并且還揭示了該生態(tài)系統(tǒng)的大量合作伙伴和客戶。我曾經(jīng)介紹了三星用于 Centriq 的工藝并且該公司還在到處向其客戶推薦 Centriq,參閱:https://www.forbes.com/sites/tiriasresearch/2017/11/10/qualcomm-launches-into-server-market/#3a87043d44ef
盡管高通當時是在發(fā)布自己的 Centriq 2400 處理器,而并不是重點關注那些會使用該參考設計(reference design)的硬件合作伙伴,但高通還是選擇將其 Centriq 發(fā)布會的重點放在了生態(tài)系統(tǒng)的發(fā)展上,其中高通還著重強調(diào)了軟件工作負載和合作伙伴關系。因為當今很多的云負載組合都基于運行時環(huán)境(即使用容器、解釋型語言等),所以比起操作系統(tǒng)和編譯器,發(fā)布一款新芯片更需要的是生態(tài)系統(tǒng)支持。
我們相信高通在高價值工作負載和應用上重點關注生態(tài)系統(tǒng)的戰(zhàn)略是健全合理的。Centriq 2400 發(fā)布會展示了很多 64 位 ARM 數(shù)據(jù)中心工作負載——我們從未看過這么多工作負載集中在同一個地方。
實際上在高通的 Centriq 發(fā)布會上還是有很多硬件。在該發(fā)布會上給出的所有演示都是由基于高通 Centriq 參考設計的現(xiàn)場服務器或基于云的服務器(基本托管在 Packet.net 上)所驅動的。本文將重點關注對高通在其發(fā)布會上和之后一周舉辦的 SC17 全球超級計算大會上提到的系統(tǒng)、軟件和解決方案所準備的技術。
高通的 Anand Chandrasekher 展示 Centriq 2400 晶圓和封裝
參考主板和平臺讓系統(tǒng)生態(tài)系統(tǒng)成為可能
高通的 Centriq 參考主板設計是一種半寬主板,可以放進各種 1U 機箱中。該主板參考設計還符合開放計算項目(OCP)的 Project Olympus 的規(guī)格,該規(guī)格來自微軟 Azure。
高通的參考平臺也可以將參考主板放進一個全寬機箱中,這樣合作伙伴和客戶就可以評估雙主板配置以及存儲豐富的配置。
我們看到有多個版本的高通參考平臺,但僅有一個獨特的第三方設計。
高通 Centriq 參考平臺前面板
在發(fā)布會上配置成存儲服務器的高通 Centriq 參考平臺
在 SC17 上配置為雙節(jié)點計算所配置的高通 Centriq 參考平臺
另外,Open19 基金會的總裁兼董事會主席 Yuval Bachar 也選擇在高通的 Centriq 發(fā)布會上展示我們已經(jīng)公開看過的其第一款 Open19 機箱。我們確實也在 SC17 上看到了另一種相競爭的 Open19 計算機箱,但那是沒太多人關注的 ODM 設計??梢韵胍娢磥韼讉€月還會有更多設計出現(xiàn)。
在發(fā)布會上帶有高通 Centriq 2400 主板的 Open19 演示機箱
Centriq 最重要的一個方面看起來很平淡無奇:Centriq 2400 的閑置功耗為 8W,峰值功耗為 120W,不需要液冷來實現(xiàn)高計算密度。我們在發(fā)布會和 SC17 上都看到了生產(chǎn)型的風冷 Centriq 2400 散熱器。
高通 Centriq 參考設計,左圖為帶有風冷散熱片的,右圖為不帶的
帶有風冷散熱片的高通 Centriq 2400 的特寫
高通在三月份的 OCP 峰會上展示過其參考主板的 Rev B(B 版本)。我們在發(fā)布會上看到了 Rev C 主板,然后高通在 ARM 的 SC17 展位上展出了一塊 Rev E 主板。電路板設計師忘記將下面照片中的文本改成 Rev C,但其主板編號表明它確實是 Rev C。
主板版本可以表明實現(xiàn)生產(chǎn)可行的系統(tǒng)的進展。注意這些主板的顏色變化:從 Rev B 和 C 的紅色變成了 Rev E 的藍色。這種顏色變化表明客戶可以評估乃至也許可以部署 Rev E 了。
高通 Centriq 參考主板版本
該參考平臺包含一個靈活的電源分配板,我們在其上找到了幾個在發(fā)布會和 SC17 上提到的 Centriq 參考設計。
高通 Centriq 參考電源分配板
實現(xiàn)插件生態(tài)系統(tǒng)的插卡
高通設計的 Centriq 參考平臺支持兼容 OCP Olympus 的插卡擴展。插卡擴展讓兼容 OCP Olympus 的高通 Centriq 主板在 1U 機箱的配置中能有很多選擇。
這種 1U 高度的 PCI-Express x16 插槽支持范圍廣泛的 PCI-Express 附加[add-in 翻譯為 附加。附加卡,附加板]卡,支持 1U 機箱中的多種實際配置。其它三種 Project Olympus 主板規(guī)格中沒有任何一種定義了 Centriq 2400 規(guī)格那樣多的插卡類型。
OCP 通用主板插卡(來自:高通)
高通當前的 Centriq OCP Project Olympus 通用主板規(guī)格定義了 6 種插卡類型:
1.在主板上方連接單個 PCI-Express x16 電子和機械附加卡,其中帶有主要元件的一面朝上,遠離主板。
2.在主板上方連接單個 PCI-Express x8 電子和機械附加卡,其中帶有主要元件的一面朝上,遠離主板,并且通過其 PCI-Express x8 連接器還在該插卡的背面增加了一個 M.2 插槽。
3.在主板上方將單個 PCI-Express x8 電子附加卡與 x16 機械附加卡連接到一起,其中帶有主要元件的一面朝上,遠離主板。在該插卡上第 2 種類型中 M.2 插槽的位置有一個 x8 OcuLink 線連接頭,可以在機箱內(nèi)通過線纜擴展 PCI-Express。
4.將兩個 PCI-Express x8 電子附加卡與 x16 機械附加卡連接到一起,該插卡兩面各有一個,都面朝上,遠離主板。
5.連接單個 PCI-Express x16 電子和機械附加卡,遠離主板,其中帶有主要元件的一面朝下,從而最大化機箱底部和附加板之間的空氣量。這種插卡是專為增加高通的 “MegaCard” NVM-Express 夾層而設計的。這款插卡包含一個 PCI-Express x1 控制線,連接到了 MegaCard 上的 PCI-Express 開關芯片。
6.連接單個 PCI-Express x16 電子和機械附加卡,遠離主板,其中帶有主要元件的一面朝下,留下最大化的機箱空間,可以在 Centriq 主板旁邊放入一個全尺寸、全功率(300 W)的 GPU 或 FPGA 加速板卡。
在過去幾周中展示的第 1 類插卡和電源分配板都是 Rev B 評估型的原型設計。
在發(fā)布會和 SC17 上展示了兩種類型的附加卡:Mellanox 網(wǎng)絡附加卡(上面和下面的多個系統(tǒng)中都有)和高通的 MegaCard。
帶有 OCP 第 1 類 PCI-Express 插卡(紅色)的高通 Centriq 2400 主板,其中一個插卡上帶有一個網(wǎng)卡(右邊帶有黑色散熱片的卡),這是在 SC17 上看到的
高通的 MegaCard 支持 20 個 M.2 NVM-Express 存儲卡,在 MegaCard 每一面各 10 個。NVM-Express 卡連接著一個MicroSemi PM8536 PCI-Express 3.0 轉換器。這個轉換器通過上面提到的 PCI-Express x16 第 5 類插卡連接到高通 Centriq 主板上。因為 10 個 M.2 卡需要一定的主板面積,所以 MageCard 會在全寬 1U 機箱中占據(jù)另一個 Centriq 2400 主板的位置;PCI-Express 連接頭在第 1 類型插卡的另一面,并且安裝在該插卡上更高的位置。高端 NVM-Express 硬盤有 4TB 容量,所以高通的 MegaCard 可以支持 80TB 的 PCI-Express 3.0 NVM-Express 存儲。
高通MegaCard 特寫(上圖),安裝在參考設計機箱中的樣子(下圖)(來自:高通)
插卡讓高通 Centriq OCP 系統(tǒng)客戶可以使用種類繁多的第三方附加板。附加板擴展將能讓基于 Centriq 的系統(tǒng)實現(xiàn)計算、存儲和網(wǎng)絡擴展功能,還能將負載遷移到加速器上。
在 Centriq 發(fā)布會上,高通強調(diào)了應用和工作負載的重要性。高通及其合作伙伴在發(fā)布會上為此設置了二十幾個展示臺。
高通的目標是能夠很好擴展的高度線程化的工作負載。對于搜索、內(nèi)容交付網(wǎng)絡和內(nèi)存密集型的數(shù)據(jù)分析等容器化的、基于微服務的應用而言,高通的高線程數(shù)和高內(nèi)存帶寬的架構是非常適用的。
高通 Centriq 發(fā)布會上的展示
兩家數(shù)據(jù)庫公司展示了運行在高通 Centriq 2400 上的性能擴展數(shù)據(jù):MariaDB 和 ScyllaDB。
MariaDB 是一個開源的 SQL(關系)聯(lián)機事務處理(OLTP)數(shù)據(jù)庫。Centriq 2400 的高核心數(shù)讓 MariaDB 每個連接模型的一個線程可以很好地擴展;MariaDB 的內(nèi)部測試表明:在一個 48 核的 Centriq 2400 處理器上,可以近乎線性地擴展成 46 個并發(fā)的數(shù)據(jù)庫會話。剩下的幾個核心專用于管理任務(housekeeping tasks)。
MariaDB 演示截屏(來自:MariaDB)
每個 MariaDB 會話在每個核心上都實現(xiàn)了每秒平均 10 000 次查詢,使得每個 Centriq 2400 服務器節(jié)點每秒可實現(xiàn)多達 420 000 次查詢。由于每個核心只有一點開銷,所以管理任務可以分散出去,并且單個 Centriq 2400 服務器節(jié)點就可以提供 48 個并發(fā)會話。
用于 Centriq 2400 服務器處理器的 MariaDB Server 10.2 現(xiàn)在已經(jīng)可用了。
ScyllaDB 演示表現(xiàn)結果(來自 ScyllaDB)
ScyllaDB 是一種開源的非 SQL 數(shù)據(jù)庫,實現(xiàn)了兼容 Apache Cassandra 的接口;ScyllaDB 可以直接替代 Cassandra。ScyllaDB 使用一種高性能的 C++ 實現(xiàn)替代了 Cassandra 的 JVM 運行時依賴。這種 ScyllaDB 實現(xiàn)是無鎖的、無共享(shared nothing)的設計,可以通過讓每個核心處理一個數(shù)據(jù)庫分片來實現(xiàn)擴展。本地內(nèi)存管理可以實現(xiàn)一致的低于毫秒的每分片內(nèi)存延遲。
ScyllaDB 對其運行在三個 Centriq 2400 服務器節(jié)點上的數(shù)據(jù)庫進行了基準研究。根據(jù) boot 設置,其中每個節(jié)點的活躍核心數(shù)在 10 到 40 之間變化。這項研究表明在三個系統(tǒng)上的性能可以擴展超過 100 萬 IOPS(每秒讀寫操作數(shù)),并且隨著每個節(jié)點的核心數(shù)增加至 40,其性能是線性擴展的。
Excelero 是一家 NVM-Express 模塊化存儲服務器創(chuàng)業(yè)公司,該公司宣布已經(jīng)得到了來自 Qualcomm Ventures(高通風險投資)的戰(zhàn)略投資并且展示了其運行在 Centriq 上的產(chǎn)品。MegaCard 似乎非常適合 Excelero 的應用,而且可能還能加速 MariaDB 和 ScyllaDB 等數(shù)據(jù)庫。
微軟 Azure 的杰出工程師 Leendert van Doorn 在演講中還提到:Azure 很看重 Centriq 2400 用于搜索結果和實現(xiàn)大內(nèi)存數(shù)據(jù)庫的吞吐處理。van Doorn 指出對于沒有參考位置的查詢(其中每個查詢都有可能訪問該數(shù)據(jù)庫的不同部分,他將其描述為“在數(shù)據(jù)庫中隨機游走”),每個核心都有突出內(nèi)存系統(tǒng)需求的大量核心能在內(nèi)存系統(tǒng)上實現(xiàn)更高的綜合性能。
Synopsys 展示了其運行在 Centriq 2400 上的 VCS 驗證仿真和設計包。這只是一個演示。Synopsys 的營銷副總裁 Michael Sanie 說用 VCS 來進行演示很容易并且可以在 Centriq 2400 上順暢地運行。Sanie 很謹慎地沒有將該演示稱為 VCS 的一種“移植(port)”,因為移植就意味著調(diào)試的承諾和質量保證。他說 Synopsys 會為一次移植運行“成千上萬次”回歸測試。但他確實說了他不認為進行 64 位 ARM 移植有什么問題,而且 Synopsys 正在研究將其整個平臺移植到 64 位 ARM 處理器上的可行性。Synopsys 和高通已有很長時間的合作伙伴關系,我可以預見 Synopsys 最終會支持“在高通上運行高通(Qualcomm runs on Qualcomm)”的計劃,就像是 AMD 在 2000 年代推出其 Opeteron 產(chǎn)品線一樣。
Cadence 宣布其正在發(fā)售用于 ARM 64 位處理器的 Xcelium 設計仿真和驗證軟件應用程序,并且也展示了運行在 Centriq 2400 上的 Xcelium。Xcelium 運行在 SUSE Linux Enterprise 操作系統(tǒng)上。
賽靈思演示截屏
賽靈思展示了一款運行在 Centriq 2400 上的機器學習 Virtex Ultrascale+ FPGA 推理加速棧。機器學習對吞吐量和延遲都很敏感。高通和賽靈思已經(jīng)合作了多年,并且還在 CCIX 和其它數(shù)據(jù)中心之外的技術上開展合作。同樣,F(xiàn)PGA 加速將會成為在高通數(shù)據(jù)中心基礎設施上運行高通的芯片設計的關鍵組成部分。
SmarCo 視頻轉換演示
SmarCo 展示了其“一體式”機器學習平臺,該平臺基于高通內(nèi)部一款 Centriq 2400 參考主板設計的變體。SmarCo 使用了基于 PCI-Express 的 FPGA 加速器卡來執(zhí)行高吞吐量的視頻圖像處理,并且還使用了該公司專有的 SSM3500 PCI-Express 卡(上面有該公司自己的 SmarCo-2 視頻處理芯片)來進行視頻轉換。SmarCo 宣稱在基于 Centriq 2400 的平臺上的圖像轉換速度比相當?shù)?x86 平臺快 4 倍,圖像檢測的速度也快大約 1.5 倍。
SmarCo 圖像檢測演示
高通參考主板的 SmarCo “AI All-in-one” 變體
Mellanox Technologies 和 6Wind 展示了網(wǎng)絡安全網(wǎng)關,該網(wǎng)關結合了 Centriq 參考平臺、Mellanox 當前一代 ConnectX-5 2×40 Gb/sec NIC 和 6Wind 的基于 DPDK 的虛擬網(wǎng)絡功能(VNF)軟件。6Wind 在高通發(fā)布 Centriq 之前幾周才剛剛宣布支持 ARM 64 位處理器。
Mellanox 和 6Wind 展示 NFV 安全網(wǎng)絡(來自:6Wind)
6Wind 的 Virtual Accelerator 和 Turbo IPsec VNF 軟件的目的是為很好地使用在一個服務節(jié)點中的多個處理核心來進行擴展,其性能可隨核心數(shù)近乎線性的增長。6Wind 運行在 Centriq 2400 上的應用使用了 Ubuntu 的 KVM 系統(tǒng)管理程序(hypervisor)和開源的 Grafana 度量分析和可視化套件。Mellanox 和 6Wind 還展示了一種 Telco Open NFV 實現(xiàn)。
SolarFlare 正在使用其 XtremeScale SDN 網(wǎng)絡接口卡和 Centriq 2400 服務器節(jié)點(每個 1U 機箱兩個節(jié)點)來為大規(guī)模分布式計算環(huán)境構建其所謂的“神經(jīng)類網(wǎng)絡(neural class networks)”。每個 NIC 支持多達 2048 個虛擬 LAN 連接,支持在單個機架中放置 76 個 Centriq 2400 處理器(也就是 3648 個核心)。SolarFlare 正在 Centriq 2400 上運行 NGINX 應用交付平臺,并且表示還將會支持網(wǎng)絡托管和大數(shù)據(jù)分析。SolarFlare 已經(jīng)在部署基于 Centriq 的神經(jīng)類網(wǎng)絡了。
Chelsio 宣布 Centriq 2400 參考平臺已經(jīng)可以使用其 T6 Unified Wire 網(wǎng)絡解決方案了,該公司還展示了一款以太網(wǎng)適配器,其在高通的認可供應商列表(AVL)中。
Netronome 宣布 Centriq 2400 已可使用其 Agilio SmartNIC 和軟件。Agilio SmartNIC 可以將用于覆蓋、安全、負載平衡和遠程測量等網(wǎng)絡功能的虛擬交換機和路由器數(shù)據(jù)路徑處理轉移到其它地方。Netronome 的目標是讓包括電信公司在內(nèi)的云服務提供商采用其 Agilio with Centriq 解決方案。
Packet Networks 使用亞馬遜 Alexa 前端展示了它的全套工具,這些工具運行在 Packet 數(shù)據(jù)中心中的 Centriq 2400 參考平臺上。Packet 已經(jīng)在向其軟件開發(fā)者(基礎是基礎設施即服務(IaaS)客戶)提供基于 ARM 的裸機服務器了。裸機服務器客戶關注的重點是他們所使用的特定硬件,因為裸機是單租戶實例(single tenant instance);開發(fā)者必須清楚他們付錢買的是什么,以便得到能滿足他們需求的最高性能的基礎設施。Packet Networks 已經(jīng)在為其客戶托管 Centriq 2400 參考平臺了,盡管這些平臺還沒出現(xiàn)在 Packet 的裸機定價列表上。
此外,Illumina 展示了其運行在 Centriq 2400 平臺上的高吞吐量生物信息工具。Canonical 展示了運行在 Centriq 2400 上的 OpenStack 平臺,Red Hat 展示了運行在 Centriq 2400 上的 Enterprise Linux for ARM。高通還展示了其內(nèi)部設計的 MongoDB 演示,其中有 Varnish 服務網(wǎng)絡應用、HHVM 網(wǎng)絡服務器和 Spark 內(nèi)存社交圖譜。
從這里走向何方?
Anand Chandrasekher 在結束高通的演講時讓我們瞥見了 Centriq 的未來。遵照高通的執(zhí)行優(yōu)先(execute first)規(guī)則,他并沒說太多。Chandrasekher 只是揭示了下一代 Centriq 核心和處理器的代號,分別是 Saphira 和 Firetail;并且證實第四代正在開發(fā)之中。(Centriq 2400 實際上是高通的第二代 SoC 設計。)
高通的 Centriq 大致路線圖
高通在 Centriq 發(fā)布會上帶來一個生態(tài)系統(tǒng)的策略是很合理的。在此之前,在服務器生態(tài)系統(tǒng)內(nèi),還沒有誰曾將 ARM 64 位數(shù)據(jù)中心生態(tài)系統(tǒng)的如此之多的部分放在同一個地方進行展示,而且這些部分還處于如此先進的開發(fā)階段。
-
ARM
+關注
關注
134文章
9030瀏覽量
366537 -
服務器
+關注
關注
12文章
8978瀏覽量
85100
發(fā)布評論請先 登錄
相關推薦
評論