天河 3 號原型機 徹底告別國外 CPU

10-16

【本文轉自微信公眾號 " 科工力量 "(ID:guanchacaijing)】

日前,飛騰已經完成 FT-2000plus 服務器 CPU 的研制工作,飛騰公司的合作夥伴正在積極研發相應的整機產品。FT-2000plus 這款芯片是以 FT2000 為基礎的改進版本,雖然在單核性能上和 Intel 還存在一定差距,但在多核性能上,已經達到 Intel 服務器 CPU E5 主流產品的水平。

據傳,國防科大正在研發的 1000P 超算天河 3 號(性能指標是神威太湖之光的 8 倍),其原型機的 CPU 或將采用 FT-2000 或其後繼產品作為主控 CPU。考慮到在天河 2A 上,國防科大已經用自主研發的加速器矩陣 2000 取代 Intel 的 Xeon Phi 計算卡。從今往後,天河系列超算也將和神威系列超算一樣,徹底告別國外 CPU 或加速器,實現芯片的全國產化。

(網傳天河 3 號原型機計算節點,板上有 2 片 FT-2000,業內專傢告訴筆者,這是誤傳)

FT-2000 系列芯片是厚積薄發的結果

近年來,國內某些企業熱衷於 " 走捷徑 ",先後與 Intel、IBM、ARM、高通等國外芯片巨頭技術合作或合資,有的公司把國外的 CPU IP 授權買回來做集成,就宣傳是自主知識產權,甚至還有公司將國外的芯片包裝一下變成國產芯片。

雖然這種走捷徑的做法可以在短時間內拿出性能不錯的芯片,但由於國外公司始終懷有 " 教會徒弟、餓死師傅 " 心理,不會將最先進的技術授權給中國,而且國內單位在拿到國外技術授權後,容易陷入知其然,不知其所以然的困境,不具備技術發展的可持續性,在國外公司開發出下一代產品之後,隻能再次引進國外技術。

相比之下,飛騰選擇瞭較為困難的自主研發道路,雖然發展會慢一些,但更具後勁。早在十多年前,飛騰就基於 IA-64 指令集設計 CPU,之後又以 Sparc 開源代碼為基礎設計瞭 FT-1000 和 FT-1500 兩款 CPU,FT-1000 被用於天河 1 號超算,FT-1500 被用於天河 2 號超算。在 2012 年前後,飛騰選擇瞭 ARM 陣營,獲得瞭 ARM 指令集授權,可以基於 ARM 64 指令集設計自己的 CPU。並在數年時間裡先後開發出瞭 FTC660、FTC661 兩款 CPU 核,以及 FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus 等 CPU。

FT-1500A/4 被用於 PC 和筆記本,采用 28nm 制造工藝。集成瞭 4 個 FTC660 CPU 核,主頻 1.5GHz — 2.0GHz,集成瞭 2MB 二級 cache 和 8MB 三級 cache,集成瞭 2 個 DDR3-1600 存儲控制器,可提供 25.6GB/s 訪存帶寬,最大功耗為 15W。

FT-1500A/16 被用於服務器,采用 28nm 制造工藝。集成瞭 16 個 FTC660 CPU 核,主頻 1.5GHz,集成瞭 8MB 二級 cache 和 8MB 三級 cache,集成瞭 4 個 DDR3-1600 存儲控制器,可提供 51.2GB/s 訪存帶寬,最大功耗為 35W。

FT-2000 采用 28nm 制造工藝,可被用於超算計算節點和高性能服務器。集成瞭 64 個 FTC661 處理器核。工作主頻 1.5GHz — 2.0GHz。集成瞭 32MB 二級 cache,擴展支持 128MB 三級 cache。支持 16 個 DDR3-1600 存儲控制器,可提供 204.8GB/s 訪存帶寬。

最新的 FT-2000Plus 采用瞭臺積電 16nm 制造工藝,主頻為 2.0GHz — 2.4GHz,集成瞭 64 個 FTC661 處理器核。為瞭提高集成度,拋棄瞭 L3cache,將 DDR4 內存控制器集成到瞭片內。目前,飛騰系列 CPU 已經形成瞭一個傢族,可滿足黨政軍多個領域的實際需求。

足以和 Intel 主流服務器抗衡 CPU 在國內 ARM 服務器 CPU 中處於領跑位置

根據實際測試 FT-2000 在 2GHz 主頻下,采用 GCC4.8 編譯器,SPEC2006 的測試成績分別為 SPECint_rate2006:570、 SPECfp_rate2006:482,與 Intel Xeon E5-2695v3 相當。

而最新的 FT-2000Plus 因為刪除瞭 L3 導致在 SPEC 測試中某些子項分數下降,把集成 DDR4 等改進帶來的提升抹平瞭,使 FT-2000Plus 在同主頻下與 FT-2000 的性能相差不大。那飛騰公司為何要這麼做呢?原因應該是為瞭商業化,提高 FT-2000plus 的集成度可以方便主機廠,降低開發 FT-2000plus 整機產品的成本。不過,在使用瞭更好的臺積電 16nm 制造工藝之後主頻可以最高穩定到 2.4G,使 FT-2000plus 相對於 FT-2000 還是有不小的性能提升,能夠滿足高端服務器和超算主控 CPU 的性能要求。

近年來,不少廠傢都開始著手開發 ARM 服務器 CPU。在國內,華為和華芯通也在著手開發 ARM 服務器 CPU。不過,就目前而言,飛騰的 ARM 服務器 CPU 在性能上處於絕對領先地位。

華芯通是中國大陸與高通成立的合資公司,從高通手中獲得瞭源碼並基於該源碼設計自己的 CPU。不過,由於華芯通北京研發中心啟用時日尚短,正式商用產品問世尚需時日。

相比之下,華為研發 ARM 服務器 CPU 的時間要早得多,而且在北京和美國都有研發中心,已經有產品 Hi1612 問世。雖然在宣傳上,華為聲稱 Hi1612 是 " 自主研發 "," 除存儲單元外均具有完整知識產品 ",但其實上,這款服務器 CPU 采用臺積電 16nm 制造工藝,其內核是 ARM Cortex A57。

而且 Hi1612 的性能也比較一般,也許是因為華為缺乏服務器 CPU 設計經驗,這款服務器 CPU 的性能相對有限,以飛騰的 FT2000 作參照,華為的這款服務器 CPU 在制造工藝領先 2 代的情況下,以 FT2000 一半的功耗實現瞭不足 FT2000 一半的性能。

不過,據小道消息,華為的下一款 ARM 服務器正在研發中,而且位於龍芯公司斜對門的華為北京研發中心已經拿 ARM Cortex A72 修改瞭至少 2 個版本(華為有錢,買瞭 ARM 的 " 大禮包 "),加上位於美國的研發中心可以提供技術支持,在有 ARM Cortex A72 為基礎的情況下,華為的下一款 ARM 服務器 CPU 的性能值得期待。

結語

誠然,FT-2000/FT-2000plus 還是存在一些短板的,比如單線程性能偏弱。無論是 FT2000,還是 FT-2000plus,雖然在多線程性能上達到瞭 Intel 中高端服務器 CPU 的性能,但在單線程性能上,還是有不小的差距——即便主頻控制在 2.5GHz,Intel 的服務器 CPU 的 SPECint_base2006 的成績也在 25 以上,而 FT2000 的 SPECint_base2006 隻有 12.4(@2.0GHz),FT-2000plus 預計也隻有 14+ 分(@2.4GHz)。

軟件生態也是一個問題,由於飛騰選擇瞭跟隨 ARM 生態的道路,使飛騰的商業化推廣很大程度上取決於 ARM 生態的完善情況。而在服務器生態上,ARM 和 X86 相比差距較大,這也非常不利於 FT-2000/FT-2000plus 的商業化。

不過,萬事開頭難,迄今為止,湖南長城銀河公司、湘計海盾公司、航天 706 所已經推出瞭基於新一代飛騰微處理器的自主可控產品。

(飛騰 CPU 整機產品)

長城銀河公司就開發出瞭 EF111 系列計算服務器、智恒 AF21B 一體機、致翔 NF15N 筆記本電腦和世恒 KF510 系列桌面型臺式計算機等整機產品。其中,EF111 系列計算服務器基於全新一代國產 FT2000 Plus 處理器的高性能服務器,可應用於 ERP、高性能數據庫、虛擬化和商業智能、大數據分析等領域。航天科工二院 706 所也推出天玥 64 核高端機架式服務器。

根據公開資料顯示,天河 3 號的原型機已經選定 FT-2000 系列芯片作為其計算節點上使用的 CPU。這不僅對天河超算擺脫進口芯片掣肘是一個好消息,對於 FT-2000 來說,也是一個非常好的廣告。

精彩圖片
文章評論 相關閱讀
© 2016 看看新聞 http://www.kankannews.cc/