010-88587556/9600/9800
異構計算(suàn):算(suàn)力突破新抓手

【 順立證達科技(jì)(北(běi)京)有限公司成立以來始終秉承技(jì)術(shù)是第一(yī)生(shēng)産力的宗旨,全部産品和主要核心技(jì)術(shù)均為(wèi)自(zì)主研發。公司主要研發的産品有:遠(yuǎn)程智能(néng)雙備份電(diàn)源、分時電(diàn)源控制器(qì)、網絡電(diàn)源控制器(qì)、智能(néng)PDU、遠(yuǎn)程動力監測、能(néng)源控制系統等。截止2019年(nián)底已獲得六項專利登記(其中發明專利兩項)、軟件(jiàn)著作權登記幾十項(其中十八項為(wèi)國(guó)家級登記)等知識産權成果。 】

高(gāo)性能(néng)計算(suàn)類應用的發展,驅動算(suàn)力需求不斷攀升,但目前單一(yī)計算(suàn)類型和架構的處理器(qì)已經無法處理更複雜(zá)、更多(duō)樣的數據。數據中心如何在增強算(suàn)力和性能(néng)的同時,具備應對多(duō)類型任務的處理能(néng)力,成為(wèi)全球性的技(jì)術(shù)難題。在計算(suàn)領域芯片企業(yè)的不斷探索和研究中,異構計算(suàn)成為(wèi)公認的算(suàn)力突破“抓手”。

芯片廠商發力異構計算(suàn)

異構計算(suàn)可以提高(gāo)算(suàn)力和性能(néng),降低(dī)功耗和成本,又(yòu)具備多(duō)類型任務的處理能(néng)力,有望主導未來的高(gāo)性能(néng)計算(suàn)市(shì)場。英偉達、英特爾、AMD作為(wèi)行業(yè)頭部企業(yè),近兩年(nián)在異構計算(suàn)方面的新産品層出不窮。

英特爾在最近的投資者會(huì)議中提出了一(yī)款将x86和Xe GPU 整合到(dào)一(yī)個(gè)Xeon插槽中的新架構Falcon Shores。英特爾中國(guó)研究院院長(cháng)宋繼強向《中國(guó)電(diàn)子報(bào)》記者介紹,将x86的主芯片和GPU的性能(néng)整合在一(yī)起,這是一(yī)個(gè)創新。在性能(néng)上(shàng),Falcon Shores将提供超過5倍的每瓦性能(néng)、計算(suàn)密度以及内存容量和帶寬。

英偉達在今年(nián)的GTC2022上(shàng),宣布推出首款面向AI基礎設施和高(gāo)性能(néng)計算(suàn)的數據中心專屬CPU——Grace CPU超級芯片。該芯片專為(wèi)AI、HPC、雲計算(suàn)和超大規模應用而設計,由兩個(gè)CPU芯片組成,兩者通(tōng)過NVLink-C2C進行互連。

AMD完成對賽靈思的合并後,将其CPU與賽靈思的FPGA結合為(wèi)CPU+FPGA的異構模式。借助賽靈思在5G、通(tōng)信、自(zì)動駕駛和行業(yè)領域的資源,AMD能(néng)夠将高(gāo)性能(néng)計算(suàn)能(néng)力帶入更多(duō)領域。

異構計算(suàn)瓶頸待突破

異構的優勢顯而易見(jiàn),與此同時暴露出的技(jì)術(shù)難題也越來越多(duō)。一(yī)是異構計算(suàn)産品需要面對不同的系統架構、指令集和編程模型,需要降低(dī)多(duō)樣計算(suàn)帶給軟件(jiàn)開(kāi)發者的難度;二是異構計算(suàn)芯片産品除了要在芯片設計層面實現突破之外,還(hái)需要解決在芯片制造和封裝過程中不同結構之間的适配和升級問題;三是異構計算(suàn)要實現性能(néng)的多(duō)樣性合一(yī),使其同時滿足人工(gōng)智能(néng)訓練、推理、圖像視頻處理等各種不同的需求。

燧原科技(jì)創始人兼CEO趙立東在接受《中國(guó)電(diàn)子報(bào)》記者采訪時表示,從(cóng)産業(yè)規範與标準層面看(kàn),異構計算(suàn)是指在完成一(yī)個(gè)計算(suàn)任務時,采用一(yī)種以上(shàng)的硬件(jiàn)計算(suàn)單元、互聯協議、差異化架構、軟件(jiàn)接口等。由于不同的硬件(jiàn)設備、協議、應用二進制接口、軟件(jiàn)應用層接口等都存在著(zhe)巨大的差異,如何構建一(yī)個(gè)高(gāo)效、系統化的協調統一(yī)的異構計算(suàn)系統,成為(wèi)最關鍵的技(jì)術(shù)問題。

宋繼強同樣表示,異構計算(suàn)在技(jì)術(shù)方面、互連方面和軟件(jiàn)方面都面臨瓶頸。一(yī)是技(jì)術(shù)設計流程的協同問題。要保證與其他不同廠商的芯粒一(yī)起互聯互通(tōng)、協同工(gōng)作時不出現問題。二是需要統一(yī)各廠商芯粒之間的互連标準。目前各廠商之間的互連标準并不統一(yī),英特爾攜手業(yè)界部分企業(yè),推出了UCIe标準,未來有望把不同廠商的芯粒連到(dào)一(yī)起,形成一(yī)個(gè)符合要求的、大的、封裝級的集成芯片。三是軟件(jiàn)層面要過關。不同廠商的計算(suàn)芯片之間要做出适配的I/O、内存通(tōng)道。

“東數西(xī)算(suàn)”帶來新風口

當下(xià)正值我國(guó)“東數西(xī)算(suàn)”工(gōng)程建設穩步推進之際。宋繼強指出,異構計算(suàn)是“東數西(xī)算(suàn)”的底層支撐。“東數西(xī)算(suàn)”所需的大型計算(suàn)中心内部,CPU、GPU、FPGA、DPU、專用加速器(qì)等對處理不同種類的工(gōng)作數據各有優勢與劣勢,也有運營成本高(gāo)低(dī)之分,所以未來一(yī)定要綜合部署,多(duō)種架構可能(néng)都需要涵蓋,而且要有機(jī)聯合起來。

趙立東認為(wèi),異構計算(suàn)對于“東數西(xī)算(suàn)”來說是剛需。從(cóng)半導體集成電(diàn)路(lù)“赢家通(tōng)吃(chī)”的發展特性來說,不管是從(cóng)内部的産品業(yè)務布局,還(hái)是外部的生(shēng)态與商業(yè)布局出發,單個(gè)數據中心或智算(suàn)中心項目在落地時,會(huì)考慮異構計算(suàn)的複雜(zá)性及發展不完備性所帶來的巨大的額外部署成本,在一(yī)定程度上(shàng)會(huì)偏好選擇以單一(yī)廠商為(wèi)核心的現成産品組合,盡量避免技(jì)術(shù)适配的投入。而置身于“東數西(xī)算(suàn)”背景下(xià),最終要實現的是全國(guó)算(suàn)力中心的大一(yī)統,從(cóng)而盡可能(néng)地優化利用資源,在多(duō)個(gè)數據中心或智算(suàn)中心互聯互通(tōng)的場景下(xià),異構計算(suàn)的複雜(zá)性會(huì)是前所未有的。因此,在異構算(suàn)力溯源、調度與管理平台的建設上(shàng),需要盡早布局與投入。

算(suàn)力網絡的構建不隻依賴于異構計算(suàn),通(tōng)用計算(suàn)也将為(wèi)“東數西(xī)算(suàn)”提供更多(duō)助力。近兩年(nián),國(guó)内湧現出一(yī)批通(tōng)用計算(suàn)芯片初創企業(yè),以FPGA和ASIC類型芯片作為(wèi)切入點,部分企業(yè)購買國(guó)外公司的IP授權開(kāi)發通(tōng)用GPU芯片,少數企業(yè)自(zì)主研發通(tōng)用GPU核心IP,實現了國(guó)内通(tōng)用計算(suàn)的突破。

天數智芯副總裁郭為(wèi)表示,通(tōng)用計算(suàn)所構建的算(suàn)力平台通(tōng)常并行處理能(néng)力特别強,計算(suàn)能(néng)效比高(gāo),并且有很大的存儲帶寬,能(néng)夠釋放(fàng)非常可觀的算(suàn)力。

郭為(wèi)建議,強化頂層謀劃,将算(suàn)力網絡上(shàng)升為(wèi)國(guó)家戰略,從(cóng)全局層面整體謀劃戰略定位、發展目标,加快構建新型算(suàn)力網絡格局。此外,應成立國(guó)家重點實驗室,打造重大原創技(jì)術(shù)策源地。優化異構計算(suàn)産業(yè)布局,發揮龍頭領軍企業(yè)的“鏈長(cháng)”作用,協同上(shàng)下(xià)遊企業(yè),制定産業(yè)鏈供應鏈圖譜及協同發展計劃,推動異構計算(suàn)産業(yè)鏈本土(tǔ)化、供應鏈多(duō)元化,确保異構計算(suàn)産業(yè)安全穩定。(記者 許子皓)

文章來源:中國(guó)電(diàn)子報(bào)