• 中國AI計算迎來(lái)重大突破!首批AGC架構智算整機問(wèn)世
    2025-05-13 中國軍工網(wǎng)

    大模型帶來(lái)了巨大的AI算力需求,同時(shí)也對傳統以CPU為中心的計算機架構(ACC)提出了前所未有的挑戰。早在今年2月,致力于計算機體系結構創(chuàng )新的容芯致遠就首次提出了全新的AGC智算架構——以GPU為中心重新設計AI計算機系統,打破傳統AI計算面臨成本、效率、靈活性的“不可能三角”難題,引發(fā)業(yè)界關(guān)注。

    從雙卡到20卡,全球首家單機適配全尺寸DeepSeek

    5月9日,容芯致遠聯(lián)合中國開(kāi)放指令生態(tài)(RISC-V)聯(lián)盟在北京宣布成立RISC-V國產(chǎn)智算體系結構創(chuàng )新專(zhuān)業(yè)組,現場(chǎng)300多人參與會(huì )議。容芯致遠一舉發(fā)布5款采用AGC架構設計的智算新品,從支持雙卡到支持20卡不等,成為全球首家單機全面適配DeepSeek各模型尺寸產(chǎn)品的企業(yè)。

    其中,入門(mén)級的K2支持雙卡,體積小巧、超靜音(噪音低于55分貝),預置DeepSeek 32B模型服務(wù)、推理環(huán)境及RAG環(huán)境,非常適合辦公場(chǎng)景部署;旗艦級的K20單機可支持20卡,通過(guò)創(chuàng )新的張量并行技術(shù),完美運行滿(mǎn)血版 DeepSeek 671B全量模型。較于傳統方案則需要4臺8卡機器組網(wǎng),技術(shù)復雜、成本高、運維難度大。K20基于獨立全信創(chuàng )體系,支持國內外多種形態(tài)的GPU算力卡及主流CPU處理器,同時(shí)適配DeepSeek、Qwen、LLama、ChatGLM等國內外主流開(kāi)源AI大模型。

    圖:支持20卡(16生產(chǎn)卡+4熱備卡)的K20現場(chǎng)點(diǎn)亮

    AGC智算架構如何破解“不可能三角”?

    容芯致遠CTO石旭在主題報告中分享了K20背后的架構創(chuàng )新理念與核心技術(shù)。他談到,芯片、系統和軟件是計算機體系結構的三大關(guān)鍵要素。只有在體系結構層面進(jìn)行高維度的創(chuàng )新,才能打破成本、效率、靈活性“不可能三角”的魔咒,讓GPU發(fā)揮更大算力效率,同時(shí)更具成本優(yōu)勢和靈活的適應性。

    圖:AGC是面向AI時(shí)代的計算機體系結構

    在高性能計算(HPC)、大模型訓練/推理等場(chǎng)景應用中,與CPU相比,GPU作為核心加速計算部件,具有功耗更高、運行溫度更高、故障率更高等“三高”特征,進(jìn)而對GPU算力卡的生產(chǎn)級可用性、運維便捷性、使用壽命構成嚴重挑戰。有數據表明,某國外著(zhù)名GPU在非7X24小時(shí)使用情況下的故障率為1-3%,在高負荷場(chǎng)景下故障率高達5-8%。由于長(cháng)期處于高溫高能耗狀態(tài),GPU的平均壽命僅有1-3年。對普通架構智算整機而言,單卡故障會(huì )直接導致整機停止服務(wù),恢復時(shí)間需2小時(shí)以上。

    針對上述挑戰,容芯致遠技術(shù)團隊另辟蹊徑,立足AGC架構設計理念,實(shí)現了全球首創(chuàng )的GPU熱插拔、GPU-RAID高可用、GPU節能延壽等三大技術(shù)突破。通過(guò)GPU Box設計,更換GPU卡就像換硬盤(pán)一樣簡(jiǎn)單,運維時(shí)間從至少2小時(shí)縮短到1分鐘,極致提升運維效率,保障業(yè)務(wù)連續性;通過(guò)GPU-RAID技術(shù),類(lèi)似磁盤(pán)陣列的冗余設計,使單機可用性從傳統架構的85%躍升至99.99%,極大提升生產(chǎn)環(huán)境下智算系統的SLA服務(wù)水平;通過(guò)GPU算力卡單點(diǎn)電源管理技術(shù),構建細粒度能耗管理體系,讓GPU在非工作時(shí)段由系統自啟休眠模式,降低功耗和電費,并有效延長(cháng)GPU卡的使用壽命。另外,通過(guò)單張GPU算力卡與100G至400G網(wǎng)卡綁定技術(shù)(不占用CPU性能),實(shí)現單機2T至8T通信墻,支撐構建萬(wàn)卡矩陣組網(wǎng)。

    容芯致遠提出的AGC架構與技術(shù)突破,已經(jīng)獲得多家上下游伙伴與企業(yè)用戶(hù)的認可。來(lái)自航天聯(lián)志、燧原科技、信者科技的嘉賓分別介紹了與容芯致遠的合作成果。其中,航天聯(lián)志基于容芯致遠技術(shù)的通算/智算系列產(chǎn)品,已經(jīng)在油田、政務(wù)、涉密部門(mén)實(shí)現部署應用;燧原科技表示對于燧原S60的容芯致遠一體機DeepSeek 671B滿(mǎn)血版,經(jīng)優(yōu)化測試后獲得了極好的綜合性能,相較于A(yíng)CC結構,節省了50%的硬件資源;信者科技不僅將容芯致遠的AGC智算方案引入某重點(diǎn)雙一流高校場(chǎng)景,還推出了基于超融合DAU數據處理器加速卡的信創(chuàng )服務(wù)器方案,提升IO性能3-10倍,降低硬件投資及運營(yíng)成本50%以上。

    攜手RISC-V聯(lián)盟,打造國產(chǎn)智算“朋友圈”

    為進(jìn)一步推廣AGC架構,吸引更多企業(yè)進(jìn)行協(xié)同創(chuàng )新,容芯致遠選擇將所有知識產(chǎn)權面向CPU、GPU、整機廠(chǎng)商以及RISC-V聯(lián)盟成員單位進(jìn)行開(kāi)放、共享。在此次會(huì )議上,RISC-V聯(lián)盟國產(chǎn)智算體系結構創(chuàng )新專(zhuān)業(yè)組也宣告成立,成為該聯(lián)盟旗下七大專(zhuān)業(yè)組之一。

    圖:RISC-V國產(chǎn)智算體系結構創(chuàng )新專(zhuān)業(yè)組成立儀式

    在全球RISC-V生態(tài)高速發(fā)展、RISC-V高性能處理器不斷取得技術(shù)突破的態(tài)勢之下,RISC-V+AI正成為新的產(chǎn)業(yè)共識,有望為AI推理算力市場(chǎng)帶來(lái)新的組合方案。在這一背景下,基于RISC-V的國產(chǎn)化智算體系架構創(chuàng )新機會(huì )巨大,國產(chǎn)智算創(chuàng )新體系專(zhuān)業(yè)組的成立可謂恰逢其時(shí)。中國開(kāi)放指令生態(tài)(RISC-V)聯(lián)盟秘書(shū)長(cháng)包云崗在致辭中對專(zhuān)業(yè)組提出了三點(diǎn)期望:一是堅持開(kāi)源開(kāi)放,秉承RISC-V初心,推動(dòng)技術(shù)共享和協(xié)作創(chuàng )新,二是聚焦國產(chǎn)智算,結合中國市場(chǎng)需求,打造真正可自主演進(jìn)的解決方案,三是匯聚行業(yè)力量,聯(lián)合產(chǎn)學(xué)研各界共同構建繁榮的RISC-V生態(tài)體系。

    圖:中國開(kāi)放指令生態(tài)(RISC-V)聯(lián)盟秘書(shū)長(cháng)包云崗致辭

    目前,國產(chǎn)智算體系結構創(chuàng )新專(zhuān)業(yè)組首批共有15家成員單位加入,由北京中科彼岸集成電路科技有限公司和北京容芯致遠科技有限公司共同發(fā)起創(chuàng )立,由天津信創(chuàng )海河實(shí)驗室、超??萍迹ㄉ虾#┯邢薰?、兆松科技(武漢)有限公司擔任副組長(cháng)單位。其他十余家委員單位涵蓋RISC-V芯片、GPU、整機、軟件等全產(chǎn)業(yè)鏈。

    圖:RISC-V國產(chǎn)智算體系結構創(chuàng )新專(zhuān)業(yè)組證書(shū)頒發(fā)儀式

    根據規劃,專(zhuān)業(yè)組一方面致力于中國的智算技術(shù)體系研究,秉持著(zhù)開(kāi)放、開(kāi)源、創(chuàng )新、共享的合作理念,深入開(kāi)展技術(shù)研究工作,挖掘RISC-V技術(shù)在智算領(lǐng)域的深度潛力,形成和輸出技術(shù)標準制定與規范,不斷推動(dòng)體系結構的創(chuàng )新;另一方面,致力于中國智算生態(tài)發(fā)展,以提升國產(chǎn)智算生態(tài)鏈的整體能力為己任,全力推動(dòng)國產(chǎn)智算技術(shù)與產(chǎn)業(yè)的茁壯成長(cháng),打造優(yōu)質(zhì)的國產(chǎn)智算系統生態(tài)。

    石旭在演講中也談到,未來(lái)還有很多體系結構方面的技術(shù)需要協(xié)同專(zhuān)業(yè)組一起協(xié)作解決,比如部件級芯片級高速傳輸技術(shù)、國產(chǎn)開(kāi)源人工智能框架等。目前聯(lián)盟內部已經(jīng)啟動(dòng)“延安開(kāi)源框架”研發(fā)項目,將全方位支持國產(chǎn)GPU,著(zhù)力解決GPU深度優(yōu)化、全局緩存共享、全鏈路優(yōu)化、大模型安全、訓推效率提升等5個(gè)方面的問(wèn)題。

    在圓桌論壇環(huán)節,RISC-V副秘書(shū)長(cháng)張松就國產(chǎn)AI發(fā)展和七位行業(yè)專(zhuān)家展開(kāi)深度對話(huà),容芯致遠首席科學(xué)家張彥朝指出:“AGC架構已在國內多個(gè)重點(diǎn)行業(yè)驗證,推理效率提升3倍以上?!闭姿煽萍糃EO范澤分享:“我們開(kāi)發(fā)的RISC-V專(zhuān)用編譯器可將CUDA遷移損耗控制在15%以?xún)??!毙艅?chuàng )海河實(shí)驗室主任王濤強調:“要通過(guò)開(kāi)源協(xié)作突破技術(shù)壁壘,構建自主可控的AI生態(tài)?!?/p>

    圖:圓桌論壇

    在本次行業(yè)盛會(huì )上,年輕的容芯致遠公司以其突破性的技術(shù)讓大家為之震撼。公司研發(fā)的智能計算解決方案憑借創(chuàng )新架構和卓越性能,贏(yíng)得了與會(huì )專(zhuān)家的高度評價(jià)。一位資深I(lǐng)T專(zhuān)家現場(chǎng)題寫(xiě)對聯(lián)“小公司,開(kāi)大會(huì ),彰顯創(chuàng )新力量;新技術(shù),破舊局,科技引領(lǐng)未來(lái)”,生動(dòng)詮釋了這家新興企業(yè)的創(chuàng )新力量。在日趨激烈的全球AI競賽中,這樣的創(chuàng )新力量將為中國智算架構實(shí)現跨越式發(fā)展注入強勁動(dòng)能,推動(dòng)中國AI技術(shù)走向世界前沿。

     
     
    網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系我們  |  廣告服務(wù)  |  版權隱私  |  友情鏈接  |  站點(diǎn)導航