算力需求的“光方案”,國內首個光互連光交換GPU超節點解決方案發布
在今日開幕的中國家電及消費電子博覽會(AWE)開幕式上,上海儀電(集團)有限公司聯合上海曦智科技股份有限公司、上海壁仞科技股份有限公司、中興通訊股份有限公司正式發佈光躍超節點128卡商用版(LightSphere 128)。此次重磅發佈,標誌着這一中國原創的光互連光交換超節點解決方案,僅用半年多時間即實現從概念驗證到實際商用的跨越。目前,光躍超節點已實現數千卡的部署。
自2025年世界人工智能大會首次發佈以來,光躍超節點歷經半年多聯合攻關,成功實現128卡商用版落地。作爲國內首個光互連光交換GPU超節點解決方案,這項誕生於上海、成長於上海的原創技術成果,以曦智科技全球首創的硅光OCS光交換芯片爲核心,搭載壁仞科技自主原創架構的大算力通用GPU液冷模組壁礪166L,並集成中興通訊高性能AI服務器及自研軟件平臺,構建起全棧自主的智算集羣新範式。
實測數據顯示:在同等規模下訓練DeepSeek V3 671B模型時,光躍超節點128商用版的訓練性能較非超節點集羣顯著提升,模型切換延遲低至微秒級,傳輸延遲相較傳統電交換降低90%以上。目前,該超節點已成功適配階躍星辰全系列模型(包括Step3.5 Turbo),以及DeepSeek、Minimax、Kimi、GLM等主流大模型,有效縮短了大模型的訓練時長和推理延遲,可爲用戶提供高性價比、高能效的國產算力解決方案。光躍超節點128商用版已實現長期穩定訓練狀態。
作爲此次AWE的明星展品,光躍超節點128卡商用版呈現三大原創技術突破:
全球首創硅光OCS光交換芯片,重塑超節點架構
光躍超節點基於曦智科技全球首創的硅光OCS光交換芯片,突破單機櫃功耗與物理互連瓶頸,實現跨機櫃GPU萬卡級彈性擴展;同時,拓撲實時重構能力可按模型負載的通信需求動態調整超節點規模與GPU互連拓撲,故障場景下秒級完成拓撲切換,顯著降低GPU冗餘成本;此外,光交換技術不依賴於特定的數據傳輸協議,可無縫兼容不同廠商使用的互連協議,消除生態鎖閉風險;更關鍵的是,硅光OCS芯片基於硅光技術,其設計與製造完全不依賴先進半導體工藝節點,從根源上提升了算力基礎設施供應鏈的安全性與韌性。
全棧自主原創大算力GPU液冷模組,提供強勁訓推算能
光躍超節點搭載壁仞科技“壁礪™ 166L”自主原創架構大算力通用GPU液冷模組。該模組單卡BF16算力,通過多計算芯粒(Chiplet)與CoWoS 2.5D先進封裝協同設計,搭配革新載板互連技術,實現超高密度算力輸出。同時,高效的液冷方案顯著提升超節點的能效比與系統穩定性,爲大規模智算集羣建設構築強大、安全、可靠的算力底座。
自研軟件平臺靈活配置超節點網絡,高效適配大模型負載
光躍超節點依託中興通訊自研軟件系統,實現對各類大模型需求的廣泛適配,並可按模型特徵動態完成算力拓撲的切換和算力資源的精細調度。基於全局資源可觀測體系,系統能夠實現故障節點的秒級替換與分鐘級斷點續訓,爲大模型訓練提供高可靠保障。通過軟硬協同的系統級工程優化,光躍超節點的光互連優勢被充分轉化爲性能、效率與可擴展性的全面提升。
光躍超節點128卡商用版的落地,標誌着一項源自上海的原創光互連光交換技術創新,成功轉化爲實實在在的算力生產力。這一成果充分體現了上海在集聚創新資源、打通產業鏈條、構建開放生態方面的獨特優勢。面向未來,該方案將加速從128卡向更大集羣規模邁進,在更大規模的真實業務場景中持續驗證和釋放光互連光交換技術的潛力。立足上海、服務全國,光躍超節點正爲全棧自主的國產算力池建設奠定堅實基座,助力中國人工智能產業在萬卡協同時代行穩致遠。