美國不想看到的事發生了:華爲百萬卡集羣面世,將正面挑戰英偉達

來源: 更新:

美國人這幾年搞“小院高牆”,門焊死了,就想把華爲活活困死在裏頭。

結果呢?美國人傻眼了

華爲非但沒死,反手在2025年9月的全聯接大會上,扔出個終極“王炸”:一套構建百萬卡AI集羣的宏偉藍圖!

這已經不是突圍,這是要正面掀桌子了。

384張卡“掀桌子”:拿“系統”硬剛“單點”

必須承認,美國的封鎖一度讓華爲非常難受

大模型時代,算力就是一切。可這玩意兒,以前基本只有英偉達一家能上桌打牌。

在美國層層加碼的芯片管制下,華爲拿不到先進製程,導致單顆昇騰芯片的算力,只有英偉達BlackwellGPU的大概三分之一

差距是客觀存在的。華爲專家自己都坦承,過去客戶用昇騰,很多時候是因爲被美國斷供,“被迫用昇騰”

那個時候,別說客戶了,連華爲內部都瀰漫着一股焦慮:“昇騰算力到底能不能行?”

所有人都以爲華爲這局“死定了”。

但美國人忘了,華爲這家公司,最擅長的就是“不按套路出牌”

你卡我單芯片?行,那我就不跟你玩“單點PK”了。

華爲內部搞了個“算力會戰”,把華爲雲、模型、底座、芯片、硬件、基礎軟件全喊到一塊,幹了票大的。

這叫什麼?華爲雲CEO張平安管這叫“發揮‘大雜燴’的優勢”

翻譯過來就是:用“系統工程”,拿“集羣”的規模優勢,硬剛你“單卡”的性能優勢。

這場“掀桌子”的代表作,就是已經開始發貨的“昇騰384超節點”(CloudMatrix384)。

這玩意兒,可不是把384張卡插在一個大插排上那麼簡單。

爲了讓384顆昇騰NPU和192顆鯤鵬CPU像“一個超級大腦”一樣思考,華爲幾乎把自己的老底都掏出來了。

首先,扔掉老架構

華爲打破了以CPU爲中心的傳統馮諾依曼架構,搞出了一套自有標準的“全對等互聯架構”

華爲創始人任正非打過一個比方:西方的架構是“百衲衣”,衣服破了不斷打補丁,協議五花八門,互通效率很低。

華爲乾脆不補了,重新定義了總線,統一了通信協議,把有效載荷拉滿。

其次,砸錢上“硬科技”

芯片堆在一起,數據傳輸就是個致命難題。

華爲的辦法是“上光”!在384超節點裏,塞進了3168根光纖6912個400G光模塊。用光通信的高帶寬、低損耗,解決跨機架的“堵車”問題。

還有散熱。這麼多芯片堆一起,熱量大到能“癱瘓系統”。

華爲直接上了“液冷散熱”。華爲專家說,這背後是材料科學的勝利,是華爲在全球的8個材料實驗室、86個基礎技術實驗室“用數學補物理”的成果。

這就是華爲的打法:“以面積換能力、以堆疊增容量、以集羣擴規模”。

你芯片是厲害,但我用光通信、新材料、新架構這些“系統”能力,照樣能跟你掰手腕。

性能“反向碾壓”?黃仁勳:它超越了英偉達

這條“系統換單點”的邪路,華爲還真就走通了。

走通的結果,“嚇人一跳”

2025年8月,華爲雲CEO張平安在中國國際大數據產業博覽會上,扔出了第一個數據:

華爲的昇騰AI雲服務,不在意它是7納米還是10納米,在意的是“最終計算結果”。

結果就是,在CloudMatrix384超節點上,每張卡(50ms時延下)可以生產出2400個Token

這是什麼概念?

張平安說:“這個效率是H20的三倍。”

這還沒完。

華爲雲透露,在智能駕駛領域,多個項目的實際測試顯示,在典型感知模型上,384超節點可以達到或者超過H100的2.5-3倍

最狠的對比,來自英偉達自家的“王牌”。

英偉達最新的GB200NVL72系統,集成了72塊BlackwellGPU,單櫃算力驚人。

而華爲的昇騰384超節點,可提供高達300PFlops的密集算力。

有專家指出,這個性能表現,接近英偉達GB200NVL72系統的兩倍

這一下,全球科技圈都“炸鍋”了。

要知道,英偉達的CEO黃仁勳,在2024年2月才首次把華爲列爲AI芯片等多個類別的“主要競爭對手”

僅僅幾個月後,黃仁勳在評價華爲時,用詞已經變成了“非凡”(extraordinary)。

黃仁勳在接受採訪時說,華爲是一家“規模和實力非凡的公司”,“擁有強大芯片設計能力、系統設計和系統軟件”。

他甚至罕見地承認:“從技術參數看,華爲的CloudMatrix384超節點,性能上超越了英偉達。”

這是什麼?這就是對手的“尊重”

黃仁勳說,華爲是“對手,不是敵人”,他對華爲的感情是“欽佩、尊重,並且充滿競爭意識”。

能讓黃仁勳說出“欽佩”兩個字,華爲靠的不是別的,正是這種在絕境中“硬幹實幹”,用“系統”砸出一條血路的能力。

終極藍圖:百萬卡集羣,美國最不想看的局

如果說384超節點是華爲“掀桌子”的第一步,那它在2025年9月18日全聯接大會上公佈的藍圖,就是“終極陽謀”

華爲輪值董事長徐直軍在上海宣佈,華爲將構建“百萬卡規模超節點AI集羣”

這不是吹牛,這是一張清晰的技術路線圖

2026年第四季度,率先推出基於下一代昇騰950芯片的集羣,實現超過50萬張AI卡的規模。

到2027年第四季度,正式建成基於昇騰960芯片、規模達到百萬卡級別的集羣。

美國人最不想看到的一幕,正在發生

美國搞“小院高牆”,本意是徹底鎖死中國的AI算力發展。

可他們沒想到,你封鎖硬件,華爲就“以集羣擴規模”;你壟斷CUDA生態,華爲就自建CANN和MindSpore軟件棧

英偉達的CUDA生態,就像AI界的“Windows系統”,全球90%的AI框架都基於它開發。

這曾是國產芯片“鬼門關”

但現在,華爲正通過聚焦Transformer等主流模型的核心算子(從幾萬個收斂到幾百個),快速補齊生態短板。

華爲專家說,我們不會跟在西方標準後面“打補丁”,我們要重新定義架構,打造基於“中國標準”的“愛馬仕”

這個“百萬卡集羣”計劃,就是中國實現AI算力自給戰略目標的關鍵落子

它將爲中國的大模型產業提供強大的本土算力支持,築起一道堅實的“算力長城”

外交部發言人毛寧說得好:“事實證明,‘小院高牆’擋不住中國創新發展的步伐。”

美國這波操作,非但沒能“困死”華爲,反而“喚醒了一個沉睡的巨人”,逼着中國在AI算力這條最關鍵的賽道上,開闢了一條完全自主的道路

參考資料

英偉達首次將華爲列爲“對手”,外交部:“小院高牆”擋不住中國創新發展步伐.中國青年報.2024-02-27

全球最強!華爲發佈超節點和百萬卡算力集羣!.太平洋科技.2025-09-19

華爲昇騰384卡掀桌!國產算力撕破英偉達壟斷這局必須贏!.新浪財經.2025-07-29

黃仁勳談中國芯片企業:是對手不是敵人實力非凡值得欽佩.國際在線.2025-07-21

華爲計劃三年內在AI芯片領域超越英偉達.新浪財經.2025-09-23

華爲雲CEO:384超節點每卡性能可達英偉達H20三倍.新浪財經.2025-08-30

用“系統工程”打破算力封鎖昇騰的另類突圍路徑.每日經濟新聞.2025-06-17

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top