臺灣超級芯片問世!耗電或超大型工業設備,真的可以煎雞蛋了?
你能想象一枚芯片消耗幾千瓦的電力,甚至可能超過家用電爐嗎?這個可怕的燒電時代可能就要來了,世界芯片代工巨頭臺積電,已計劃生產晶圓級的巨大超級芯片,算力可能達到現有系統的40倍。自然,它的電力消耗也極爲恐怖,可能會達到數千瓦,這意味着它的用電量可能會超過電爐,好吧,未來芯片也可以煎雞蛋,再也不用點外賣了嗎?
所謂晶圓級集成,簡單來說,就是一張晶圓製成一個大芯片,而不是像現在這樣製成數十數百個,然後切割成一個個的小芯片。晶圓級集成可以減少芯片間的物理連接,降低複雜度,簡化系統,然後因爲數據傳輸距離縮短,可以極大地減少延遲,更快地處理信息,提升芯片的整體性能,同時還可以減少功耗,開發出前所未有的高性能處理系統,在人工智能、大數據分析等領域有着巨大的潛力。
比如英偉達最新發布的史上最強AI芯片B200 GPU,就是將兩個超大型Die(裸片)封裝製成的,兩個B200再加一個Grace CPU,就構成了GB200加速卡,兩個GB200再組成一個計算節點,18個節點再組成一個Rack機架,一共有36個CPU和72個B200 GPU,稱爲GB200 NVL 72,就可以訓練萬億參數的大模型了。
但如果把這些都集成到一個芯片上呢?這就是Cerebras Systems正在做的,現在最大的晶圓只有12寸,他們就在12寸的晶圓上集成了4萬億個晶體管,製成了90萬個內核的WSE-3,總面積46225平方毫米,和人腦袋差不多大,一個芯片就可以訓練24萬億個參數的大模型,可以構建比GPT-4大10倍的大模型,自稱是世界上最快的AI加速器。
那麼這個芯片是誰製造的呢?沒有任何懸念,肯定是臺積電。不僅WSE-3,特斯拉自動駕駛FSD已經結束公測,並已在中國初步獲批,你知道它的靈魂是什麼嗎?Dojo超級計算機,專門用來訓練視覺神經網絡,裏面包含了7360個D1芯片,這個D1芯片也是臺積電生產的。25個D1芯片網格化封裝,就成了一個訓練模塊(大芯片),這個封裝也是臺積電完成的。
在近日舉行的北美技術研討會上,臺積電詳細介紹了半導體和芯片封裝技術路線圖,未來將在整個晶圓級規模上集成系統,創建高性能的計算。目前特斯拉下一代Dojo訓練模塊已投入生產,到2027年將通過更復雜的晶圓級系統技術,將它的計算能力提高40倍。
具體來說,臺積電將通過CoWoS封裝技術,將多個芯片安裝在一個單獨的硅中介層上,超越傳統單芯片800mm²的尺寸限制,製造出更大的超級芯片。目前已可以創建最大爲2831mm² 的中介層,AMD的Instinct MI300X和英偉達即將推出的B200加速器就將在這個尺寸上封裝。
而下一代CoWoS將達到4719mm²,可以支持更多的HBM高帶寬內存堆棧,計算性能上將高出當前技術3.5倍。2027年將進一步提高到6864 mm²,可以集成更多的邏輯芯片和內存堆棧,預計性能將達到當前技術的7倍。
但你發現沒有,這個面積比起臺積電爲Cerebras Systems製造的46000多平方毫米的真正超級芯片面積要小得多,這是怎麼回事呢?目前Cerebras的技術仍然是獨一無二的,他們設計了更多的冗餘,來避開晶圓上的固有缺陷,因而可以讓晶圓級的超級芯片正常發揮作用。
而臺積電的封裝,實際是將更多的小芯片封裝在一起,提高芯片之間的數據帶寬,讓它們可以像單個的大芯片一樣有效工作,而不是直接製造成大芯片。不過不管是直接集成,還是間接封裝成大芯片,目前還是隻有臺積電有這樣的能力,隨着人工智能爆發對算力的指數式增長需求,晶圓級超級芯片會是未來的趨勢嗎?
不管是不是,這種芯片即使會降低能耗,也會消耗比現在更多的電力,像Cerebras Systems的WSE-3,功耗就達到了驚人的15千瓦,這都不是電爐的功率,而是大型工業設備了。臺積電未來封裝的大芯片,至少也會有數千瓦的功耗,煎雞蛋應該是沒有任何問題的。
當然,超級芯片一枚可能就要數百萬美元,煎雞蛋肯定是必須避免的,不然雞蛋熟了,AI也死了,你覺得可以採用那種方式來冷卻呢?歡迎留言討論。