騰訊混元3D生成能力再升級,分鐘級生成遊戲3D資產

來源: 更新:

騰訊混元大模型再次引領行業技術,探索創新場景。

1月21日,騰訊混元宣佈開源3D生成大模型2.0版本,並上線業界首個一站式3D內容AI創作平臺—混元3D AI創作引擎。開發者可在GitHub、Hugging Face等技術社區下載混元3D 2.0模型,用戶也可以直接在混元3D AI創作引擎上體驗。對比1.0版本,2.0版本也依然同時支持文、圖生3D的能力,並在生成效果上得到顯著提升,在幾何結構上更加精細,紋理色彩更加豐富。

據瞭解,3D AIGC技術快速迭代,3D技術應用落地進程也在不斷加快,遊戲製作、社交、電商廣告、工業製造、具身智能、自動駕駛、AR/VR、三維打印等多個領域都積極應用AI能力輔助3D內容生產,如在遊戲製作環節,快速生成高質量的遊戲角色、道具、建築等3D資產,提升遊戲開發效率。面向UGC社交場景,創作個人3D形象、3D虛擬禮物等3D資產。面向電商廣告場景,根據創意主題生成3D商品,幫助設計師和企業降本增效。面向工業生產、製造業場景,快速生成工業產品原型驗證設計。此次混元3D生成大模型2.0的開源以及AI創作平臺的上線,將進一步推動AIGC 3D的技術發展及產業應用落地。


業界首個一站式3D內容AI創作引擎,爲各產業提升3D內容生產效率

其中,騰訊混元上線的3D AI創作引擎,是業界首個低門檻、一站式的3D內容AI創作平臺,包含了基礎模型生成、3D功能矩陣、3D編輯、3D生成工作流、創作素材庫等多種功能。既支持大衆愛好者生成UGC 3D內容,也助力遊戲開發、設計建模等專業領域的3D生產管線,大幅提升3D內容創作效率,面向不同應用場景提供可低成本定製的解決方案。

在基礎模型生成方面,創作引擎同時支持文生及圖生3D。其中,輸入中/英文提示詞,描述主體內容、特徵、風格等,就能快速生成4個高質量3D模型,同時,也支持上傳單圖即生成3D模型。效果上,可以選擇不同紋理風格進行生成,同時支持PBR貼圖,通過模擬物理特性可生成更逼真的材質貼圖效果。

另外,創作引擎支持端到端低多邊形模型生成,可根據物體複雜程度,自適應生成幾百至數千面的三角面,生成結果可在低面片的基礎上最大化體現模型細節,拓撲佈線更加符合美術標準,更適用於遊戲引擎模型渲染。

在3D功能矩陣方面,創作引擎涵蓋了豐富的3D建模、編輯及驅動等能力,包括3D動畫生成、3D紋理生成、草圖生3D、3D人物生成、3D小遊戲創作等。

其中,3D動畫生成可以支持骨骼綁定和動作驅動,選擇不同動作模版即可讓創作的角色模型輕鬆動起來,同時支持選擇不同角色模型素材或上傳本地模型生成3D動畫。在遊戲開發、動畫製作等應用中,3D角色骨骼驅動是實現角色動畫表現的關鍵步驟。

3D紋理生成則針對白模及用戶添加的模型,支持通過提示詞或圖像輸入方式生成不同高清材質紋理,對不同類別3D模型一鍵換膚。

草圖生3D則支持僅用一張簡筆畫完成3D內容創作。通過文字描述草圖主體的類別、顏色等信息,將二維草圖快速轉換爲高質量的3D模型。

3D人物生成僅需上傳一張人物頭像,選擇不同主題類別的模版即可實現個性化的3D人物角色生成,實現個人UGC 3D形象定製。

首個支持端到端生成低多邊形low-poly模型,可根據物體複雜程度,自適應生成幾百至數千面的三角mesh,面數更低的同時可保證模型細節效果,用於遊戲引擎渲染效果更佳。

3D小遊戲創作支持上傳一張頭像並選擇角色模版,一鍵生成個人專屬IP角色的遊戲動畫視頻,並能分享轉發,讓普通人也可以打造一款屬於自己的3D小遊戲。

值得一提的是, 混元3D AI創作引擎還支持設計3D生成工作流,呈現3D創作管線核心流程。通過模塊化的節點設計搭建,幫助專業用戶在遊戲開發、動畫製作等領域快速搭建3D生成工作流,其中包含3D角色生成與3D道具生成。用戶僅需加載模版,根據個人需求輸入提示詞或上傳圖片,調整節點生成參數,即可一鍵生成具有特定風格和特徵的3D資產,進一步降低專業用戶使用門檻,大幅改進3D創作管線效率。

混元3D生成大模型2.0版本開源,幾何結構與紋理色彩全面升級

混元3D生成大模型1.0在去年11月全面開源,是業界首個同時支持文字、圖像生成3D的開源大模型。2.0版本也依然同時支持文、圖生3D的能力,此外,通過將幾何、紋理解耦生成,2.0版本還在生成效果上得到顯著提升,在幾何結構上更加精細,紋理色彩更加豐富。

3D生成模型主要包括幾何和紋理生成兩部分,其中,幾何大模型專注於捕捉物體的形狀、結構和空間關係,而紋理大模型則專注於顏色、細節和表面特徵。這種專注性使得每個模型能在其領域內進行更深入的學習和優化,而幾何與紋理解耦生成的方式,讓整體生成能力達到更高上限,能夠生成更爲精細和真實的3D結果。

Hunyuan3D-2.0

幾何大模型和紋理大模型各自表現優異。其中,幾何大模型由Hunyuan3D-DiT模型和Hunyuan ShapeVAE組成,能實現超高精度的白模生成,幾乎達到了設計師手工建模的水平。而紋理大模型Hunyuan3D-Paint採用多視圖擴散生成的方案,可以基於用戶輸入的參考圖像對生成的幾何白模進行紋理貼圖。不僅如此,還能支持對用戶任意輸入的幾何模型進行任意文本或圖像引導的紋理生成。

騰訊混元從定量和定性兩個維度進行了評估。在收集的 In-the-wild 測試集上,對 3D 生成質量進行了定量評估。根據 CLIP Maximum Mean Discrepancy (CMMD)、Frechet Inception Distance (FID) 和 CLIP-score 指標,不論是端到端最終3D資產的質量,還是幾何模型生成的幾何結構以及紋理基模型生成紋理的質量,Hunyuan3D-2.0 的整體表現均優於當前業界包括閉源模型在內的最先進的模型。

整體模型比較

幾何模型比較

紋理模型比較

在定性評估方面,從整體滿意度、3D 物體質量和指令遵循三個維度進行用戶主觀評估,結果顯示,Hunyuan3D-2.0 在生成質量上優於當前最先進的開源模型。

用戶喜好打分

3D生成可視化比較

幾何模型生成可視化比較

紋理結果生成可視化比較

據瞭解,在實際應用上,混元 3D 生成大模型此前也已經開始應用於UGC 3D創作、商品素材合成、遊戲3D資產生成等司內業務及場景。比如,混元3D生成能力也開始應用於騰訊內部遊戲業務,其生成3D質量已能滿足部分遊戲3D資產標準,包括幾何佈線合理性、貼圖準確性與骨骼蒙皮合理性等,據統計,通過混元3D創作平臺的助力,遊戲業務3D資產製作時間成本可從5-10天級別下降到分鐘級。此前,騰訊地圖也已基於騰訊混元3D大模型,發佈了自定義3D導航車標功能,支持用戶創作個性化的 3D 導航車標,相比傳統的3D車標重建方案速度提升了91%,有效提升了用戶使用體驗。

騰訊混元3D負責人郭春超表示:“隨着3D AIGC技術快速迭代,3D技術應用落地進程也在不斷加快。混元3D生成大模型從1.0版本的率先開源,到快速升級2.0版本並開放業界首個一站式3D AI創作平臺,希望切實幫助大衆愛好者、開發者、創作者們降低使用門檻,提升創作效率,讓3D大模型技術在各行各業發揮價值。混元也會持續爲開源社區貢獻力量,一起探索3D生成技術和應用,共創良好生態。”

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top