3A大廠都在用,超500萬用戶:收入一年翻18倍,他們成了行業第一
這,是米哈遊《崩壞:星穹鐵道》的新角色昔漣:
小昔漣,圖源網絡
而這,是通過Meshy自動生成的同角色3D模型。
可以看到,其在整體形態和細節上已具備較高的完成度——有了模型後,你能一鍵綁骨用模型做出簡單的動畫,或者直接導出,用3D打印製作角色手辦。
除還原現有角色外,AI在原創設計上也展現出一定的能力。以下原創角色的生成結果,整體輸出的建模質量較高,且具備一定美感。
擔任Meshy算法和產品交叉崗位,帶領3D生成管線的研發以及大模型評測的產品研發負責人Andrew表示,「人物美感」是Meshy 6預覽版最大的技術突破,尤其是在肌肉紋理、動作姿態等模塊。
Meshy還被廣泛用於生成道具、場景、動物等各類資產。這類內容的完成度較高,也更易於投入到遊戲開發等下一步創作流程中。
可能大部分人不會想到,過去兩三年前,只能生成一些亂七八糟怪東西的AI,已經迅速從笑話進化爲了生產力工具。用Andrew的話來說,目前AI建模的質量,已經不輸於初級3D美術,同時能做到極大幅度的降本增效。
AI的進化,並非僅限於個人體感。從市場數據來看,根據SimilarWeb的統計,僅Meshy等幾家頭部工具,便已形成了超過700萬月活的市場規模。
其中,Meshy以超過300萬的月活斷層領先,並在全球市場份額中佔據絕對主導地位(如下圖的深藍色區域)。其用戶分佈集中於主流市場,例如在歐美地區的用戶佔比超過54%,超過其他幾家頭部工具的總和,已成爲全球應用最廣泛的3D AI生成工具——可以說,Meshy的發展軌跡,是這場3D生成技術變革的一大縮影。
其技術影響力也在昨天舉辦的Unite Shanghai 2025上得到了集中體現。Meshy團隊的專題演講現場座無虛席,他們所展示的3D AI生成技術最新進展吸引了大量的遊戲開發者關注。
Meshy大模型產品研發負責人Andrew
Meshy大中華區商務負責人吳迪
他們在Unite大會現場搭建的展臺,也吸引了不少開發者體驗和交流:
不僅規模大、影響力強,Meshy的發展速度也相當快。過去一年平臺用戶量和收入均實現十幾倍的增長,且已與多家頂級遊戲公司,及以元宇宙著稱的,全世界市值前五的科技公司等展開了合作。
Meshy團隊在昨天Unite大會上的演講內容
在穩固海外市場的同時,Meshy也於今年正式發力潛力巨大的國內市場,並組建了本土商業化團隊,旨在爲有3D資產創作需求的遊戲公司,提供專業的AI建模解決方案。
在迅速增長之下,Andrew卻認爲:當下3D AI生成的全球市場,僅是整個3D市場的「冰山一角」,滲透率極低。未來更巨大的需求空間尚未被真正激活——世界模型的基礎、下一個英偉達,都是他們更長遠的願景。
儘管技術願景宏大,Andrew卻不認爲人類創作者會單純被AI技術淘汰,相關行業的從業者也無需焦慮。“至少無論技術發展多牛逼,我們都相信「AI不會替代人類」。”
以下爲葡萄君與Andrew的對談內容,具體內容有所微調:
01
無心插柳,做出500萬
用戶的行業第一
葡萄君:你們爲什麼會選擇3D AI生成這個技術挑戰較大的賽道?
Andrew:這與團隊背景密切相關。我們公司前身是做太極(Taichi)編程語言的,團隊在圖形技術方面有很強積累,同時太極語言在AI領域也有應用潛力。於是我們想找一個能最大限度發揮圖形技術和AI交叉優勢的領域,3D生成正好符合這個定位。
葡萄君:當時賽道的競爭格局是怎樣的?
Andrew:這個賽道本身就是AI技術的前沿領域之一。早在2019年那會兒,就曾有做機器人或自動駕駛課題的實驗室和公司,爲了訓練合成數據,嘗試探索生成式模型。但市場真正對這一技術感興趣的時間,是在2023上半年,當時最簡單的,還是Discord上一個生成3D模型或貼圖的Bot(機器人)。我們及主要競品團隊基本都是2023年開始探索,整個行業的快速發展期也就這兩年的時間。
葡萄君:當時你們就想的特別清楚嗎?比如預見到3D AI生成會有這麼快的增速,這麼大的市場。
Andrew:沒有想太清楚,老實說,我們能跑出來並做到頭部,更多是無心插柳的結果。2023年我們團隊的主要精力放太極編程語言和另一個雲渲染的創業項目上,現在這個3D AI生成項目,其實是當小號練的。
葡萄君:雲渲染的項目後來怎麼樣了?
Andrew:2021年,受當時元宇宙的影響,比如NVIDIA的Omniverse(雲原生3D協作相關技術)比較火。我們覺得雲原生的計算機圖形領域會有較大的發展空間,於是想搭建一個基於雲技術的創作軟件:不用安裝任何軟件,就可以調用雲上服務器做光線追蹤的渲染,獲得一個非常真實的效果。
但中間遇到了幾個關鍵挑戰:一是要與開發了20-30年的本地軟件競爭;二是雲成本問題,2023年GPU價格不降反升;三是全球用戶訪問延遲問題。這三個挑戰,使得該項目的完成度雖然高,也有一批覈心用戶,比如曾有新西蘭的創作者,隔着半個地球的延遲使用我們的軟件,但後續用戶和商業化增長始終乏力,我們最終決定在2024年停掉項目,集中資源做Meshy。
葡萄君:現在Meshy的發展情況如何?還會有增長上的問題嗎?
Andrew:Meshy目前累計創作者已經超過了500萬,三方檢測平臺顯示的網站月活超過300萬,是目前3D AI生成領域頭部工具之一。而且我們用戶規模的增速也非常快,過去一年用戶量和營收都翻了十幾倍。
葡萄君:這種增速是否符合預期?
Andrew:增速本身符合我們的判斷,但持續的時間長度卻超出了預期。因爲通常初創公司初期增速快、產品新鮮感強,之後基本都會隨着規模擴大而放緩,但我們發現即便規模擴大後,我們產品的用戶增長率依然保持穩健。
葡萄君:你認爲增長的驅動力量是什麼?技術突破還是市場需求?
Andrew:這是一個「技術迭代驅動市場認知,進而激發市場需求」的正向循環。2023年,可能只有0.01%的3D美術從業者瞭解AI建模,而現在這個認知比例可能已升至5%——市場認知度的提升,是過去一年整個行業快速增長的基礎。
而市場認知之所以能快速轉變,根本原因在於技術和產品的持續突破。如果我們拿出一坨很差的東西,就無法讓人信服。正是由於技術迭代速度很快,當大家親眼看到AI的效果正在迅速接近人類建模師的水平時,纔會自然而然地開始關注並嘗試使用。
左右滑動查看
02
技術迭代:
從古羅馬到文藝復興
葡萄君:從技術角度來看,自AI繪畫爆火,到2023年你們剛起步,再到現在,3D AI生成的技術迭代有多快?
Andrew:發展很快,但發展的階段不算很成熟,目前AI生成3D的發展程度,大致相當於2D領域SDXL所處的階段。
具體來說,3D AI生成的演進過程可以分爲幾個關鍵節點:
擴散模型成功應用於2D繪畫之後,學術界早期主要探索如何將2D能力「升維」到3D。主流方法是利用預訓練的2D模型同時生成多視角圖片,再通過算法重建出3D模型——2023年及更早,這幾乎是所有3D生成技術的核心思路;
2D升維相關技術內容,圖源:https://mv-dream.github.io/
轉折點在2023年底到2024年,業界開始直接使用3D數據集訓練原生的3D擴散模型。這一步標誌着技術從「2D升維」邁向了「原生3D」,生成的資產質量有了明顯提升,也使得市場競爭驟然加劇。
3D擴散模型相關技術內容,圖源:https://neuralcarver.github.io/michelangelo/
到了2024年,技術前沿已經拓展到了自迴歸模型。這類似於大語言模型的工作方式,將3D網格視爲由面片序列構成,以此來逐個進行預測生成——這已成爲當前最前沿的技術方向,各大廠商也相繼推出了相關功能。
Meshy團隊在昨天Unite大會上的演講內容
葡萄君:2D升維和原生3D訓練的主要區別是什麼?
Andrew:底層原理都是擴散模型,核心區別在於數據表示(representation)。2D方法處理的是圖片數據,而原生3D模型需要處理各種3D表示形式,如體素、點雲等。近年來很多重要論文都聚焦於改進3D表示方法,這能顯著提升生成質量。
自迴歸模型則是另一條技術路線,它像寫文章一樣逐個生成面片,與擴散模型「從噪聲到清晰」的過程完全不同。
葡萄君:這期間,Meshy經歷了怎樣的迭代?
Andrew:Meshy4是個重要的分水嶺,之前我們使用的是2D升維的技術原理,之後轉向了3D擴散大模型;而團隊最新的Meshy6預覽版,在模型生成結果的精度上達到了新高,能生成非常清晰的人物細節和機械結構,單個模型的片面數量幾乎都在百萬以上。
特別是在有機形體塑造方面,我們的美術同事評價,其人體雕塑的能力已經超過初級3D美術師。
葡萄君:這種變化是否有更具體的案例?
Andrew:先說Meshy 4,因爲此前我們用的是2D升維技術,其中最讓我們頭痛的是表面材質的精確表達,比如生成一把結構精細的舊式左輪手槍,其槍管和握把始終無法做到銳利;Meshy 4出來後,我們用同樣的輸入圖片去生成,發現硬表面建模上的進步非常大。那個瞬間讓我們確信,必須堅定地轉向原生3D生成路線。
然後是Meshy 6,我們在內測時,發現它在人物角色方面的肌肉線條處理得極其準確,充滿了拉伸與放鬆的張力——這種進步,就像是古羅馬與文藝復興時的雕塑對比一樣,前者只有「形」,後者卻有了「神」,靜態的資產彷彿下一刻就要動起來了。
葡萄君:回顧整個迭代經歷,你覺得這個產業目前發展的最大挑戰是什麼?
Andrew:最大挑戰是數據問題。爲什麼大語言模型和文生圖模型進化速度這麼快?一是他們有10億、100億級別的訓練數據支撐;二是他們的數據結構統一,文字是字詞句,圖片是像素。
而3D模型的數據量不僅少,且表現形式(三角面、四邊面等)和製作方法(數字掃描、多邊形建模等)各不相同,這些都限制了3D AI生成產業的規模和迭代速度。
另一個挑戰是如何將生成式模型融入完整的3D工作流,雖然目前生成的模型可以直接導入3D軟件或遊戲引擎中進行下一步操作,但還沒辦法拆分部件做更細緻地調整,這也是整個學術界比較關注的下一步技術突破。
03
遊戲行業,
不只需要百萬面建模
葡萄君:你們曾提到,Meshy的建模傾向歐美寫實,在卡渲方面沒有太多優勢,這種情況是技術問題還是市場選擇問題?
Andrew:主要跟團隊的主動選擇有關。最早的Meshy用戶以歐美市場爲主,比較喜歡歐美寫實類的美術風格,因此團隊更傾向於怎麼把這類風格的建模做得更好。不過我們也在積極研發二次元美術風格的相關內容,你能發現Meshy 6預覽版上線後,生成的二次元模型已經有很明顯的進步了。
葡萄君:二次元模型的技術難題是否更容易解決?比如我看最近米哈遊也推出了他們的3D AI生成技術,看起來效果也不錯。
Andrew:不能簡單說某個品類更容易。二次元角色可能在宏觀結構上更簡單,但這不代表生成工作本身更輕鬆。一個典型的難題,就是如何將充滿平面設計感的頭髮,合理且美觀地轉換成3D結構,這需要極強的空間概括與想象能力。
你從傳統流程就能看出這件事的複雜性:一個二次元遊戲角色被做成手辦,通常需要專業團隊花費一年甚至更長的時間去設計。
再說米哈遊這樣的公司自己做技術,和我們的路線本來就不一樣。他們可以特別聚焦,只爲自己的美術風格服務。而我們做的是通用模型,得先解決「什麼都能生成」的問題,再在通用能力之上,去研究客戶最需要的風格。
葡萄君:歐美寫實和二次元風格在最終的模型資產上,除了視覺效果,還有哪些差異?我注意到AI生成的模型面數通常很高,基本在100萬面以上,但高精度的二遊角色建模最多也就幾萬面。
Andrew:這有兩個原因。首先跟擴散模型的底層邏輯有關。就像圖片生成需要高分辨率一樣,3D擴散模型也需要高「分辨率」來表現細節,產出更高質量的模型,這就會導致面數普遍在百萬級以上,接近數字掃描建模的方式。
Meshy團隊在昨天Unite大會上的演講內容
其次,歐美寫實和二次元風格間,會存在高低模的普遍情況。寫實風格往往更注重皮膚、服飾、紋理、毛髮等細節,因此需要更多面數;二次元建模一般皮膚光滑,服飾和毛髮紋理簡單,面數就較低。
葡萄君:從實際應用角度來看,遊戲行業肯定希望模型在保持品質的基礎上,消耗更少的面數,Meshy在這方面有什麼優化方案?
Andrew:目前AI模型面數過高,確實是遊戲研發,尤其是手遊研發面臨的一大挑戰,因爲硬件和遊戲引擎限制,遊戲同屏畫面的建模面數,必須保證在一定數量級以下。
解決方案我認爲一是自迴歸模型的迭代。這種模型類似大語言模型,反而不會生成太長的內容(上下文),所以自迴歸模型產出的建模面數,會相比擴散模型更少,一般接近人類藝術家。
二是我們提供了免費的AI重拓撲,跟傳統軟件的重拓撲類似,這一環節可以通過算法優化原有模型的面數,保留形狀的基礎上減少面數。
重試和重拓撲
遊戲是我們最重要的目標行業之一,我們還會持續關注和探索,如何在有限的面數之下生成更好的結果。
葡萄君:除此之外,你如何看待3D AI生成在遊戲行業的應用空間?
Andrew:目前有兩個方向,一是輔助生成場景輔助資產,比如我做過一個摩天大樓項目,用AI生成了周邊的凳子、雕塑等配景……我覺得這種模式能給創作者節省20%以上的時間和成本,但核心資產肯定還需要人工參與和修改;
二是遊戲發行方面的應用,比如宣發視頻、海報……這些物料更容易接納AI生成帶來的瑕疵,因此相對有更廣泛的應用空間。
葡萄君:未來還會有其他方面的需求嗎?比如動畫相關的三渲二、大範圍的場景資產。
Andrew:我們最近推出了3D建模生成圖片和視頻的功能,其實就是爲了視覺呈現和動畫這個需求場景服務的,我相信後續3D AI生成會進入更多遊戲研發和發行的工作流;
至於大範圍的場景資產,目前的AI模型有一定的生成能力,但目前開發者更熟悉採用Houdini, World Creator等地圖程序化生成軟件,來生成大範圍的場景。當然,不排除後續AI和程序化這兩種技術路線會進一步融合。
04
AI的發展,
永遠不是替代人類
葡萄君:我挺好奇,用AI生成3D建模,到底會比手搓節省多少精力和成本?
Andrew:這個問題比較複雜,首先在我們的案例中,已經存在AI生成建模後,可以直接拿來落地的情況。而不能拿來直接用的AI模型,創作者一般會有兩種優化方向:一是導入3D軟件後進行調整,比如平整一下凹凸不平、調整一下模型細節和紋理;二是將AI模型作爲參考,手動再搭建一個模型,節省了空間想象和創意落地的精力。
至於到底能降本增效到什麼程度?如果單純對比數字,相比傳統建模平均數週, 幾十上百美元的成本,AI建模可以做到1分鐘+1美元,在效率和成本上都可以實現數量級上的的改進。
Meshy團隊在昨天Unite大會上的演講內容
但是我更願意用創作輔助工具來形容Meshy——哪怕AI發展得再好,總需要有20%的工作,交給人類的智慧:這些模型該怎麼組合、呈現出怎樣的視覺效果、想傳達什麼樣的內容和情緒等等。
葡萄君:但很多客戶,尤其是大客戶,他們的合作本身也會帶有比較硬性的「降本增效」需求。
Andrew:會有類似的案例,但就遊戲行業來看,如果單純追求極限降本,最直接的辦法是增加外包比例——成熟的外包供應鏈是當前成本最低的解決方案之一。客戶願意和我們深入探討如何應用AI,恰恰說明他們目標不是一味壓成本,而是希望通過技術升級,提升創作環節的質量和效率。
葡萄君:具體來說,遊戲行業的客戶是怎麼看待這種技術的?
Andrew:之前有遊戲公司對我們的技術很感興趣,但我們同事負責跟進後發現,他們的資深美術通常並不信任AI建模,一是不相信AI能一鍵生成可用的結果,二是認爲事後調整的效率,可能不如他自己從零開始高效。
我們能理解這種認知:從實際生產的角度來看,遊戲廠商更需要一個能穩定、無縫嵌入現有工作流,在關鍵環節小幅但可靠提升效率的工具,而不是一個宣傳顛覆工作流、提效千倍的「革命性」工具。
葡萄君:非美術專業的創作者,比如策劃、程序、平面設計師等,會對3D AI生成技術有不一樣的看法嗎?
Andrew:這部分用戶的反饋與專業3D美術師完全不同,他們的接受度非常高,在他們看來,AI爲他們帶來的價值是從0到1的質變。
我們有很多用戶本身不具備3D技能,比如一些小型遊戲團隊,過去因爲團隊裏沒人會3D美術,而根本無法制作3D遊戲。現在,他們可以通過文字或圖片直接生成基礎的3D模型,這意味着他們從「完全做不了」變成了「可以上手做」的程度,團隊的市場空間也會更大。
Meshy團隊在昨天Unite大會上的演講內容
葡萄君:其實不少人也會有「AI取代人類」的焦慮。
Andrew:技術永遠是技術,是服務創作的工具。而創作者的價值,在於自身創意有沒有更好發揮——這一點不以技術爲轉移。至於是否被淘汰,這背後是個人適應性、市場需求變化等多重因素共同作用的結果,不能簡單地歸因於技術發展。
葡萄君:但AI繪畫曾引發過從業者的焦慮,在你看來,3D AI生成會重蹈覆轍嗎?
Andrew:我認爲從業者焦慮的根源在於,AI能瞬間完成一個作品70%-80%的基礎工作,這大幅壓縮了傳統創作技法所佔據的權重。
過去,一個想法從概念到實現,業餘愛好者可能只能靠自己完成5%,剩下的95%依賴的是專業人士的技術。而現在,AI扛起了那80%的執行負擔,這意味着人的核心價值更加聚焦於剩下的20%——也就是真正的創意、審美和決策。這20%的含金量其實更高,是決定作品最終高度的關鍵。
所以,隨着AI技術的高速發展,我們作爲這個領域的先行者,更有責任向大家傳達 “人” 永遠是創作的核心所在。技術不能取代人類,而創造出技術的我們更要去清晰地界定AI的能力邊界,引導大家該怎麼在AI輔助的基礎上,創作出真正優秀的作品。
05
夢想還是要有的
葡萄君:最後回到你們自身,目前Meshy團隊的發展情況如何?
Andrew: 我們是一個典型的快速發展型初創團隊,目前總部在在硅谷,北京、上海、深圳都有辦公室,有很強的遠程辦公文化,不強制打卡,關鍵是把事情做好、拿出結果。
葡萄君:怎麼理解你們官網「排名第一的3D AI生產工具」的說法?
Andrew:這是根據三方風投機構A16Z的調研報告得出的,當時他們做了關於遊戲行業AI產品使用情況的調研,結果發表出來後,我們發現Meshy是唯一被提到的3D生成工具,跟ChatGPT、Midjourney、Cursor這些其他的頭部AI公司並列。這至少證明了在很多公司眼中,我們是行業首選。
此外,從超300萬月活、超500萬的用戶規模、累計4000萬的生成模型數量等指標來看,我們也是全球市場最受歡迎的3D AI生產工具。
Meshy團隊在昨天Unite大會上的演講內容
葡萄君: 面對如此大規模的用戶和生成量,你們是如何設計商業模式的?
Andrew:Meshy目前是SaaS的商業模式,包括訂閱制和API接入,具體的定價則涉及成本和市場調研,是團隊系統分析後的最優解。
葡萄君:初創公司可能更在意成本,你們怎麼評估Meshy的成本和商業競爭力?
Andrew:首先產品定價一定要有足夠的競爭力,我們儘量不會將硬件成本轉嫁給創作者,而是用算法迭代來保持技術優勢——這對我們來說,也是保持團隊戰鬥力和技術領先地位的驅動力。
葡萄君:未來會有新的商業模式嗎?比如除了3D打印,TOC方面是否還有更廣闊的市場空間?
Andrew:目前SaaS的商業模式比較穩定,訂閱制和點數消費制能維持平衡。同時,我們最新推出了3D to video的能力,可以服務更多的遊戲視頻創作者,用於市場/廣告素材的生產,也可以解決現在主流的視頻大模型,可控性比較低的問題,這或許在未來會是TOC端更大的市場。再往後,還需要看3D內容是否有全新的消費空間。
葡萄君:爲此,團隊有哪些發展目標?
Andrew:短期來看,我們的工作重心還是生成質量更高、可用性更強的3D模型。至於更長期的願景,是從生成單一3D模型,到逐步探索能創造複雜互動場景的「世界模型」。我們相信,這也是實現下一代3D內容創作的關鍵路徑。
葡萄君:之前你們曾聊到,想成爲類似英偉達這樣的企業,這該怎麼理解?
Andrew:雖然我們只是初創公司,每一步都很艱難,但我覺得至少要有改變世界的夢想。爲什麼英偉達能成爲一個改變世界的公司?就是他們當時走了別人不敢想的路——或許他們當年也未曾預料,自己二十年前堅持的GPU計算,會成爲二十年後AI革命的基石。