97年創始人再獲5000萬美元融資,遊戲行業對AI嚴重低估?
輸入一句簡單的prompt,或者上傳一張圖片,2秒就能生成一個拓撲規整、佈線合理的5000面遊戲模型。
再多花一分鐘,就能自動生成匹配的紋理貼圖。全程不用手動做二次拓撲、減面,還能一鍵完成骨骼綁定和動作適配,生成的模型直接就能接入Unity、UE引擎使用。
當然,實際體驗下來,如果只甩一張參考圖、不加任何提示詞輔助,最終成品還是會有些微瑕疵。但單看這個生成速度,還有拓撲佈線的完成度,成品已經完全能打,乍一看已經挑不出什麼毛病。
與同類產品的對比
這就是VAST的Smart Mesh(Tripo P1.0),也是目前全球獨一份的技術能力。
如果追求極致精度,可以切換到高精度模式,VAST最新發布的Tripo H3.1,在輸入對齊、結構精度、貼圖質量等核心指標上均有明顯提升,能精細還原複雜機械的內部結構與紋路,生成的模型可以直接用於3D打印和工業設計,也可用於遊戲和動畫的製作環節。
VAST創始人宋亞宸(Simon)還給我們演示了一段Demo:國內某上市遊戲公司用Tripo工具,完成了《黑神話:悟空》經典場景的重建,場景裏所有的佛像、建築、植被模型,全由Tripo一鍵生成,無需額外修改就能直接填入場景使用。雖然單一模型放大之後肯定達不到3A級別的精度,但配合紋理貼圖和燈光特效,頗有些以假亂真的觀感。
而實現這個效果的,還只是Tripo 3.0版本,並非最新迭代的3.1版本。
我知道看到這裏,可能有人會覺得我在誇大其詞,但這種技術能力,行業裏的大廠和資本已用真金白銀投了票。例如騰訊、字節和網易都是他們的客戶。
而就在今天(3月5日),VAST正式公佈了新一輪融資信息:本輪由阿里、恆旭資本領投,元禾璞華、BV百度風投、東方嘉富等跟投,合計融資金額達5000萬美元; 老股東春華創投與北京市人工智能產業投資基金也進行了大額加註。
此前VAST的融資以財務基金、產業基金爲主,本輪則吸引了阿里、百度兩家BAT巨頭入局。在宋亞宸看來,資方陣容的變化,核心是行業終於看到了AI 3D技術的商業化落地能力——它已經真正走進了遊戲、3D 打印等產業的核心生產管線。
去年,宋亞宸就曾向我們拆解過AI 3D技術對遊戲行業的顛覆性潛力。彼時行業裏的大廠,大多還停留在接入Tripo API做二次開發的階段,對於這項技術究竟能把遊戲行業帶向怎樣的未來,多數人心裏都沒個準數。
但宋亞宸當時就提醒我們,AI 3D生成技術剛剛面世兩年,我們不該低估新事物的進化速度。
事實也的確如此。僅僅不到一年時間,他們的技術就迎來了又一次關鍵性突破。也正因如此,我們再次與宋亞宸聊了聊。
宋亞宸告訴我們,如今公司的Tripo AI服務已覆蓋9萬多家企業,全球遊戲公司幾乎都不同程度地接入了Tripo API,C端產品Tripo Studio也積累了650萬開發者和創作者。
他推測在2026年底之前,大家用AI做3D內容,會像現在用AI生圖片一樣簡單,而且會變成理所當然的事。
今年上半年,他們還會上線一款平臺型產品,目標是做出一個UGC交互內容平臺,讓每個人都能成爲遊戲製作人。
“現在全球遊戲市場規模爲2600億美金,我認爲它會迎來爆發式增長,至少翻10倍。”
01
“3年前根本沒人相信我們”
葡萄君:先聊聊你們最新的技術突破吧。
宋亞宸:我們在AI 3D領域有兩個重大進展。
第一個是3.1版本高模生成技術。無論是雕刻作品、圖片裏的文字,它都能完整展示出來;再複雜的管線、纏繞結構,還是物體內部的凹凸結構,都能還原。完全適配3D打印、工業設計、遊戲動畫影視製作等場景。
第二個重大進展,是Smart Mesh(Tripo P1.0)。行業裏都知道,高模要放進遊戲裏使用,必須做減面處理,而減面、拓撲結構規整化,一直是遊戲生產管線裏的核心痛點。
針對這個痛點,我們從零搭建了一版全新的AI 3D大模型。這個技術最核心的突破,是隻需2秒鐘左右就可以生成一個完整的模型,能做到極其規整的拓撲結構和佈線,且幾何形體與輸入的原圖幾乎一致,面數支持從500面到2萬面。
生成的模型可以直接接入遊戲管線,二次編輯也非常容易;同時貼圖還原度高,貼上去之後精細度不會受損,還非常便於做AI自動骨骼綁定和動作生成。
葡萄君:好奇這個技術的卡點能有多大?
宋亞宸:原本AI 3D模型的速度和精度很難兼顧,追求精度意味着更長生成時間,追求速度則容易犧牲結構與細節。拓撲結構、幾何精度、貼圖質量、引擎兼容、可編輯性——每解決一個問題,往往要以另一個問題爲代價。Smart Mesh(Tripo P1.0)用了全新的思維方式和算法框架,重新思考3D應該如何被表達、如何被生成。行業內獨一家且大幅領先。
葡萄君:真的假的?
宋亞宸:因爲在此之前,全世界的同行都在扎堆卷高精度高模生成這條賽道,我們也一直在這個方向深耕。而Smart Mesh這個技術方向,更像是我們在沙漠裏找綠洲時,意外撞見的一片全新天地。
說實話,高模生成能做到現在的水平,其實不令我驚訝;但Smart Mesh生成的這次突破,完全是超預期的。
葡萄君:那現在行業最火的世界模型呢?你們有相關的佈局嗎?
宋亞宸:我們的世界模型還沒發佈,所以不能說太多。我能講的是,它的早期會採用融合的多模態數據,包括3D的、視頻的,包括專門爲世界模型訓練設計的原生數據,我希望這是一個能給大家帶來驚喜的產品。
葡萄君:你會怎麼定義世界模型?
宋亞宸:我一直覺得,國內對世界模型的認知,和海外是有明顯偏差的。
早期3D生成主要是用大量2D圖片數據轉化爲3D內容,因爲現成的數據和人才都是2D方向的。但從長期主義和第一性原理來看,這件事本來就應該用3D數據來做。
那時我們就搭建了AI和圖形學交叉的人才團隊,走的是80%圖片數據加上20%的3D數據,最終帶來的效果就是生成速度更快、成功率更高。隨着技術演進,這個比例慢慢變成了20%的圖片加80%的3D數據。
發展到今天,我們的3D大模型幾乎完全基於3D模型數據訓練,和圖片已經沒有關係了。
行業目前對世界模型的看法,跟當初AI 3D大模型有些像。因爲視頻數據更易得,視頻人才更多,所以國內很多公司從視頻切入做世界模型。
但世界的本質是3D,絕對不是視頻,視頻只是一種壓縮格式。如果世界有個源文件,那麼文字、圖片、視頻,都是針對這個世界的壓縮格式。用這些壓縮格式去訓練世界模型,從第一性原理出發就是錯誤的。
這件事在海外正在逐漸形成共識,比如World Labs、Luma等海外最知名的世界模型公司,核心團隊基本都是3D相關出身,或者做娛樂內容出身,3D圖形學對他們來說是基座性的、底層的東西。在中國,我們是少數走這條路線的創業公司。
葡萄君:世界模型對AI界來說,會有點像當年開放世界對於遊戲界的意義嗎?
宋亞宸:做世界模型並不是在鼓吹概念,核心關注點應該在於怎麼採集和標註3D數據。
葡萄君:那具體來說,你們的業務路線是什麼樣的?
宋亞宸:第一塊,面向大客戶,我們通過API服務現有的遊戲行業,目前已經服務了9萬多家企業,全球很多遊戲公司都在使用Tripo。我們幫他們探索新的玩法,比如AI 3D原生的玩家驅動型Gameplay,還有UGC相關的定製化玩法,這是我們的基礎盤。
第二塊,是面向650萬Tripo Studio用戶,他們是PGC開發者。Tripo Studio提供了完整的AI工作流,從最開始的設計圖、三視圖生成,到幾何、貼圖、材質、PBR生成,再到動作、骨骼、蒙皮生成,還有模型拆分、補全、編輯、風格化、Magic Brush等全流程功能。
第三塊,就是面向PUGC和UGC用戶的交互內容平臺,這也是我們2026年最重要的事之一。早期平臺的主流用戶會是PUGC,也就是對3D空間有一定理解、有專業或業餘創作能力的用戶。後續我們會不斷降低門檻,逐步泛化到全量UGC用戶。
我們最終的目標,是實現完全的UGC,不管是創作者端的UGC,還是玩法端的UGC。我們希望用戶在上面創作的不只是遊戲,遊戲只是交互內容裏的重度品類,就像電影是視頻內容裏的重度品類一樣,未來一定會出現大量輕度的交互內容,都由UGC用戶來創作。
葡萄君:技術是你們的核心壁壘嗎?還是說對產品的理解本身?
宋亞宸:技術是我們的基礎壁壘,讓創作者願意留下來。但更重要的是用戶生態。
今年年會上,我們反覆講“種樹的人”的故事。有人在荒地裏種樹,路過的人都質疑“這種地方怎麼可能種出森林”。第一年他選錯了種子,只種活了幾棵歪歪扭扭的樹;五年後,卻已經長出了成片綠蔭;很多年過去,這片荒地最終變成了廣袤的森林。
對我們而言,每一位創作者,就是我們種下的樹。2023年我們說“未來每個人都能成爲創作者”時,根本沒人相信,那時我們只有1000個用戶。
後來我們發現產品方向走錯了,就像故事裏選錯了種子,於是立刻調整方向,提供完整的3D內容生產工作流,產品一下子就爆發了,用戶從不到100萬漲到了650萬——相當於我們已經種出了650萬棵樹,也終於有人開始相信這件事了。
現在我們要做的,就是繼續勤勤懇懇地耕種這片森林,最核心的事永遠是怎麼照顧好這些創作者,怎麼讓他們更好地成長、創作,沒有什麼事比這個更重要。
02
“讓每個人都能成爲遊戲製作人”
葡萄君:爲什麼創作者如此重要?
宋亞宸:以前大家用AI 3D工具,主要是爲了降本增效,但現在我們的技術打開了全新的空間,實現了之前受限於技術無法大規模鋪開的、以玩家驅動的Gameplay和UGC場景,所以創作者的數量會井噴。
葡萄君:這個技術是指最新的Smart Mesh?
宋亞宸:是的。它有三個核心優勢:第一,生成的是高精度模型只需要很少的面數,不會用200萬面的模型把服務器弄掛;第二,生成速度極快,原來生成一個模型要幾分鐘甚至更長,現在2秒鐘就能完成,真正做到言出法隨;第三,能直接做自動骨骼綁定和動作生成,支持實時交互,完全適配玩家驅動的玩法。
比如我們和網易合作的《燕雲十六聲》,玩家走到河邊過不去,就可以直接生成一座橋,這就是典型的玩家驅動的 Gameplay。再比如說還有UGC場景,比如做關卡、皮膚、道具,我們和《蛋仔派對》有合作,用戶也可以在《Roblox》裏使用我們的工具。
我們最近還辦了一場Game Jam,創作者都踊躍報名,獲得了全球同類賽事最多的投稿。
葡萄君:你感覺怎麼樣?
宋亞宸:效果非常好,我們馬上要帶着這些得獎的、參賽的作品帶到GDC現場,分享給更多人。這些作品的完成度都挺高,一方面是AI 3D讓搭建場景、角色、道具變得更簡單了,哪怕只是一個策劃,也能獨立完成遊戲製作;另一方面,出現了很多以AI 3D爲核心的全新玩法,這是更重要的事。
像我們的第一名叫《Mechanical Odyssey》,玩家既可語音指揮機器小貓,也能隨時意識潛入任何機器人,無縫切換不同職能破解謎題。
我們後續會密集地做這類活動,公司內部還做了Hackathon(黑客馬拉松),馬上還要辦一場外部的Hackathon。這裏面誕生了諸如3D你畫我猜、開放世界探索、小家生成擺放、用語言做模型、每日插花 APP等等各種創意作品,我們特別激動,因爲這件事能讓大家真正玩起來。
葡萄君:感覺量變確實要帶來質變了。
宋亞宸:最早期我們想把大語言模型用到遊戲裏,大家都覺得不好用,怕角色OOC、出戏、人設崩塌,有很多不可控的地方;但現在哪個開放世界遊戲裏還沒加點AI對話?
而3D生成能帶來的玩法要多得多,你可以改變地形、改變外觀、改變遊戲裏的幾乎所有東西。有了好的策劃創意之後,做遊戲核心就是兩件事,造萬物和定規則。
造萬物就是美術資產的生產,對應的就是3D生成;定規則就是代碼生成,對應的就是Cursor這類工具。當Tripo和Cursor結合在一起,本質上就可以一鍵式生成世界和遊戲,這可能就是當年很多元宇宙編輯器的最終答案。
葡萄君:你判斷還需要多久,我們才能做出這樣的終極答案?
宋亞宸:現在我們的技術,在UGC場景已經獲得大量用戶認可買單,PGC場景裏做手遊、中小型遊戲逐漸可用,對普通遊戲開發也有很大幫助,只是離3A製作還有距離。我判斷今年技術的生成效果,就有機會超過普通人的製作水平。
現在我們的3D生成效果已經逼近專業建模師水平,未來遊戲行業會出現大量一人公司。哪怕只是個策劃,只要會用AI編碼工具,搭配Tripo就能做出遊戲Demo,憑Demo去融資、找發行、組建團隊。
我甚至認爲,未來有些交互體驗會告別動輒幾十小時的長流程,轉向2-5分鐘的短內容,把《刺客信條》信仰之躍、《古墓麗影》攀爬這類高光體驗集中呈現。
現在很多玩家沒精力啃長流程、研究複雜數值體系,未來遊戲形態或許會更碎片化,低門檻、短時長、強爽感,就像短視頻一樣全程都是極致體驗。我們把這種形態叫交互內容,它不一定叫遊戲,甚至可以沒有數值體系。
葡萄君:聽起來像你之前說的3D抖音。
宋亞宸:對,就是可交互的抖音。大量3到5分鐘的交互內容,有了Tripo加Cursor,製作門檻會變得極低,哪怕是我和你這種不會做遊戲的人,終於有機會做出這樣的可交互、可消費的內容。
葡萄君:你們是準備做一個平臺型產品?
宋亞宸:我們這款產品大概率今年上半年就會上線,核心是讓每個人都能成爲遊戲製作人。傳統遊戲管線是數百上千人爲一個人的創意服務,而我們要實現的,是讓每個人都能爲自己的創意服務,這必然會帶來創意的全面井噴。
現在行業裏,騰訊、網易員工每年的立項創意可能有成千上萬,但最終能立項的很少,絕大多數創意都因商業化要求、製作成本過高等原因被埋沒;商業遊戲要兼顧留存、付費,也讓很多創意根本無法落地。
但在我們的平臺,所有創意都能被容納,內容時長從兩三分鐘到30分鐘都不受限,製作成本極低、門檻近乎爲零。用戶可以像發抖音、小紅書一樣,輕鬆創作自己的交互內容,實現創意、分享自我,哪怕只是自己體驗也能獲得十足的樂趣。
葡萄君:但做平臺談何容易。
宋亞宸:我們會先通過PGC內容打樣,這些PGC創作者就像平臺的KOL,向用戶展示平臺的內容上限與創作可能性,但平臺的核心內容,始終來自普通用戶的創作。
做平臺最關鍵的,是要足夠開放、不受限。就像TikTok出現前,小咖秀只做對口型單一種類的內容模板,最終只能做成垂類社區,永遠做不過全品類的TikTok、快手,核心就是把路走窄了。
我相信依託AI 3D技術,未來平臺上一定會出現爆火的內容模板,但我們絕不會只做某一款產品的創意工坊,那完全失去了平臺的意義。
葡萄君:這個平臺的目標用戶是誰?你們現有的650萬用戶?
宋亞宸:我們這650萬用戶,更像650萬個KOL,他們大多是有一定專業能力的創作者。
03
“未來全球遊戲市場至少會翻10倍”
葡萄君:前兩天同事還在感嘆AI領域日新月異,遊戲已經是舊世界了,AI纔是新世界。
宋亞宸:遊戲行業真的會發生很大的變化,就像現在好萊塢電影行業正在發生的變化一樣。但更核心的區別是,電影行業已經衍生出了短視頻、短劇這類UGC內容形態,但3D可交互內容的UGC形態還沒有出現。
如果可交互內容也能出現對應的UGC生態,這個市場會非常大,甚至有機會誕生下一代的抖音級產品,這是一個巨大的機會。
葡萄君:這一步如果踏出,未來到底會是什麼樣子?
宋亞宸:我現在都不敢預測了,以前還比較有確定性,現在真的很難說。可能在2026年底之前,大家做3D內容,就像現在用AI生圖片一樣簡單,而且會變成理所當然的事,這纔是最可怕的地方。
葡萄君:普通人可能會比較艱難了。
宋亞宸:我反而覺得,這項技術釋放了很多人的創意,把大家從螺絲釘的工作裏解放出來了。說實話,很多建模師都是知名美院畢業,結果天天在做擰螺絲一樣的重複建模工作。
你覺得給人建模有價值,還是把自己的想法和創意完整展現出來有價值?
目前的遊戲團隊可能是幾百人實現一個人的創意,未來可能變成每個創作者都實現自己的創意。工具的本質就是放大人的能力,原本一個人的價值是10,有了AI就能變成100,你既可以在企業裏創造更大價值,也可以獨立創業,核心只在於誰能率先擁抱AI。文生圖、視頻生成的發展早已印證了這一點。
葡萄君:關於AI領域的新技術,你現在最關注什麼?
宋亞宸:我最關注的就是AI 3D大模型、代碼生成、視頻生成和世界模型,因爲我覺得這些東西是最本質的。如果能直接生成完整的世界,那就是顛覆性的突破,根本不用再考慮這麼多複雜的環節了。
我們會把它叫做“可交互的世界級體驗”、“有世界沉浸感的交互內容”,但拆解開來,核心就是兩件事:可交互,以及世界級的內容和體驗,我覺得這一定是未來的方向。
葡萄君:這個方向是不是還沒有那麼快?
宋亞宸:世界模型的落地可能沒那麼快。我認爲世界模型的落地仍有諸多問題待解,算法層面的一致性、記憶問題,工程層面的多人在線實現,產品層面的可控性與可編輯性保障,以及商業化層面的本地部署難題——若無法實現本地部署,實時傳輸帶來的推理與流量成本難以分攤,最終很可能重蹈雲遊戲的覆轍。
不過目前市場對世界模型的關注度極高,大量學術界人才、數據與資本持續湧入,海量從業者都在攻堅相關難題,很多問題或許能很快迎刃而解。
葡萄君:那你希望Tripo在其中扮演什麼角色?
宋亞宸:從2023年年初開始,我們就一直在說要做UGC交互內容平臺,要做3D的接口,我們的產品和創作者生態也是圍繞這個目標打造的。
我們會走基模+平臺、基模+應用的邏輯。我們本身的研發能力非常強,我們希望擁有從上到下完全自研的基模,在AI 3D這個領域,我們已經沉澱了大量的數據、技術理解、算法人才,積累了大量的工作,未來做世界模型,相信我們也有領先性。
葡萄君:在你看來,未來AI會給遊戲行業帶來多大的變化?
宋亞宸:現在全球遊戲市場規模爲2600億美金,我認爲它會迎來爆發式增長,至少翻10倍。因爲創作成本大幅下降、玩法更豐富、產品形態更多元,行業必然會像短視頻對視頻行業那樣,迎來全面蓬勃發展。哪怕宏觀經濟下行也不影響,科技變量本身就是行業最大的增長動力。
葡萄君:你會不會太樂觀了?
宋亞宸:文生圖剛出現時質疑聲不斷,但最終率先擁抱它的人抓住了機會,美術外包行業也完成了一輪洗牌,活下來的都是把文生圖用得最好的團隊;視頻生成也是如此,率先入局的影視、短劇公司快速搶佔了市場。
你別看有那麼多遊戲客戶用我們的技術和產品,但說實話AI 3D早期並不被大家認可。現在技術已經完全成熟,只是很多人的認知還停留在過去。技術不會因爲人的忽視就停止發展,它的普及是必然的,誰先擁抱,誰就能佔得先機。
現在行業裏很多人對AI的擁抱,還只停留在表面,把它當成了政治任務。比如老闆定下AI使用率、降本的OKR,大家只是應付完成,根本沒到“不用就會被淘汰”的地步,而這一天很快就會到來。
葡萄君:你把“爲世界進文明,爲人類造幸福”當作是VAST的Slogan。你們所做的這一切,真的能讓人類更幸福嗎?
宋亞宸:我一直覺得遊戲是個非常了不起的東西。喫飯、按摩、聽歌這些能帶來快樂的事,都要消耗實體資源或人力,但遊戲不一樣,它僅憑一個創意,就能給人帶來極致的體驗與情緒價值。
如果想讓人人都獲得幸福、擁有專屬的極致體驗,就需要無數千人千面的內容——每個人在不同時刻的需求都不一樣,就像抖音給你我推薦的內容序列截然不同,這背後需要無限的體驗供給。
過去,這些供給只能靠專業遊戲製作人;但未來,每個人都能成爲遊戲製作人,用無數的創作提供無限的體驗。這就是我想追求的事,我覺得這就是天堂,而遊戲就是在打造這樣的天堂。
這件事是真正的長坡厚雪。一旦把這件事做成,泛遊戲行業會成爲人類未來最大的產業,規模甚至會超過農業、工業、服務業,乃至機器人產業的總和。