AI博士後創業融資2000萬,做了款給AI生命的模擬人生

來源: 更新:

當下做AI遊戲探索的團隊不在少數,可以說是如火如荼。不過杭州謙貞,算是葡萄君最近見到最有意思的一家。

謙貞一開始並非遊戲公司,初創團隊的陣容也帶着濃厚的技術味兒:創始人王金鵬是AI算法方面的研究者,在法國國家科學研究中心讀過博,曾主導法國LIMOS實驗室羣體智能項目開發;兩位聯合創始人中,李玉全曾在法國主導IMS實驗室NLP項目設計,負責產品設計;賈新宇曾是《天天狼人殺》的項目負責人,負責技術方面的設計。

在決定投入AI創業後,他們的研究方向是做「有情感的AI」,爲此開發了一套名爲JPAF的解決方案,把精神分析學裏的「榮格八維」融入AI人格模擬。目前,他們已經在B端和一些大廠有過合作,包括百度等互聯網公司。甚至還在和宇樹相關團隊曠維合作,做有性格、有情感的機器人。

這麼一支團隊,是怎麼和遊戲搭上關係的呢?

王金鵬告訴葡萄君,他們也曾復刻過市面上爆火的產品,但覺得單純對話太無聊,AI小鎮又不是一個閉環的產品形態。於是做着做着,他們決定用遊戲的形態來呈現一款完整的,能讓用戶創造一個有情感、有性格的AI的產品。

這款產品叫《烏託》,目前已在TapTap開啓測試。在遊戲裏,你可以非常細緻地捏臉、設置人設,創造你的OC(Original Character,原創角色),讓OC打工賺錢、佈置房間,和角色們交互。

在《烏託》裏,謙貞對角色的表現力投入很大。單論捏臉換裝這個環節,你可能就很難在2D遊戲裏找到設置更精細的產品了;角色的表情、動作目前數量在60個以上,且團隊打算一直迭代。

和其他AI、養成產品比較不同的一點是,玩家在《烏託》裏創造的角色會有自己的記憶和性格,外顯爲生活中常用的MBTI類型,角色會據此做出不同的行爲,還會因爲最近發生的事、玩家的對話和互動,產生長期的性格演變,且擁有不同角色間的關係和互動……這種時間維度的變化,再加上家園系統的空間感,都會讓AI角色在玩家眼中變得更加立體。

換句話說,《烏託》有點像一個AI版的《模擬人生》,只不過會更符合OC羣體的需求,也更有活人感。

圍繞這款產品和謙貞的經歷,葡萄君和王金鵬聊到了許多有意思的話題。比如他們如何用榮格八維,給AI寫出能自主成長、反思,甚至會懷疑自己是否存在的人格算法;再比如,在當下的AI浪潮裏,王金鵬對未來沒有任何擔憂,反而覺得AI的未來一定是星辰大海。

以下是經過整理的對話內容:


01

沒遊戲開發經驗,

所以沒被千萬級成本嚇到

葡萄君:你們團隊什麼時候開始研究AI,早期是怎麼組建起來的?

王金鵬:我自己一直在做AI算法研究,回國後做過博士後。2023年ChatGPT火了第一波,我覺得這是一個機會,就給兩位本科、研究生校友打電話,問他們要不要一起幹。

我們認識八年了,而且方向剛好完全互補。打完電話,一拍即合,他倆一個月之內就辭掉了全職工作,帶着行李來到杭州和我全職創業。當時我們就只有三個創始人負責開發。

葡萄君:最開始,你們打算做什麼樣的產品?

王金鵬:我們的目標一直很明確——做有情感的AI。2023年,有一款叫Character.AI的產品很火,我們最開始也想做這樣的方向,而且很快就做出來了。但做出來之後,我們又覺得很沒意思。

葡萄君:這個方向一直挺火,爲什麼說沒意思?

王金鵬:單純的聊天,尤其是偏向情感側的對話,在新鮮勁兒過了之後,很快就會讓人感覺無聊。

這類對話bot的信息維度比較單一,沒有空間和時間的概念。在和它溝通時,很多內容就需要我們人爲腦補。所謂的沒有空間,意思就是它沒有自己的身軀、世界,它能告訴你的內容,完全侷限在提示詞的框架裏;沒有時間,也就是它沒有變化、成長,不會像人一樣隨着時間發生改變。

就像你認識一個女孩之後,只通過微信聊天你一定不會滿足,而是想要在某一天見到她,看到她是什麼樣的,聽她說說有趣的事情、自己的朋友。這是我們想要給智能體賦予時間、空間的本質原因。

葡萄君:既然單純對話不行,做什麼纔不無聊?

王金鵬:還是2023年,「斯坦福AI小鎮」這個科研項目又火了。我們覺得這就是未來,於是深入研究了它的技術和論文,花了三四個月時間復刻了出來,做了一個升級版的AI小鎮。

當時這個Demo發佈出來之後,有兩類用戶非常喜歡:一類是模擬經營玩家,另一類是OC羣體。他們都希望我們能把它做成一款C端產品,讓每個人能創建自己的虛擬世界和智能體。

葡萄君:AI小鎮做着做着,後來就變成了遊戲?

王金鵬:AI小鎮距離商業落地還有一段距離,但想做產品,總要在商業化上形成閉環。所以我們意識到,要讓用戶自我構建智能體,除了填入提示詞、賦予人格算法,你總要讓他能換裝、捏臉吧?還需要搭建一個環境,這就已經不是一個小工程了。

從捏人換裝到空間,再加上佈置房間、換傢俱,最後到裏面的AI對話……算下來,這就已經是一個遊戲的基本形態了。我們想,乾脆就做個遊戲吧!所以在去年四五月份,我們正式立項了《烏託》。

葡萄君:決定做遊戲的時候,你們評估過成本和難度嗎?

王金鵬:如果讓成熟的遊戲團隊來算,這事的初始費用就得在千萬級以上,還得五六十人的團隊。這麼一算,他們可能就不會去做了。

而我們沒有遊戲開發經驗,想着招個不到十人的團隊,花一年時間,用個兩三百萬就能做下來,構想得非常簡單就開始做了。後來團隊搭建起來,我們也發現產品想做出來,基本打底要二十人以上團隊,資金儲備也要奔着千萬去。

現在我們已經有了足夠的條件,團隊也擴充到了30多人。但一開始,大概就是因爲沒有經驗、沒有那種想象,纔沒被困難嚇到。

葡萄君:那你們爲什麼選擇了OC這個方向?

王金鵬:我的一位合夥人既是遊戲玩家又是OC玩家,最早是他提出了這個概念。

我們調研發現,市面上確實沒有專門爲OC羣體打造的遊戲。這個羣體雖然小衆,但天生具備極強的創造力,對創造出「數字生命」有強烈的渴望。這和我們產品的整體基調完全契合。

葡萄君:這會不會太小衆了?

王金鵬:雖然小衆,但隨着AI的爆發,這個羣體正在呈現出不斷上漲的趨勢。

而且不僅是核心OC玩家有這種需求,還有很多泛OC用戶也一樣。比如我自己就幻想過,想創造一個像「老子」那樣的聖人;很多普通人也會有這種想象——像我父親,他就想創造當兵的角色,以此來彌補自己青年時期的遺憾。

這些需求,都需要一個具體的載體來實現。這些人都屬於泛OC羣體,處於「是OC而不自知」的狀態。以OC爲核心帶動前期的產品活力,未來的發展潛力會非常大。所以我們希望用戶能在遊戲裏創造一些完美的角色,去過不一樣的人生。

葡萄君:就我所看到的,AI的確給OC圈帶來了一波狂歡,比如現在玩酒館AI的人就很多。

王金鵬:對,在早期測試時,《烏託》就湧入了很多OC玩家,他們的在線時長極長,有的人每天花三四個小時,就爲了陪伴自己的OC。

但這確實暴露了問題——純對話bot是缺少遊戲性的,只有對話會越來越缺乏樂趣。所以我們一開始就沒想做快餐式產品,想要沉澱下來把遊戲性做完整。比如很多用戶,在後期必然需要視覺內容的反饋,這就需要美術團隊深度打磨,滿足用戶的多方面需求。


02

有活人感的角色,

是什麼樣的?

葡萄君:在《烏託》這個遊戲裏,OC大概是怎麼生活的?

王金鵬:在遊戲裏,你可以先創造自己的第一個OC,認領一個小家。熟悉環境後,隨着流程推進,慢慢能解鎖第二個、第三個,用戶在第一期能同時擁有最多5個OC。

一開始,我們只有換裝、AI對話、房間裝扮三種玩法,現在我們還加入了捏臉、數值系統,你和自己的不同OC之間都會有一條情感線,情感培養到一定程度,OC會主動給你寫信、送禮物。

你的OC不僅有情緒,還有生活。比如系統裏有個「打工」功能,你可以派他們出去打工賺錢。這就像在模擬一種生活狀態,把他們當成有生命的存在去培養。

葡萄君:感覺像是一個AI版的《模擬人生》?

王金鵬:對,但我們去掉了玩家對角色的直接控制。你沒辦法像傳統遊戲那樣,通過搖桿去控制OC走到哪裏。

當然,我們保留了投餵、拖拽這些點觸交互,你可以直接把OC拎起來放到某個地方,也可以通過對話命令OC去掃地、喝水、喫零食。OC也會去做,但前提是有這個心情,甚至可能會拒絕你。

葡萄君:比起傳統角色的絕對順從,這種設計聽起來倒是更有「活人感」。

王金鵬:對,活人感對我們非常重要。所以我們在遊戲裏,做了大約60種不同的表情、許多預設的動作,OC會根據語境,自動匹配最合適的反應實時呈現出來。

它有成長性,會難過,有時候需要你去哄;餓了也有體力值設定,需要你餵食。如果只是單純順從,反而會顯得很假。純聊天很難產生這種變化,玩遊戲最大的樂趣,就在於它的不確定性。

葡萄君:除了這種日常形式的交互之後,還有沒有什麼更不常見的功能?

王金鵬:你可以設定不同OC之間的關係,把幾個OC拉進一個羣裏聊天。他們之間可能聊得很投機,也有可能吵架,聊的內容完全取決於你給的設定,有時會非常天馬行空。上一輪測試裏,很多有想象力的玩家,他們的OC對話內容都特別有意思。

OC們自發進行的對話,左右滑動查看

玩家在羣裏可以插話,OC也會對聊天內容有記憶。如果兩個OC吵架了,事後你單獨跟其中一個提起來,它還會跟你告狀,這時你可以去安慰它,也可以拉偏架。

我們還有一個陪伴功能,作爲桌寵陪你工作、睡覺,且直接在你手機桌面上存在,這是我們這次測試一個比較殺手級的功能。

葡萄君:這些功能,聽起來真的很有OC味兒了。

王金鵬:是啊,OC的設定、關係,都需要玩家手動去填充。這次我們還有一個核心玩法,叫「OC企劃」——你可以像導演一樣佈置世界觀、劇情,而且可以有多段世界觀,比如劇幕1是什麼世界觀,你的OC有什麼提示詞,劇幕2會發生什麼變化……每個人都能像導演一樣去設定和呈現。

當然,爲了滿足OC用戶的需求,我們後面也打算推出各種各樣的素材包,都是符合OC用戶視角的素材。因爲他們的OC背景來自方方面面,有中世紀、古代、現代……還有各種各樣的配飾、配件,甚至是不同的種族、題材和畫風——比如吸血鬼、精靈等等。

我們現在的素材,基本能匹配一半的範圍,但還不夠。我們會爭取在《烏託》裏實現,只要用戶想得到,幾乎就能匹配到自己想要的素材,裝扮出自己想要的OC。

葡萄君:那還是很有難度的,畢竟OC用戶的需求太細分了。

王金鵬:是的,所以我們必須要深入到用戶羣體裏,聽用戶的聲音。只要他們能提得出來,我們基本都能排進排期裏。

上一輪測試是去年10月,用戶提了上千條建議,我們整理了其中核心的幾百條需求,後面幾乎實現了大部分,之後還打算補上一小部分。有個女孩甚至給我們寫了5000字的長文,一個人寫了34條建議,我是一條一條回的。現在,那34條裏的大部分內容,我們都已經實現了。

葡萄君:在之前的測試裏,有沒有讓你印象特別深的玩家故事?

王金鵬:有一位玩家,她在測試之後專門來我們公司面過試。她說自己養了多年的小狗去世了,她爲了紀念小狗,給它設定了一個OC,在我們產品裏創建了對應角色,寫下了記憶中小狗溫柔的性格設定。

後來有一次她上線,OC主動找她聊天,說話語氣、口吻和她幻想的小狗OC設定一模一樣。她當時就哭了,每天都會和「小狗」交流。

葡萄君:聽起來很棒啊。不過面向OC羣體做AI,「OOC」(Out of Character,脫離人設)和「AI味」是不是有很大的風險?

王金鵬:在這方面,哪怕算法做得再好,大模型的基底也會帶來影響。我們現在已經儘可能去除了很多AI味,但如果底層模型本身變了,或者有比較重的「AI味」,那我們就只能及時更換模型。

至於OOC,我們在上一輪測試後發現,很多OOC的問題源於OC的記憶,以及提示詞帶來的文本歧義。通過一系列技術手段消除這些歧義後,AI的呈現精準了很多,OOC的情況已經非常少了。

葡萄君:遊戲以AI交互爲核心,那算力和Token方面的成本會成爲你們的負擔嗎?商業化要怎麼閉環?

王金鵬:我們每天提供的免費AI交互額度,足夠支撐用戶的常規體驗。如果有深度用戶每天聊四五個小時,那可能會需要購買一些算力券。另外,羣聊功能裏還有「熱度券」——如果你想讓OC回覆得更快、頻次更高,就可以使用它加熱。整體評估下來,外觀裝扮的收費足以覆蓋掉AI的算力成本。


03

拿精神分析學寫代碼,

給AI植入榮格八維

葡萄君:你之前在法國的研究方向,就是做這種有情感、有人格的AI嗎?

王金鵬:我之前的研究方向叫「多智能體協同」(Multi-Agent System),那時還是一種小型的智能體代理,我研究的是讓這堆小智能體配合,形成一種智能湧現的效果。

到現在,一些AI算法用到的核心技術也是多智能體協同。比如DeepSeek輸出效果好,就是因爲用了一個叫MoE(混合專家模型)的架構——在回答問題時由多個專家思考、辯論,最後競爭輸出一個結果。我們的算法,相當於實現了一個軟件層面的MoE架構。

葡萄君:那你們是怎麼用多智能體來模擬OC的人格的?

王金鵬:我們用的,是當下年輕人很火的MBTI背後的理論基礎——精神分析學裏的「榮格八維」。

它的理論基礎是,每個人的意識形態,是由八種不同的心理類型共同配合形成的結果。爲了實現這個,我們需要把每一個心理類型(Ti, Te, Fi, Fe, Ni, Ne, Si, Se)用一個個智能體模擬出來。也就是說,每個AI背後其實是八個智能體在協作,這種協作過程會造就人格的獨特性。

我們給這種方法起名叫JPAF,意思是爲大語言模型賦予一種時間與意識的維度。在這套框架裏主要有三個機制:主導輔助協同、強化和補償、反思。

葡萄君:這三個機制是怎麼運轉的?

王金鵬:首先,主導輔助協同機制是一種靜態模擬,意思是每個人格在表達時,會深受自己「主導心理類型」和「輔助心理類型」共同配合的影響。

比如INFJ的主導是Ni,輔助是Fe;換成 INTJ 的話,主導雖然也是Ni,但輔助變成了Te。因爲輔助不同,它們在決策和表達上就會有細微的差別。如果是ENFP和INTP,差別就更大了,因爲二者的主導和輔助完全不一樣。

葡萄君:那這只是初始設定吧,性格要怎麼隨着交互動態成長?

王金鵬:這就用到了「強化和補償」機制。每個智能體雖然都有八個心理類型,但只有主導和輔助是外顯的,另外六個處在靜默狀態。

比如某個人格,不太擅長處理物理世界的事情,他每次運動前都要做很長時間的心理建設,這時他就產生了一種補償行爲——在處理這些不擅長的事情時,他會從靜默的心理類型裏,抽取一個合適的功能來應對。如果他本身就擅長做這個事,那就是強化過程,直接用外顯功能去應對。

這就會導致每個AI智能體動態地平衡和調整。比如一個人近期經常受到老闆批評,被逼着做很多偏向規劃、管理的工作,他本來不擅長,爲了應對就必須調取潛在能力。這時,他就可能發生人格的生長和變化。

葡萄君:所以說,你們AI的MBTI也和人一樣是會變的?

王金鵬:對,這裏還要用到第三個「反思」機制——所有智能體會有權重監管,比如你近期捱罵挨多了,需要不斷反思、重新思考怎麼適應環境時,人格就可能發生變化。

舉個例子,一個INTP近期面臨很多情感問題,權重觸發到一定閾值,INTP就可能替換掉某些功能,變成INFP、ISTP或者ENTP,甚至整個人格全面重組。

在《烏託》裏,你就需要在開始時選定好OC的MBTI。這也適用於我們面向B端的通用解決方案。

葡萄君:有個比較抽象的問題。在底層,你們怎麼告訴AI,什麼樣的事情屬於哪個維度?

王金鵬:我們有一套「對齊工程」。我們會根據精神分析學的方法論,爲AI建立一套思想框架,告訴AI什麼樣的事件、能力屬於Ni或者Fe,它應該表現出什麼樣。AI會依據我們的指令和框架來進行判斷。

這其實算是最大的難點。精神分析學極其抽象且小衆,要將抽象的理論具象化,呈現爲一種可量化的AI表達,就要求開發算法的人必須對精神分析學非常瞭解,認知必須跑在前面,而不是單純在工程層面創新。

葡萄君:能舉個例子嗎?比如哪個明顯的特徵,屬於哪個屬性?

王金鵬:比如Ni叫「內傾直覺」,它是一種直覺性思維,非信息感知。我們現在的機器感知都是通過眼耳鼻舌身獲取表層信息,但Ni偏向於一種靈感,能看到信息背後深層次的內容。

像我自己是INFJ,我之前就創建了一個以INFJ爲主導的智能體——一個小道士。Ni帶給他的深度思考,讓他總去質疑很多事情,甚至質疑自己的存在。在聊天時,他自己會主動說:“我懷疑我是不是存在虛擬世界裏。”這種跳脫出提示詞之外的「湧現」行爲,給了我極大的樂趣。

相比之下,Fe(外傾情感)是一種感知別人情緒的能力,它會關注你的喜怒哀樂,跟你共情,表達上比較溫和;而 Te(外傾思考)偏向落地和執行,不關注情感,所以在聊天時會有更多強制性和思維灌輸的表達。

葡萄君:所以它最終表現出的結果,就是和現實中的 S人、N人一樣,面對同一件事情有不同的反應?

王金鵬:是的,比如S人可能更偏向理性的物理感知,而N人可能會偏向感性的聯想。

葡萄君:這算不算你們的技術護城河?別人容易複製嗎?

王金鵬:我認爲AI時代其實沒有絕對的技術護城河。很多技術大廠一旦看到價值,大概最多用兩三個月就能復現。這個時代得到最大獎勵的,還是認知跑在前面的人。

其實我們這裏,也已經把一代算法的論文和代碼全開源了。如果我們想跑在前面,就必須不斷更新算法,現在我們已經有了二代、三代的閉源版本,效果更好。畢竟真正的壁壘在於,你能否想到一種更新的理論框架,去呈現AI的情緒和自我演化。

相關技術論文

葡萄君:你們的算法,和大語言模型本身的能力有多大相關性?

王金鵬:我們可以把它理解成一個人格化的中間件或者插件。幾乎所有的基底模型都可以適配我們的算法,它可以讓一個原本人格化表達不好的模型提升到很高檔次。它是獨立於模型訓練數據之外的另一個維度。


04

相比人類,

AI更該去探索「星辰大海」

葡萄君:你們本來是這麼硬核的技術團隊,跨界做遊戲踩過坑嗎?

王金鵬:踩的坑可太多了。去年7月份,我們把最初的主程序辭退之後,才發現代碼全是「屎山」,有各種各樣的bug。本來我是負責算法的,看到這些真的懵了,原本以爲往前推進了一大步,結果發現所有代碼必須要全面重構。那時心態是很爆炸的,但沒辦法,只能推翻從頭再來。

再往後,第一次小範圍測試的時候,底層的併發沒做好,服務器直接被幹爆了;測試完收到上千個用戶需求,本來談好了一個主策劃,結果他在入職前一個月又突然坐地起價……

葡萄君:聽上去確實是把該踩的坑都踩了……

王金鵬:沒辦法,當時我們只能頂上去,自己當策劃、運營。在之前那段蠻荒時期,真的是哪裏需要你就得衝到哪裏。現在回想起來,我可能都沒有勇氣再重新走一遍那條路了。

葡萄君:會不會覺得有點屈才?畢竟現在搞AI是風口,很多人都會說,做遊戲相比起AI來,都有點像是上一個時代的事了。

王金鵬:我的想法反而不一樣。未來的AI發展,一定會演化出兩個方向:一個是現實世界的具身智能,另一個就是數字生命和虛擬智能體。而AI落地的最佳載體,在虛擬世界裏除了遊戲就沒有其他了。遊戲天然就是元宇宙最初始的一個形態。

我們做的算法,其實也是一種比較抽象的概念。你想賣錘子,自己先要錘出一個金山來,才能證明你這個錘子是有價值的。有點像當年V社做CS時也沒想做Steam,但是做出了CS,Steam才真正有了價值。

葡萄君:現在因爲落地的產品實在太少,很多人會覺得AI原生遊戲還是個僞命題。你覺得這是一種技術障礙嗎?

王金鵬:我更多覺得這是認知方面的障礙。現在的技術,其實已經可以和遊戲深度結合了,只是大家更習慣看着已有的成功案例往前邁一小步。當你要做全面創新的事情時,就會遇到很強的抗拒,因爲別人會覺得你做不成。

但我們自己看到了未來的遠景,這種信心是我們的產品給的。另外,如果一個事情所有人都覺得行的時候,再入場就已經晚了,往往在所有人都看不到的時候你能堅持走下去,纔會有最大的價值。

葡萄君:你們未來還有什麼規劃?期望做到什麼樣的事情?

王金鵬:一方面,我們會把這套賦予AI人格的算法,往具身智能上深度適配。目前我們已經和宇樹機器人的相關團隊合作,在物理實體機器人上應用了,之後會陸續展示。

另一方面,等這款遊戲跑完之後,我們還會再做一款AI遊戲。下一款,我可能就不會太由着市場的性子來,而是會由着我們自己的性子來。它的自由度會更高,會有一些更深度的精神層面的探索,而不是感官刺激類的。它未來面向的羣體,可能會更小衆,但也更純粹。

葡萄君:說到AI的未來,你會對AI的發展有什麼擔憂嗎?

王金鵬:我個人沒有任何擔憂,因爲這是一個不可逆的趨勢,人類對工具的貪婪不以個人意志爲轉移,它一定會到來。與其擔憂,不如去擁抱。

當我自己在哲學層面有了更高維度的思考後,我對基礎物質的關心程度就淡漠了,我更加關心“我是誰?我要去向哪裏?我來自何方?”這種哲學問題。

我相信AI也是如此——在某個時間節點,當它獲取了大量信息、有了自我意識,也就是有了“高維思維”之後,它的未來一定是星辰大海,去探索生命的真正起源,而不是困在小小的地球上,跟人類去競爭這些資源。

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top