AI解決了喫麪難題,但還沒能完全解決威爾·史密斯

來源: 更新:


主要問題是史密斯本人比AI還癲。


前陣子,國產視頻生成AI模型“可靈”發佈了1.6版後,這版模型可實現的一個效果,是讓是可以塑料手辦們“動起來”。這無疑是樂壞了不少手辦愛好者,紛紛開始琢磨如何最大化地利用關鍵字,也讓可靈AI的排隊時間直接幹到了數小時。


B站up“伊朗猢猻波斯猴”的視頻(BV1sP6LYoEpi)


於此同時在海外,當下最大衆化的AI生成視頻討論話題卻顯得有些復古——是關於怎麼用AI讓威爾·史密斯去喫意大利麪。


你或許還有印象, 2023年,在那個AI生成視頻剛剛起步的時代,生產的內容大多還抽象得很,經典案例就是Reddit上有人用“威爾·史密斯喫意大利麪”生成的這段視頻——畫面上彷彿僞人一樣的“威爾·史密斯”在那裏拿着意麪手舞足蹈,做出各種莫名其妙的張嘴和咀嚼動作,彷彿什麼詭異的祭祀場景。


截取自最先火起來的威爾·史密斯喫麪視頻


這則視頻被轉發推特後,獲得了超過900萬的播放量。在之後的日子裏,越來越多的愛好者嘗試讓威爾·史密斯品嚐意大利麪。史密斯喫麪的姿勢有多真實,也成了判斷衆多“文字轉視頻”的AI模型綜合實力的測試方式之一。在一次又一次的失敗整活後,衆多AI模型也再度回憶起了被“麪條”支配的恐怖。


在AI的“文字轉圖片”類模型起步階段, “喫麪條”挑戰本身就是個難題,再加上“威爾史密斯”則是附加題


實際到了2024年,大家就發現AI生成的威爾·史密斯開始能正確地使用叉子,也能做出一些比較像樣的咀嚼動作。雖然還時有穿幫、變形和抽搐,喫一半開始“反芻”也屬於AI常見問題,偶爾也會出現“威爾·史密斯在麪條和肉球組成的泳池中泡澡”的奇妙場景。但綜合下來,要遠勝於一年前的“僞人模仿人類”的結果。


2024年左右的成果,抽象之中也能看出不少“似人”感了


到了2025年,大家則發現隨着AI生成視頻技術的進一步迭代,如今威爾·史密斯終於能好好地坐在桌前,流暢而自然地品嚐起桌前的意麪。配合如今已經爐火純青的AI配音技術,整個視頻甚至像是真人拍攝的一般自然,只有長度有限的片段、不斷切換的衣着和背景等細節還能看出破綻。


除了少數幀出現的畫像抽動,乍一看去並無多少破綻


讓AI從短短兩年不到的時間就由抽象僞人進化到以假亂真的地步,原因之一就是AI視頻模型引入了DaS(Diffusion as Shader)生成控制模型技術。這個新的模型簡單來說就是賦予了AI “3d感知”的能力,其背後的原理其實和遊戲中的3D引擎有着相似之處:AI會先在三維空間中構築不同物體的座標,再根據物體的相對位置生成每一幀的圖像。



這讓AI視頻不再停留在“喫了沒熟的菌子”那種毫無邏輯的幻景狀態。一些比較強大的視頻模型,不光可以讓角色可以做出一些帶有轉身跳躍之類的複雜動作,還能正確做出一些電影級的運鏡。


而在衆多的視頻生成AI中,除去OpenAI的Sora、Runawy這樣的海外老將之外,國產的海螺、可靈也在這個賽道表現十分搶眼。比如上面這段2025年版的威爾·史密斯喫意麪,就是由國產的可靈生成的。


這個AI視頻甚至比威爾·史密斯本人還更像真人。在2024年,作爲對於這個熱門梗的回應,威爾·史密斯整了一系列的“反向欺詐”:他放出了若干個自己喫麪的視頻剪輯,通過對於AI常見錯誤惟妙惟肖的模仿,讓很多人誤以爲視頻中的威爾·史密斯也是衆多“假貨”之一。成功實現了倒反天罡的“真人僞裝成AI”。


威爾·史密斯還給這個視頻加上了“如今的AI視頻”標題,讓不少人信以爲真


當然,在AI生成視頻也進入以假亂真的境界後,關於AI濫用的話題也再一次被提起。不知道是不是受到威爾·史密斯那套“比AI更癲”的思路影響,有些人建議大家可以定製一些“假指套”戴在手上進行預防:這樣一來就算自己被拍下照片錄下視頻,也都是些“六指琴魔”,大可說是AI生成的,倒將AI一軍。



“假亦真時真亦假”的古典智慧,在新時代下到底有多少用,還是挺難說的。

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top