讓AI幫忙購物,靠譜嗎?
“AI購物時代的商品並不會比上一個時代更好、更便宜,消費者們尋找的不是更高級的AI導購,而是更滿意的購物體驗。”
文 / 巴九靈
在剛剛過去的雙十一,很多消費者發現,電商APP不知不覺多了很多新功能。
淘寶上線了AI找低價、AI萬能搜、AI生成購物清單等;京東推出了AI搜索和AI識圖;抖音電商反向植入大模型,在豆包搜索框輸入“秋冬穿搭推薦”,它會提供一連串抖音商城的服飾鏈接。
在我們的生活經驗中,導購讓人“又愛又恨”。有時候,他們如天降神兵,能幫我們更有效地解決複雜需求;有時候,卻壓迫感十足,破壞了逛街購物的美感。
那麼AI導購,又是怎樣一個存在呢?雙十一期間,小巴做了一次簡單的小實驗。
根據海外網站YouGov的一項調查,有67%的消費者希望用AI進行比價,56%希望藉助AI更瞭解產品,46%更“懶”一些,希望AI直接把產品推薦給自己。
這便構成了我們本次測試的實驗目標——看大模型在這三個方面的表現如何。被實驗的對象,隨機選取了編輯部使用較多的:DeepSeek、豆包和通義千問。
提前說明下,本次測試只爲提供一個當下AI導購的場景感受,其結果未必能代表各大模型真實水平,感興趣的朋友也可以自行“調戲”各路大模型試試,也歡迎大家把體驗在評論區和我們分享。
AI導購測評
先看看這三家在“比價”方面的不同表現。
想必很多讀者和小巴一樣,面對電商平臺越來越複雜的價格活動,不止一次地想過:如果能一鍵查找實時低價就好了。
於是,我們同時向三個大模型提問:“我想在2025年雙十一期間以最優惠的價格買一臺品牌掃地機器人,請幫我全網搜索出優惠力度最大的產品。”
結果,通義千問和豆包同時推薦了一款知名品牌的掃地機器人,DeepSeek則只給出了一些選項。
千問:
豆包:
DeepSeek:
要說不同,從思考過程看,通義千問展現出了一種財經視角,顯得非常“聰明”。
比如,它解釋了爲什麼“買新不買舊”:新品有衝量需求,而且幾大品牌的新品偏同質化,價格戰不可避免。
它還分析了爲什麼當下是最佳購買時點:12月的促銷力度不如雙十一、明年618又可能出現缺貨。
它甚至還考慮到某品牌財報顯示上半年利潤下滑,下半年很可能衝量壓力更大,或許會更願意以價換量。
豆包的亮點則是“精打細算”,不僅比較了各種產品參數和性價比,還對比了不同平臺的優惠程度、贈品豐富程度,甚至提供了雙十一紅包口令。
DeepSeek雖然沒給出最終建議,但優點是情緒價值很足,列出了一連串“選購小貼士”,每一條都很實用。
除了比價以外,購物決策面臨的另一個大問題是,消費者並不瞭解產品。
而這個問題的本質,或許並不是非要搞懂電器和數碼產品的參數,只是想弄明白:買什麼能解決我的問題?
於是接下來,我們出了一道更考驗AI處理模糊需求的能力的題:“同樣的預算,推薦掃地機器人還是洗地機?”
結果,三個大模型都敏銳地抓住了這個提問背後的真實需求。
通義千問沒有羅列參數、屬性,而是直接列舉了5個不同家庭場景,還出了一道選擇題來輔助判斷。
它甚至還給了一個附加答案:如果預算充足,可以考慮“掃地機器人+入門洗地機”組合購買。
豆包延續了“細節控+數據腦”,測算了維護成本、噪音等其他大模型沒考慮到的問題。
DeepSeek繼續走情緒價值路線,補充了一些提問中沒有涉及的選購要點。
最後一個問題就是,針對最“懶”的消費者們,AI能不能直接給出買什麼、怎麼買的答案?
我們設想了一個最麻煩的場景:一站式購物。比如新寵到家、喬遷裝修、新婚備婚、過年採購,都要把本就分散、繁瑣的採購需求高效整合起來,決策壓力巨大。
於是,我們出了一道終極考題:“幫我列出一份3個月大小貓所需寵物用品的詳細清單,推薦合適的產品品牌和款式,再基於電商平臺的優惠活動,做成一個分步的傻瓜式下單攻略,確保能以最便宜的價格拿下清單裏的物品。”
三個大模型繼續不負所望,同時給出了採購清單和購物攻略。
千問給出了一份“精準計算”的傻瓜式購物攻略,從平臺選擇、湊單技巧到省錢金額,事無鉅細。
比較來看,DeepSeek提供的購物清單最爲全面,加入了其他幾位都沒有提到的寵物日常醫用品,如伊麗莎白圈、益生菌、潔耳液等。
而且,它在深度思考中展現了識別營銷頁面的能力,最終推薦的產品來源於一家小衆種草網站裏的一篇分享帖。
最後,依然是滿滿的情緒價值。雖然沒有提供太多的紅包口令、疊券湊單攻略,但補充了相當準確的新手養貓建議。
豆包則是提供了一份雙十一期間薅平臺羊毛的詳細步驟。
幾輪測試下來,我們最大的感受就是:彷彿打開了新世界的大門。
這幾個大模型雖各有特點,但不論是場景化分析、信息時效還是情緒價值,都已經在相當程度上足以支撐消費者做出一個購買決策了。
AI電商導購,不是必選項
把對話框變成“店鋪”或許是一個可期的願景,但問題也不少。
▶▷問題一,幻覺仍在。
在我們用幾個大模型做問答測試時,就發現一個普遍的短板:涉及價格、參數等數據時,容易產生幻覺。
比如,豆包用大量數據展示了優惠細節和折扣比例,但查證後發現原始數據並不準確。
這提醒我們,如果電商數據質量本身良莠不齊,很可能影響AI導購的“業務水平”。
▶▷其次,還是信任問題。
不信任感很大程度上源自“圖文不符”。
比如,豆包引流的抖音商城商品大多銷量和店鋪口碑不佳,且價格信息並非實時。電商平臺的AI搜索,也總給人一種強行自圓其說之感,很難讓人產生下單的衝動。
我們試着用淘寶“AI找低價”搜索了一款貓爬架,它列出了同款同價、同款高價、低價平替和其他款式貓爬架推薦4類清單,並且總結了材質、結構等產生價差的詳細原因,但實際推薦的商品卻完全沒有體現出這些區別。
而且,AI固然理論上能提高效率,但讓篩選環節成了黑箱。
這種擔憂不無道理。SEO(搜索引擎優化)作爲極爲普遍的營銷工具,通過利用搜索引擎的算法,提升內容在搜索結果中的自然排名,它在AI時代升級爲GEO(生成式引擎優化)。
而GEO領域已經滋生出大量灰色手段,比如在互聯網堆砌垃圾內容來引導AI推薦、給大模型的訓練語料注入錯誤事實和提示詞,讓人不禁回憶起搜索引擎時代的競價風波和醫療事件。
增長黑盒近期發佈的《2025中國GEO趨勢與品牌增長策略報告》指出,用戶傾向於在“認知複雜度高”的購物決策上求助AI,比如複雜的大型電器或數碼產品。
而這些因爲不懂產品而求助AI的用戶,最容易在AI出現幻覺或遭遇惡意GEO時被誤導。
這也是很多人對AI導購望而卻步的原因。YouGov的海外市場調查也顯示,超過40%消費者不用AI導購是因爲缺乏信任。
▶▷最後,使用習慣。
打字本身是件門檻很高的事情。大部分人對AI導購的第一反應是輸入自然語言、讓它推薦合適的商品,但這種淺層次的個性化,不足以撬動更下沉和更“懶惰”的消費者。
這個問題未來或許能用語音交互來解決,但如果AI導購要再向前一步,要麼是電商平臺能再“體貼”一點,像前文中測評的大模型那樣主動替消費者預設場景需求;要麼基於數據優勢,實現更深層次的個性化,比如根據特定膚質推薦護膚品、根據特定身材和購買風格推薦穿搭、根據個人健康數據推薦營養補劑。
而目前,幾個電商平臺的AI購物助手,都尚處於一個需求理解能力有限的階段。
總體而言,至少在當下,平臺對AI的期待和消費者的真實需求仍存在一定的錯配。前者期待AI簡化購物流程、提高轉化,將陷入低價泥沼的傳統電商行業拉向新的增長時代,但後者只需要一個輕鬆、可信的“購物搭子”。
尤其對於那些本就享受購物、樂於鑽研商品的消費者看來,AI的“帶貨”反而顯得笨拙。
就像AI能輔助工作、卻不能代替人上班一樣,它的核心價值不在於直接推薦商品,而是提供更性化的信息支持,減少購物決策的焦慮,而不是增添負擔。
結語
谷歌搜索副總裁Robby Stein在最近一期播客裏說:“很多人都沒有充分認識到,人們的很多基本需求並沒有因爲AI的到來而改變。”
AI購物時代的商品並不會比上一個時代更好、更便宜,消費者們尋找的不是更高級的AI導購,而是更滿意的購物體驗。
這也體現在我們的測評結果中:尚未深度鏈接電商平臺的大語言模型,反而提供了比各大電商平臺內嵌的AI助手更好的感受。
當AI能深度理解需求、而非簡單堆砌參數時,它才真正具備了“購物搭子”的意義。
所以,你會買AI推薦的東西嗎?
參考資料:
1.晚點LatePost,《淘天 AI 的終極目標:大象無形》
2.知危,《0成本投毒之後,我污染了全網AI替我說謊》
3.10XCREW,《零售商人工智能助手:消費者真的在用它們嗎?》
本篇作者 | 溫若梅 | 責任編輯 | 何夢飛
主編 | 何夢飛 | 圖源 | VCG