階躍星辰開源 4B 模型,本地輕鬆部署,理解模糊指令,玩轉安卓應用

來源: 更新:

上海大模型公司階躍星辰近日開源的 GELab-Zero ,首次將GUI Agent模型與完整配套基建同步開放,支持手搓黨一鍵部署。其中4B GUI Agent 模型在手機端、電腦端等多個 GUI 榜單上全面刷新同尺寸模型性能紀錄,取得SOTA 成績。此外,階躍星辰還開源了基於真實業務場景的自建評測標準 AndroidDaily,以期推動GUI領域模型評測向消費級、規模化應用發展。目前,企業級用戶和開發者已經可以通過GitHub和HuggingFace平臺體驗 GELab-Zero。

GUI(Graphical User Interface)意爲圖形用戶界面。階躍星辰在ScreenSpot、OSWorld、MMBench、Android World多個開源基準測試上對GELab-Zero-4B-preview 模型進行了全面評估,涵蓋了GUI理解、定位、交互等多個維度。測試結果顯示,GELab-Zero-4B-preview在多項權威開源基準測試中超越其他主流模型,拿下同尺寸SOTA。同時,GELab-Zero-4B-preview 的表現還超越了參數量更大的 GUI-Owl-32B 等模型,性能更優也更易部署。

受訪者供圖

根據階躍星辰官方介紹,GELab-Zero提供一鍵拉起即可獲得類似開源GUI Agent MCP的體驗,在本地即可完成部署,並將推理鏈路完全掌控在自己手裏。就具體能力而言,GELab-Zero可支持4B量級模型在消費級硬件上運行,兼顧低延遲與隱私;與此同時,它還支持一鍵式多終端部署,能自動處理環境依賴和設備管理;可以分發到多臺手機並記錄交互軌跡,實現可觀測、可復現;並支持多模態智能體範式:涵蓋 ReAct 閉環、多智能體協作以及定時任務等多種工作模式。

在官方公佈的應用場景示例中,GELab-Zero可以很好地執行復雜任務和模糊指令,譬如能夠精準地完成一次跨品類、涉及不同商品規格和數量的採購,也可以在接到“經典電影”“適合遛娃的地方”這類模糊和有主觀色彩的需求時,自行判斷執行標準並順利完成任務。

據瞭解,階躍星辰研發 GELab-Zero 的初衷,是解決 GUI Agent 面臨的諸多工程側難題——由於移動端應用生態極其碎片化,GUI Agent在不同品牌、型號設備上運行時場景會在多設備 ADB 連接、依賴安裝、權限配置、推理服務上線、任務編排與回放等方面出現工程問題,這意味着 Agent 開發者與 MCP 用戶需要處理諸多工程基建工作,難以將精力集中於策略創新。

此前,階躍星辰曾在2025世界人工智能大會期間公開展示了“一鍵執行助手”AI手機解決方案。接入該方案後,手機Agent助手可以基於用戶指令自主執行包括追星打卡、點外賣、預約掛號、地圖導航、繳納社保、預訂機票酒店、寫朋友圈文案等各種任務,讓手機Agent助手的能力從“能對話”延展到“會幹活”,進一步成爲人類智慧伴生體。

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top