階躍星辰開源 4B 模型，本地輕鬆部署，理解模糊指令，玩轉安卓應用-文化-漫步新聞-陪你看看

上海大模型公司階躍星辰近日開源的 GELab-Zero ，首次將GUI Agent模型與完整配套基建同步開放，支持手搓黨一鍵部署。其中4B GUI Agent 模型在手機端、電腦端等多個 GUI 榜單上全面刷新同尺寸模型性能紀錄，取得SOTA 成績。此外，階躍星辰還開源了基於真實業務場景的自建評測標準 AndroidDaily，以期推動GUI領域模型評測向消費級、規模化應用發展。目前，企業級用戶和開發者已經可以通過GitHub和HuggingFace平臺體驗 GELab-Zero。

GUI（Graphical User Interface）意爲圖形用戶界面。階躍星辰在ScreenSpot、OSWorld、MMBench、Android World多個開源基準測試上對GELab-Zero-4B-preview 模型進行了全面評估，涵蓋了GUI理解、定位、交互等多個維度。測試結果顯示，GELab-Zero-4B-preview在多項權威開源基準測試中超越其他主流模型，拿下同尺寸SOTA。同時，GELab-Zero-4B-preview 的表現還超越了參數量更大的 GUI-Owl-32B 等模型，性能更優也更易部署。

受訪者供圖

根據階躍星辰官方介紹，GELab-Zero提供一鍵拉起即可獲得類似開源GUI Agent MCP的體驗，在本地即可完成部署，並將推理鏈路完全掌控在自己手裏。就具體能力而言，GELab-Zero可支持4B量級模型在消費級硬件上運行，兼顧低延遲與隱私；與此同時，它還支持一鍵式多終端部署，能自動處理環境依賴和設備管理；可以分發到多臺手機並記錄交互軌跡，實現可觀測、可復現；並支持多模態智能體範式：涵蓋 ReAct 閉環、多智能體協作以及定時任務等多種工作模式。

在官方公佈的應用場景示例中，GELab-Zero可以很好地執行復雜任務和模糊指令，譬如能夠精準地完成一次跨品類、涉及不同商品規格和數量的採購，也可以在接到“經典電影”“適合遛娃的地方”這類模糊和有主觀色彩的需求時，自行判斷執行標準並順利完成任務。

據瞭解，階躍星辰研發 GELab-Zero 的初衷，是解決 GUI Agent 面臨的諸多工程側難題——由於移動端應用生態極其碎片化，GUI Agent在不同品牌、型號設備上運行時場景會在多設備 ADB 連接、依賴安裝、權限配置、推理服務上線、任務編排與回放等方面出現工程問題，這意味着 Agent 開發者與 MCP 用戶需要處理諸多工程基建工作，難以將精力集中於策略創新。

此前，階躍星辰曾在2025世界人工智能大會期間公開展示了“一鍵執行助手”AI手機解決方案。接入該方案後，手機Agent助手可以基於用戶指令自主執行包括追星打卡、點外賣、預約掛號、地圖導航、繳納社保、預訂機票酒店、寫朋友圈文案等各種任務，讓手機Agent助手的能力從“能對話”延展到“會幹活”，進一步成爲人類智慧伴生體。