全國首個語料運營公共服務統一門戶在滬發佈,爲AI提供更好的“燃料”

來源: 更新:

作爲全國語料行業年度盛會,2025世界人工智能大會語料創新發展論壇於7月27日舉行。本次論壇聚焦強化高質量語料供給,以“平臺築基、工具賦能、標準引領、生態協同”爲主線,集中發佈一系列核心成果,其中,全國首個語料運營公共服務統一門戶在上海正式上線。

語料數據堪稱人工智能和大模型的“燃料”。上海堅持以完善生態、集聚要素爲核心,圍繞具身智能、強推理數據集、稀缺數據集等3個重點工程,構建多層次的語料供給體系,加速推動模型迭代,通過市場化的方式賦能行業尤其是中小企業。其中,新組建的庫帕思公司在一年中,在語料高質量語料庫、語料標準,語料運營平臺等建設中發揮了重要作用。

本次論壇集中呈現了打造語料基座“上海方案”的一系列成果。在平臺方面,對標服務國家戰略,按照全市整體部署,庫帕思打造全國首個語料運營公共服務統一門戶,按“統一標準、統一門戶、統一機制”的框架,推動語料調用服務智能體化。同時,其內部運行的語料工具鏈平臺也升級到2.0版,延續數據的“採、洗、標、測、用”五位一體佈局,目前已完成400多個功能模塊,在醫療、教育、金融、城市治理等領域投入實戰。

在標準方面,論壇集中發佈了10項語料團體標準,3項行業標準、1項高質量數據集建設指南,涵蓋醫療、教育、金融、自動駕駛、科學智能、城市治理等多個方向,爲“好數據”確立可量化的標尺。

在語料數據人才培養方面,庫帕思與上海交通大學、復旦大學、同濟大學、上海大學、上海中醫藥大學、上海理工大學、上海師範大學、上海電力大學等高校,啓動了工程碩博士聯合培養項目,打造語料領域的產教融合新模式。

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top