中國網絡空間安全協會發布中文互聯網基礎語料2.0
1月9日,在北京召開的中國網絡空間安全協會人工智能安全治理專業委員會工作年會上,中文互聯網基礎語料2.0正式向社會發布。
在中央網信辦指導下,中國網絡空間安全協會會同國家互聯網應急中心,在前期發佈中文互聯網基礎語料1.0的基礎上,持續發揮企業、高校和科研單位協同優勢,依託專委會建立的語料共建共享機制,匯聚一批新的高質量可信數據,經過信源篩選、內容過濾、數據去重等一系列嚴格細緻的數據加工處理措施,形成並對社會發布中文互聯網基礎語料2.0,規模120GB,數據3800萬條。用戶登錄中國網絡空間安全協會網站(
https://www.cybersac.cn/newhome),點擊“中文互聯網語料資源平臺”鏈接,通過註冊、認證等程序,即可下載相關語料。
網安協會人工智能安全治理專委會負責人表示,數據是發展人工智能的基礎關鍵資源,中文互聯網基礎語料2.0是各界協同共建高質量中文語料的又一重要成果。專委會將持續加強中文互聯網基礎語料建設,爲人工智能技術創新和產業發展提供有力支撐和保障。
來自專委會成員單位、大模型備案機構和相關領域科研、企業、社會組織代表150多人蔘加發布儀式。
來源:“網信中國”微信公衆號
相關推薦