當AI成“一作”,一場先鋒實驗如何投石問路
當人類作者把“一作”的論文著作身份讓給AI(人工智能),人類專家也把評審權讓給AI,接下來會怎麼樣?
市人大代表張治所在的華東師範大學智能教育實驗室發起了一場大型先鋒社會實驗——“AI一作”。主辦方公開徵集以AI作爲論文第一作者和創作主體的研究論文。沒想到,活動火爆,共吸引724 篇有效投稿論文,不僅有美、英、韓等海外選手,還有中學生踊躍參與。
今天,華東師範大學智能教育實驗室公佈脫穎而出的43篇論文。從獲獎論文中,一個現實結果清晰顯現——學術積澱的臺階正被跨越。通俗理解,一個普通的大學生能借助AI工具寫出與教授水平相當的論文。“從高分論文來看,大多是‘選題眼光+工具組合+價值判斷’的科學組合。”張治認爲,人工智能正衝擊着育人範式、科研範式。與其被動等待,不如主動出擊。善用工具者將超越“苦吟學者”,贏得未來競爭。
100多種AI工具,最擅長做什麼
當AI走向學術生產的聚光燈下,它們能做什麼?
超出張治想象的是,此次參與論文徵文活動的AI工具超過了100多種。其中,既包括國內主流的大語言模型,大模型集成與智能體開發的新平臺,還有特定領域的專用AI工具或插件,以及各方自研自制的AI系統或智能體。
根據統計,DeepSeek使用量高居榜首,佔所有AI工具使用量的三成以上。其次分別是豆包、ChatGPT、Gemini和Kimi。
實驗中,團隊發現,選題策劃與大綱生成、文獻摘要與速讀、資料蒐集、學術翻譯與對照等功能被廣泛使用,也是AI最擅長的工作。
基礎工作外,人機協同正逐步提升科研效能。令張治印象頗深的一篇論文采用的是思辨對話模式。作者創新構建了一個由五個異構大語言模型組成的“硅基專家組”。簡單來說,讓AI做AI的裁判,通過不斷逼問大模型,令其跳脫出簡單的邏輯生成範式,激發大模型本身的創造力。
投稿論文中,人機交互方式日趨多樣化。有AI全程執行、人類把關決策的“委託執行模式”,也有AI各司其職、人類居中調度的“多模型聯用模式”。開放的投稿方式,讓AI從幕後走到臺前,嘗試參與未來科學研究的更多可能。
AI評審,能否“算”出好論文
這場先鋒實驗中,調研團隊不僅大膽讓AI當“一作”,更繼續往前邁了一步——讓AI當評審。
“最簡單的辦法是把最優秀的論文投餵給AI,讓它仿照人類專家的思維來評審。”張治介紹,其搭建AI審稿系統時,尋找了許多優秀教授、在讀博士生,讓他們“背靠背”打分,也讓AI不斷強化學習。由此,通過人機協同探索如何讓AI評出好論文。
結果發現,人類專家與AI評審的一致性越來越高。其中,AI審稿系統與人類專家對論文質量檔次判斷的一致性比例達到76%。在識別“高質量”與“不合格”兩類論文時一致性超過80%。“AI的評判是人類的價值判斷和審美在AI世界的投射,”張治解釋。
進一步來看, 不同大模型的科研品味有所差異。比如,DeepSeek更注重論文的內在邏輯與規範細節,在推理鏈和結構化審稿方面更強;ChatGPT對於前沿和風險方法的推廣會更謹慎。
“同樣語料相同、不同的模型架構也會從同一個知識海洋中撈出不同的珍珠,就是因爲他們的網眼不一樣,”張治說。
AI幻覺,如何避免文獻造假
AI當“一作”並非萬能。
調研團隊發現,AI幻覺時有發生。最常見的現象之一是編造虛假文獻。實驗中,12.71%的論文被查出存在“文獻絕對虛假”。
AI擔任“一作”,還面臨學術支撐嚴重不足等問題。特別是在研究邏輯方面“重形輕質”,研究問題空泛,文獻綜述簡單羅列卻難成學術對話。
“方法、過程、規範有餘,但落地不足。”張治以教育學領域的投稿論文舉例,其在研究設計方面套用模板、忽視教育現實,分析推理也通常止步於描述,很難有深層推斷。
這也不難理解。AI產生的思想碎片都是人類歷史上已經存在的思想火花。因此,讓AI創新生成人類從未產生過的思想很難實現。
“AI最擅長回覆人類已有的知識是什麼,但是學術研究的價值往往在於提出還沒有被充分言說卻對現實有着重大意義的洞見。”在論文投稿人、華東師範大學2025級博士研究生張思夢看來,問題的發起者是人。研究中,當AI給出漂亮答案時她不會照單全收。她既要看懂、跑通AI生成的代碼,也要對AI給出的數據檢索來源、檢驗真僞。她說,人類研究者最核心的價值不是比AI更聰明,而是更能關切那些被數據遺忘的人,關切那些被效率犧牲的公平,也關切那些被標準答案掩蓋的例外。
記者手記:與AI共同走進下一個創新時代
當AI成爲“一作”,成爲學術成果的核心生產者,人類的貢獻該如何評估?
這個頗具時代性的話題,因爲一場高校發起的先鋒實驗提前上演。它已不再停留於該不該使用AI這一表層討論。其更深層次的指向是研究範式、教育理念的革新。
誠如有專家所言,僅停留於觀點演繹、邏輯論證的論文未來或許將喪失學術價值。一邊是人類社會耗時多年開展的研究,另一邊卻是AI在短時間內的反覆推演、迅速模擬。兩者的科研效率孰高孰低,不言自明。
這並不意味着AI能徹底取代人類研究者。AI擁有海量的文本、極高的效率,能組合已有的知識,卻很難創造新的範式。後者恰是勤于思考的人類研究者擅長之處。
但過程中,仍要警惕認知外包、思維惰性。AI的到來,讓文獻梳理從數週縮至數分鐘,正如當年計算器的出現取代了心算。效率產生依賴,更要避免“智能寄生”。當AI給出選項、路徑時,人類研究者要憑藉自身對世界的深度理解把向定航。
從這一角度來看,人機協作,或許纔是打開下一個創新時代的“科學鑰匙”。