每3篇就有1篇涉嫌造假？中國癌症研究遭遇“最大規模”質疑-辟謠-漫步新聞-陪你看看

36%，17萬，這是讓中國科研界無法迴避的數字。

2026年1月30日，《英國醫學雜誌》發表了一項震撼學術界的研究。研究顯示在1999年至2024年間發表的中國癌症研究論文中，超過17萬篇被人工智能標記爲疑似論文工廠產物，比例高達36%。

這意味着每3篇中國癌症研究論文中，就有超過1篇被AI識別爲可能存在誠信問題。

當然，這項研究並非針對中國，而是展示了一個系統性問題的冰山一角。在這項研究掃描的全球超過260萬篇癌症論文中，26.1萬篇（9.87%）被標記爲疑似論文工廠產物，其中中國佔了17.7萬篇，佔全球疑似論文的68%。

撰文 | 木木

1月30日，醫學領域頂級期刊《英國醫學雜誌》（The BMJ）發表了一項令人震驚的研究：在1999年至2024年間發表的癌症研究論文中，每10篇就有1篇疑似論文工廠產物；其中中國的情況尤爲嚴重，每3篇就有1篇疑似問題論文。

這項研究的主導者，正是幾周前剛剛在Nature雜誌上宣佈“論文減產50%”以踐行“慢科學”理念的澳大利亞昆士蘭科技大學教授Adrian Barnett。如果說之前他用數據證明“90%的研究是垃圾”，那麼這次，他用機器學習找到了最底層的“垃圾”，即由論文工廠批量生產的工業化產品。他的團隊開發的BERT機器學習模型，通過分析論文標題和摘要的文本特徵，在已知真假的論文中達到了91%的準確率。

更令人不安的是，這個問題不僅存在於低質量期刊。研究顯示，那些高影響因子期刊（排名前10%的期刊）的標記率從1999年的接近零，一路攀升到2022年的超過10%。這意味着論文工廠的“假貨”已經滲透到學術金字塔的頂端，即便是最受尊敬的學術期刊也未能倖免。

這不是針對中國的“抹黑”，而是基於260萬篇論文的科學分析。但我們必須直面一個現實：這個數字會被國際學術界長期記住。它不僅影響中國科研的國際聲譽，更可能誤導全球癌症研究的方向。同時，它也對那些恪守學術誠信的中國研究者造成了不公平的“污名化”。

問題究竟有多嚴重？論文工廠是如何運作的？AI又是如何識破這些造假的？中國科研該如何應對這場危機？

模板化生產留下“文字指紋”：

AI如何識破論文工廠

論文工廠（paper mills）通常是指“學術合同作弊組織”，它們爲客戶批量製造虛假論文。根據BMJ論文引用的數據，過去20年間，超過40萬篇疑似論文工廠產物被髮表，論文工廠的年收入達到數千萬美元。2022年，Wiley出版社在收購Hindawi後，一次性撤回了近1.1萬篇疑似論文工廠產物，並關閉了19本期刊，讓這個問題獲得了前所未有的關注。

這些論文工廠依賴預製句子的模板，只需替換特定領域的術語，以流水線方式大規模製造論文。根據俄羅斯學者Abalkina的調查，論文工廠的收費直接與期刊的影響因子掛鉤，影響因子越高，售價越高。

正是因爲論文工廠使用模板化生產，這給AI檢測提供了可能。Barnett團隊的核心假設是：論文工廠使用的文本模板會延伸到標題和摘要，這些模板特徵雖然對人類可能不明顯，但AI能夠識別。他們選擇了BERT機器學習模型來分析文本，讓AI讀了幾千篇真假論文後，學會識別“造假腔調”。

研究團隊從Retraction Watch數據庫篩選出2,202篇標記爲“Paper Mill”的癌症研究論文用於模型訓練，並從學術誠信專家數據集獲得3,094篇用於外部驗證。作爲對照組，他們從北歐國家和高影響因子期刊中選擇論文，特別納入了部分中國的高質量論文，以避免模型僅僅學習語言特徵而非造假特徵。

模型表現令人信服：在驗證集上準確率達到0.91-0.93，敏感性爲0.87，特異性高達0.96-0.99。更重要的是，在交叉驗證中，模型成功標記了72%已知包含錯誤核苷酸序列和細胞系的問題論文，儘管模型在訓練時並未獲得這些信息。這說明模型確實學會了識別論文工廠的文本特徵本身。

有了這個強大的AI工具，研究團隊開始了一項前所未有的大規模掃描：檢查1999年至2024年間發表的260萬篇癌症研究論文。

全球9.87%，中國36%：

癌症研究中的論文工廠有多猖獗？

這是迄今爲止針對論文工廠最大規模的檢測研究。研究團隊從PubMed數據庫的3800萬篇生物醫學論文中，經過嚴格篩選，最終得到2,647,471篇癌症原創研究論文，跨越11,632本期刊，時間跨度26年。每一篇論文的標題和摘要都被輸入到訓練好的BERT模型中進行分析。

核心數字令人震驚：在2,647,471篇癌症原創論文中，261,245篇被標記爲疑似論文工廠產物，佔比9.87%。這意味着每發表10篇癌症論文，就有約1篇可能來自論文工廠，是之前估計的3倍以上。

每年被標記爲疑似論文工廠產物的癌症研究論文數量｜The BMJ

從時間趨勢看，問題呈指數級惡化。1999-2009年標記率約1%，到2022年已超過15%（171,656篇癌症論文中有26,457篇被標記）。論文指出，標記論文數量遵循指數趨勢，R²=0.92，這意味着這是一個系統性的、加速的危機。值得注意的是，2022年後標記率略有下降，論文分析可能與出版商反擊、論文工廠轉向AI生成新模板等因素有關。

當研究團隊按第一作者所屬國家統計時，中國的數字尤其突出。在中國機構發表的497,672篇癌症論文中，177,907篇被標記，標記率高達36%。讓我們用數字來理解這意味着什麼：這是全球平均水平（9.87%）的3.6倍，是美國（2%）的18倍；中國癌症論文總量佔全球18.8%，17.7萬篇被標記論文，佔全球被標記論文的68%。

值得注意的是，這個問題並不限於中國。伊朗的標記率達到20%，沙特阿拉伯爲16%，埃及爲15%，巴基斯坦和馬來西亞都達到13%。儘管這些國家的標記率也不低，但中國因爲科研體量巨大，在絕對數量上最爲驚人。與之形成鮮明對比的是，美國的標記率爲2%，日本、德國、英國的標記率約爲3%-4%。

從癌症類型看，論文工廠顯示出明顯的“偏好”。胃癌論文的標記率最高，達到22%；肝癌爲20%；骨癌爲21%。論文指出，胃癌和肝癌研究中標記論文比例較高，可能部分是因爲這些癌症在中國的高患病率。更值得注意的是，某些錯誤識別的細胞系，如BGC-823和BEL-7402，幾乎只出現在來自中國機構的出版物中。這意味着論文工廠針對性地瞄準這些“需求旺盛”的領域。

從研究領域看，基礎研究是重災區。癌症生物學和基礎研究、治療開發、診斷和預後等領域的標記率超過10%，而臨牀流行病學、支持性護理等領域的標記率低於2%。這符合論文工廠的“經濟理性”：基礎研究相對容易僞造，臨牀研究則需要真實患者數據。

在出版商分佈方面，Verduci Editore的標記率高達67%，主要來自European Review for Medical and Pharmacological Sciences期刊。更令人擔憂的是，即便是Springer Nature、Elsevier和John Wiley and Sons這些主流大型出版商，標記率也約10%，標記論文數量分別達到4萬、近4萬和2.8萬篇。

從期刊影響因子看，排名前10%的期刊標記率從1999年的接近零增長到2022年的超過10%。這說明論文工廠問題不僅限於“掠奪性期刊（純粹以商業盈利爲目的而發行的低品質期刊）”，連頂刊們也未能倖免。

影響因子排名前10%期刊中被標記爲疑似論文工廠產物的癌症論文比例（按發表年份）｜The BMJ

研究人員指出：“影響因子的同步增長和標記論文的蔓延表明，這兩種現象可能都源於‘發表或消亡’文化的壓力。”論文工廠按影響因子定價，瞄準高端市場，而研究者追求高影響因子的壓力爲其提供了市場。這也印證了Adrian Barnett“影響因子與論文質量並沒有直接關係”的觀點。

整體而言，這些數字勾勒出一幅令人不安的圖景：全球9.87%的癌症論文被標記，中國高達36%；問題論文標記率從1999年的1%飆升到2022年的15%以上，呈現指數級惡化；從掠奪性期刊到頂級期刊，從基礎研究到臨牀應用，論文工廠的觸角無處不在。這不是冰冷的數字，而是一場正在發生的學術誠信危機的真實寫照。

“標記”不等於“造假”：

統計工具不是終審法官

當我們看到36%這個驚人數字時，很容易得出簡單的結論：中國有36%的癌症研究論文是假的。但科學研究需要嚴謹，BMJ這篇論文展現了可貴的學術誠實，它用大量篇幅討論了研究的侷限性。

首先，研究確實證實了三個關鍵事實：論文工廠使用文本模板（模型在不同驗證集上準確率達0.91-0.93）；癌症研究的污染比想象嚴重（10%的標記率是之前估計的3倍以上）；高影響因子期刊不能保證質量（頂級期刊標記率從0增長到10%以上）。

其次，研究團隊指出研究本身存在侷限性。最關鍵的是：“標記”不等於“造假”。根據模型的靈敏度（0.87）和特異度（0.96-0.99），論文作者計算了一個假設場景：如果癌症研究中真實的論文工廠論文比例是10%，那麼也就意味着在被標記的論文中，約70%確實是論文工廠產物（陽性預測值），而約30%是誤判。但真實的論文工廠比例究竟是多少，目前仍然未知。

研究強調，即使存在誤判，被標記的大量論文仍然值得警惕和深入調查。以中國的17.7萬篇被標記論文爲例，如果假陽性率爲30%，可能有5.3萬篇是被誤判的真實研究。但即便如此，仍有12.4萬篇可能是真實的論文工廠產物。

論文特別強調，分類器是概率模型，不是不端行爲的確定仲裁者。所有標記論文代表基於文本特徵的統計預測，應解釋爲需要人類判斷和進一步驗證的信號，而不是確認的欺詐案例。

關於可能的地理偏見，論文承認訓練數據中中國論文過多可能引入偏見，但緊接着提供了反證：模型誤分類分析顯示假陽性很少，而中國論文在假陰性中過度代表（佔90%），這恰恰說明不存在系統性過度標記。此外，論文特別指出：論文工廠的原產國可能與作者的國家不同，比如一家俄羅斯論文工廠向至少39個國家銷售出版物，也就是說，即使第一作者單位在中國，不等於造假者就來自中國。

根源在“發表或消亡”文化

BMJ論文給出了明確的診斷：高影響因子期刊中標記論文百分比的上升表明，論文工廠論文不僅是低影響期刊的問題。影響因子的同步增長和標記論文的蔓延表明，這兩種現象可能都源於publish-or-perish（發表或消亡）文化。

論文指出癌症研究受影響更嚴重，原因包括“高發表壓力、專業化領域中簡單易僞造的數據和技術，以及有限的同行評審能力”，其中“高發表壓力”排在首位。論文工廠按期刊影響因子定價，這創造了一個惡性循環：研究者需要高影響因子論文來滿足晉升要求，論文工廠瞄準高影響因子期刊以賣出更高價格，結果導致高影響因子期刊的標記率從接近零上升到10%以上。

雖然論文沒有直接分析中國的科研評價體系，但提供了幾個客觀事實：中國是被標記論文最多的國家，某些出版商被中國政府標記爲“與學術嚴謹性衝突”，BGC-823和BEL-7402等細胞系幾乎只出現在中國機構出版物中。這些暗示中國的發表壓力可能特別嚴重，爲論文工廠提供了最大市場。

論文警告了論文工廠問題的多重危害：浪費編輯和審稿人時間，誤導臨牀決策和後續研究，以及系統性風險——Wiley收購Hindawi後一次性撤回近1.1萬篇論文、關閉19本期刊就是活生生的證據。論文還警告，ChatGPT等AI工具的興起可能讓論文工廠生成更逼真的文本，使未來檢測更具挑戰性。

在應對措施方面，論文報告模型已整合到三家期刊的投稿系統中，強調“最終決定始終由人類做出”“投稿永遠不會僅基於工具就被拒絕”。論文呼籲出版商和政策制定者協調行動，持續改進檢測技術，整合多種工具（文本分析、圖像檢測、數據驗證）來遏制論文工廠蔓延。

中國科研的警鐘與轉機

對中國而言，36%的標記率和17.7萬篇被標記論文的數據將被國際學術界長期記住。當然，具體的造假情況有待進一步審查。考慮到約30%的假陽性率，真實的造假比例可能在25%左右。但即便是25%，也意味着每4篇中國癌症研究論文中就有1篇可能存在嚴重誠信問題。

這是無法迴避的現實。

在悲觀的數據中，我們必須看到希望的一面。36%被標記，意味着64%的中國癌症研究論文沒有被標記。絕大多數中國科研人員是誠實的，他們在努力做真實的研究。誠實研究者們承受着“發表或消亡”的巨大壓力，看着造假者快速晉升，卻依然堅持學術誠信。他們纔是中國科研的希望所在。

正因如此，中國科研當下面臨着關鍵的路徑選擇。如果繼續現有路徑，論文數量將繼續膨脹而質量繼續下降，論文工廠繼續繁榮，國際聲譽繼續受損，誠實研究者繼續喫虧，“劣幣驅逐良幣”的局面繼續惡化，最終可能面臨某種程度的“學術孤立”。如果選擇改革之路，就要徹底改革評價體系（從數量到質量），重建學術誠信文化（從“發表或消亡”到“慢科學”），從論文大國走向科研強國。

而且必須看到，做出改變的時間窗口正在關閉。BMJ論文警告：不作爲的風險是允許論文工廠進一步蔓延，可能危及整個期刊和出版商。Barnett在Nature上的警告同樣適用於中國科研：如果我們不放慢速度，出版系統的更多部分將會崩潰，科學進步將被阻礙。

Barnett的研究也提出了一些解決方案：問題是系統性的，不是個別研究者的道德問題，而是激勵結構導致的集體困境，所以解決方案必須是制度改革。完整的改革路徑需要三管齊下：技術檢測（開發AI工具）、制度改革（推動評價體系改革）、文化重建（倡導“慢科學”理念）。

36%是震耳的警鐘，但警鐘也是轉機。問題已經被量化、被識別、被公開，技術工具已經存在，解決路徑已經清晰，國際經驗可以借鑑。現在需要的，是決心和行動。

注：本文所有數據和引用均來自2026年1月30日發表在The BMJ上的研究論文"Machine learning based screening of potential paper mill publications in cancer research: methodological and cross sectional study"（BMJ 2026; 392:e087581），以及Adrian Barnett在Nature雜誌、eLife雜誌和Median Watch博客上發表的系列文章。

參考文獻

[1] Barnett, A.G., Smail, B., Cherbuin, D., & Byrne, J.A. (2026). Machine learning based screening of potential paper mill publications in cancer research: methodological and cross sectional study. The BMJ, 392, e087581. https://doi.org/10.1136/bmj-2025-087581[2] Barnett, A. (2026, January 19). I''m going to halve my publication output. You should consider slow science, too. Nature. https://doi.org/10.1038/d41586-025-04061-w[3] Barnett, A. (2025, January 7). 90% of scientific research is crap. Median Watch. https://medianwatch.netlify.app/post/sturgeon/[4] Chalmers, I., & Glasziou, P. (2009). Avoidable waste in the production and reporting of research evidence. The Lancet, 374(9683), 86-89. https://doi.org/10.1016/S0140-6736(09)60329-9

本文經授權轉載自返樸（ID：fanpu2019），如需二次轉載請聯繫原作者。歡迎轉發到朋友圈。

點個“小愛心”吧