人類什麼時候能打敗AI?北京大學的這場考試裏,本科生戰勝了AI!

來源: 更新:

這場考試裏,北京大學的本科生打敗了AI!北大團隊打造硬核化學評測題庫SUPERChem,174名化學學霸與GPT、Gemini、deeppseek等頂尖AI同場競技,500道防作弊高難度化學試題,暴露AI科學推理短板。

SUPERChem的誕生,填補了化學領域多模態深度推理評測的空白。

據悉,團隊發佈這項成果,並非爲了證明AI的短板,而是爲了推動它走得更遠。目前,SUPERChem項目已全面開源。團隊希望這套源自北大的“試卷”,能成爲全球科學與人工智能領域的公共財富,去催化下一次技術的爆發。或許在不久的將來,當我們再次打開這張試卷時,AI能交出一份滿分的答卷。

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top