DeepSeek的進階之路:2026年DeepSeek已更新四次

來源: 更新:

【CNMO科技信息】2月15日,微博科技發佈一張圖片,來回顧DeepSeek的進階之路。CNMO注意到,2026年纔過去兩個月,DeepSeek就已連續更新四次。

2025年1月20日,DeepSeek-R1的發佈引起了廣泛關注。其訓練成本不到GPT-4o的十分之一,性能卻對齊OpenAI o1正式版。隨後,發佈的DeepSeek Janus Pro進一步提升了多模態理解和文生圖能力。3月推出的DeepSeek-V3-0324,則在推理能力、數學和編程性能上擊敗了GPT-4.5。

2025年2月,DeepSeek開展了基礎設施開源周活動,在此期間開源了多個與基礎設施相關的技術成果。

在接下來的幾個月裏,DeepSeek繼續保持着高速的發展態勢。在推理能力方面,DeepSeek-R1-0528推理能力重大升級,前端能力超過了Gemini 2.5 Pro;DeepSeek-V3.1更是實現了單一模型同時支持“思考模式”與“非思考模式”自由切換。

此外,DeepSeek-OCR以極高的視覺token壓縮效率,實現了“視覺token”取代“文本token”。而DeepSeek-Math-V2成爲了行業首個達到國際奧數金牌水平且開源的模型,爲數學教育和研究提供了新的工具和方法。

2026年,DeepSeek提出的mHC架構解決了訓練中信號不穩定與計算效率的矛盾;另一項創新架構——Engram內存模塊能將大語言模型中的靜態知識存儲與動態計算推理分離,大幅提升效率並降低對昂貴算力資源的依賴。

相關推薦
請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗:Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題,請確保你的網頁瀏覽器已更新至最新版本。
Scroll to Top