首頁娛樂健康美食旅遊體育遊戲搞笑親子寵物歷史文化科學正能量辟謠國風動漫漫畫時尚家居生活健身養生孕產情感星座

DeepSeek的進階之路：2026年DeepSeek已更新四次

來源：CNMO科技更新：02-15 10:44

【CNMO科技信息】2月15日，微博科技發佈一張圖片，來回顧DeepSeek的進階之路。CNMO注意到，2026年纔過去兩個月，DeepSeek就已連續更新四次。

2025年1月20日，DeepSeek-R1的發佈引起了廣泛關注。其訓練成本不到GPT-4o的十分之一，性能卻對齊OpenAI o1正式版。隨後，發佈的DeepSeek Janus Pro進一步提升了多模態理解和文生圖能力。3月推出的DeepSeek-V3-0324，則在推理能力、數學和編程性能上擊敗了GPT-4.5。

2025年2月，DeepSeek開展了基礎設施開源周活動，在此期間開源了多個與基礎設施相關的技術成果。

在接下來的幾個月裏，DeepSeek繼續保持着高速的發展態勢。在推理能力方面，DeepSeek-R1-0528推理能力重大升級，前端能力超過了Gemini 2.5 Pro；DeepSeek-V3.1更是實現了單一模型同時支持“思考模式”與“非思考模式”自由切換。

此外，DeepSeek-OCR以極高的視覺token壓縮效率，實現了“視覺token”取代“文本token”。而DeepSeek-Math-V2成爲了行業首個達到國際奧數金牌水平且開源的模型，爲數學教育和研究提供了新的工具和方法。

2026年，DeepSeek提出的mHC架構解決了訓練中信號不穩定與計算效率的矛盾；另一項創新架構——Engram內存模塊能將大語言模型中的靜態知識存儲與動態計算推理分離，大幅提升效率並降低對昂貴算力資源的依賴。

相關推薦

請使用下列任何一種瀏覽器瀏覽以達至最佳的用戶體驗：Google Chrome、Mozilla Firefox、Microsoft Edge 或 Safari。為避免使用網頁時發生問題，請確保你的網頁瀏覽器已更新至最新版本。

Scroll to Top