阿里除夕夜將開源Qwen3.5模型 採用原生多模態架構
【CNMO科技新聞】隨着農曆除夕的到來,阿里巴巴旗下的通義千問團隊即將發佈新一代開源大模型Qwen 3.5。目前該模型系列的相關代碼已提交至Hugging Face與GitHub倉庫,標誌着這一備受期待的AI技術即將正式面向全球開發者開放。
Qwen 3.5 在架構設計上實現了顯著進化。它採用了全新的混合注意力機制(Hybrid Attention),將線性注意力與標準注意力相結合,從而在保持強大推理能力的同時,大幅提升了長文本和複雜任務的處理效率。
與前代模型相比,Qwen 3.5是一款原生多模態模型。它能夠直接理解並處理文本、圖像、音頻以及視頻數據,無需依賴外部插件或子模型進行轉換。初步透露的模型規格包括9B(90億參數)指令微調版以及35B-A3B(基於MoE架構)的中型版本,後者在數學推理與編程能力上表現尤爲出色。
當前的中國 AI 市場競爭已進入白熱化階段。除阿里外,DeepSeek 計劃推出其 V4 模型,字節跳動也在升級其豆包系列。行業分析人士認爲,阿里選擇在除夕夜這一關鍵節點開源 Qwen 3.5,旨在通過技術領先地位獲取春節期間的流量峯值,並鞏固其在全球開源社區的影響力。
相關推薦