Deepseek 正式推出DeepSeek-V3.2-Exp ——實驗模型
?基于 V3.1-Terminus 構建,首次推出了 DeepSeek Sparse Attention(DSA),可以在長上下文中進行更快、更高效的訓練和推理。
現在可在 App、Web 和 API 上使用
DSA實現了精細的稀疏注意力,對輸出質量的影響最小——提高長上下文性能并降低計算成本
基準顯示V3.2-Exp的表現與V3.1-Terminus相當
DeepSeek API價格下降了50%以上,立即生效。
V3.1-Terminus仍然通過臨時API可用,直到2025年10月15日15:59(UTC時間)DS設計和實現很多新的GPU算子。使用高級語言TileLang進行快速原型開發,因此,本次開源的主要算子包含TileLang與CUDA兩種版本。建議使用基于TileLang的版本以方便調試和快速迭代
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.