網易首頁 > 網易號 > 正文申請入駐

DeepSeek-V3.1發布，字節開源大型語言模型 | 藍媒GPT

2025-08-21 21:44:06　來源: 藍媒匯財經plus

天津舉報

分享至

DeepSeek-V3.1正式發布

8月21日，據DeepSeek官方公眾號消息，DeepSeek-V3.1正式發布。本次升級包含以下主要變化：混合推理架構：一個模型同時支持思考模式與非思考模式；更高的思考效率：相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短時間內給出答案；更強的Agent能力：通過Post-Training優化，新模型在工具使用與智能體任務中的表現有較大提升。官方App與網頁端模型已同步升級為DeepSeek-V3.1。用戶可以通過“深度思考”按鈕，實現思考模式與非思考模式的自由切換。

DeepSeek官微留言：UE8M0 FP8是針對即將發布的下一代國產芯片設計

8月21日，DeepSeek在其官宣“正式發布DeepSeek-V3.1”的文章里面提到，DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度。另外，V3.1對分詞器及chat template進行了較大調整，與 DeepSeek-V3 存在明顯差異。DeepSeek官微在置頂留言里說，UE8M0 FP8是針對即將發布的下一代國產芯片設計。

2025年《財富》中國科技50強榜單發布，DeepSeek、宇樹等上榜

8月21日，《財富》（FORTUNE）正式發布“2025年中國科技50強”榜單，其中，DeepSeek、阿里巴巴、騰訊、字節跳動、宇樹科技、珞石機器人、創新奇智、中關村科金等多家大模型、具身智能公司上榜。

國內多數AI模型訓練使用的中文數據占比已超60%

8月21日，中文數據在國內AI大模型的訓練性能提升方面發揮著重要作用。國家數據局近日發布的數據顯示，目前國內多數AI模型訓練使用的中文數據占比已經超過60%，有的模型達到80%。中文高質量數據的開發和供給能力持續增強，推動我國人工智能模型性能快速提升。國家數據局局長劉烈宏表示，我國人工智能的快速發展，與我國高度重視數據工作是密不可分的。作為人工智能發展的核心要素之一，數據在推動“人工智能+”過程中發揮著關鍵作用，高質量數據集的建設至關重要。

智元靈犀X2即將完成量產，將于8月底開始陸續供應

在8月21日的智元機器人首屆合作伙伴大會上，智元機器人聯合創始人兼CTO彭志輝透露，智元靈犀X2即將完成量產，將于8月底開始陸續供應，第四季度起不限量發貨。

智元機器人預計明年出貨量將達數萬臺

8月21日，智元機器人首屆合作伙伴大會8月21日在滬召開。從會上獲悉，智元機器人今年會有數千臺的出貨量，明年預計會有數萬臺的出貨，智元機器人希望在未來幾年，每年出貨量可達到數十萬臺。

字節開源大型語言模型 Seed-OSS-36B

8月21日，字節跳動旗下的 Seed 團隊在 AI 代碼分享平臺 Hugging Face 上發布了最新的開源大型語言模型 Seed-OSS-36B。Seed-OSS-36B 的架構結合了多種常見的設計選擇，包括因果語言建模、分組查詢注意力（Grouped Query Attention）、SwiGLU 激活函數、RMSNorm 和 RoPE 位置編碼。每個模型包含 360 億參數，分布在 64 層網絡中，并支持 15.5 萬詞表。這一新模型最大上下文長度可達 512k tokens，能夠在不損失性能的情況下處理超長文檔和推理鏈。

Lanmeih/今日話題

你怎么評價DeepSeek最新的模型？

咱們評論區聊聊~

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.