![]()
DeepSeek-V3.1正式發布
8月21日,據DeepSeek官方公眾號消息,DeepSeek-V3.1正式發布。本次升級包含以下主要變化:混合推理架構:一個模型同時支持思考模式與非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內給出答案;更強的Agent能力:通過Post-Training優化,新模型在工具使用與智能體任務中的表現有較大提升。官方App與網頁端模型已同步升級為DeepSeek-V3.1。用戶可以通過“深度思考”按鈕,實現思考模式與非思考模式的自由切換。
DeepSeek官微留言:UE8M0 FP8是針對即將發布的下一代國產芯片設計
8月21日,DeepSeek在其官宣“正式發布DeepSeek-V3.1”的文章里面提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度。另外,V3.1對分詞器及chat template進行了較大調整,與 DeepSeek-V3 存在明顯差異。DeepSeek官微在置頂留言里說,UE8M0 FP8是針對即將發布的下一代國產芯片設計。
2025年《財富》中國科技50強榜單發布,DeepSeek、宇樹等上榜
8月21日,《財富》(FORTUNE)正式發布“2025年中國科技50強”榜單,其中,DeepSeek、阿里巴巴、騰訊、字節跳動、宇樹科技、珞石機器人、創新奇智、中關村科金等多家大模型、具身智能公司上榜。
國內多數AI模型訓練使用的中文數據占比已超60%
8月21日,中文數據在國內AI大模型的訓練性能提升方面發揮著重要作用。國家數據局近日發布的數據顯示,目前國內多數AI模型訓練使用的中文數據占比已經超過60%,有的模型達到80%。中文高質量數據的開發和供給能力持續增強,推動我國人工智能模型性能快速提升。國家數據局局長劉烈宏表示,我國人工智能的快速發展,與我國高度重視數據工作是密不可分的。作為人工智能發展的核心要素之一,數據在推動“人工智能+”過程中發揮著關鍵作用,高質量數據集的建設至關重要。
智元靈犀X2即將完成量產,將于8月底開始陸續供應
在8月21日的智元機器人首屆合作伙伴大會上,智元機器人聯合創始人兼CTO彭志輝透露,智元靈犀X2即將完成量產,將于8月底開始陸續供應,第四季度起不限量發貨。
智元機器人預計明年出貨量將達數萬臺
8月21日,智元機器人首屆合作伙伴大會8月21日在滬召開。從會上獲悉,智元機器人今年會有數千臺的出貨量,明年預計會有數萬臺的出貨,智元機器人希望在未來幾年,每年出貨量可達到數十萬臺。
字節開源大型語言模型 Seed-OSS-36B
8月21日,字節跳動旗下的 Seed 團隊在 AI 代碼分享平臺 Hugging Face 上發布了最新的開源大型語言模型 Seed-OSS-36B。Seed-OSS-36B 的架構結合了多種常見的設計選擇,包括因果語言建模、分組查詢注意力(Grouped Query Attention)、SwiGLU 激活函數、RMSNorm 和 RoPE 位置編碼。每個模型包含 360 億參數,分布在 64 層網絡中,并支持 15.5 萬詞表。這一新模型最大上下文長度可達 512k tokens,能夠在不損失性能的情況下處理超長文檔和推理鏈。
Lanmeih/今日話題
你怎么評價DeepSeek最新的模型?
咱們評論區聊聊~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.