![]()
美團首個開源大模型來了
美團發布并開源其560B參數的混合專家(MoE)模型——LongCat-Flash(龍貓)。
據介紹,LongCat-Flash-Chat這一模型采用創新性混合專家模型(MoE)架構,總參數 5600 億,通過 “零計算專家” 機制及底層優化,實現了計算效率與性能的雙重提升。相比傳統模型,美團大模型在訓練和推理速度上優勢明顯,能在 H800 上實現單用戶每秒 100+ tokens 的推理速度,輸出成本低至 5 元 / 百萬 token。
在性能表現上,龍貓雖為非思考型基礎模型,但據多項基準測試綜合評估,LongCat-Flash-Chat在僅激活少量參數的前提下,在智能體任務中具備突出優勢,同時推理速度超過100tps。
阿里推出智能體開發框架AgentScope 1.0
據通義大模型官微消息,阿里通義實驗室推出新一代智能體開發框架——AgentScope 1.0。據介紹,AgentScope 1.0是一款以開發者為核心,專注于多智能體開發的開源框架。
特斯拉發布“宏圖計劃4”:正在打造把AI帶入物理世界的產品
特斯拉發布其“宏圖計劃”第四篇章(Master Plan Part 4)的完整文件,其中提到,特斯拉故事的下一篇章,將創造一個人類才剛剛開始想象的世界,并以前所未有的規模實現。目前正在打造把AI帶入物理世界的產品和服務。
截至今年6月底 ,我國智能算力規模達788百億億次/秒
截至今年6月底,我國在用算力中心機架總規模達1085萬標準機架,智能算力規模達788百億億次/秒(EFLOPS);存力規模超過1680艾字節(EB),相比2023年增長約40%;已發布1509個大模型,在全球位居前列。
騰訊混元最新開源翻譯模型發布
騰訊混元宣布將旗下剛剛獲得國際翻譯比賽冠軍的模型開源,供開發者免費下載部署。據了解,這一模型命名為Hunyuan-MT-7B,總參數量僅7B,支持33個語種、5種民漢語言/方言互譯,是一個能力全面的輕量級翻譯模型。同時開源的還有一個翻譯集成模型Hunyuan-MT-Chimera-7B(奇美拉),它能夠根據原文和多個翻譯模型給出的不同內容,再生成一個更優的翻譯結果,不僅原生支持Hunyuan-MT-7B,也支持接入Deepseek等模型。
度小滿App升級上線AI經營助手
9月1日,度小滿App升級煥新正式上線AI經營助手,通過AI照相館、AI創意海報和智能記賬本三大核心功能,為小微商家提供覆蓋日常經營關鍵環節的實用AI工具。據介紹,“AI經營助手”基于千億參數金融大模型打造,服務于真實經營場景。該助手將在9月5日面向所有小微企業主開放。
你期待怎樣的AI時代?
咱們評論區聊聊~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.