李飛飛世界模型新成果RTFM 「Real-Time Frame Model」震撼問世
![]()
斯坦福大學教授李飛飛的創業公司World Labs推出了實時生成式世界模型RTFM。模型可在單個H100 GPU上運行,輸入2D圖像后,能生成不同視角下的新2D圖像,實現3D一致性和持久性。RTFM基于大規模視頻數據訓練,無需顯式構建3D表示,而是通過端到端學習模擬3D幾何、反射等特征。
來源:機器之心
美團開源 LongCat-Audio-Codec,高效語音編解碼器助力實時交互落地
![]()
美團LongCat團隊開源了語音編解碼方案LongCat-Audio-Codec。專為語音大語言模型(Speech LLM)設計,通過語義與聲學雙Token并行提取機制,兼顧語音的語義和聲學特征,解決了傳統方案中語義與聲學信息難以平衡的問題。低延遲流式解碼器支持實時交互,滿足車載語音助手、實時翻譯等場景的需求。
來源:龍貓LongCat
一鍵開發完整 Web 應用:Manus 1.5 正式發布,速度提升近四倍
![]()
Manus宣布推出Manus 1.5版本。在任務執行速度、可靠性和輸出質量方面顯著提升,任務平均完成時間縮短至不足4分鐘,速度提升近四倍。Manus 1.5提供兩種模型:Manus-1.5適用于高復雜度任務,Manus-1.5-Lite則針對成本效率優化。新版本具備全棧Web應用開發功能,用戶可通過對話完成從開發到部署的全過程。
來源:IT之家
愛詩科技完成B+輪1億元融資,ARR突破4000萬美金
![]()
AI視頻企業愛詩科技宣布完成1億元人民幣B+輪融資,由復星銳正、同創偉業、順禧基金等共同投資。愛詩科技旗下產品PixVerse與拍我AI服務于C端大眾與專業創作者,用戶規模已突破一億,ARR超過4000萬美元,MAU超過1600萬。
來源:愛詩科技AIsphere
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.