<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      M+框架來了,增加LLM隱空間記憶,不再受上下文窗口限制

      0
      分享至



      本文的第一作者Yu Wang來自加州大學圣地亞哥分校,主要研究方向為Memory for LLMs and Memory for LLM Agents. 該論文于2024年在MIT-IBM Waston Lab實習過程中完成,通訊作者Zexue He也畢業(yè)于加州大學圣地亞哥分校。

      M+是在 MemoryLLM 之上提出的長期隱空間記憶擴展框架:通過把「過期」隱藏向量寫入CPU - 側(cè)長期記憶池,再用協(xié)同檢索器拉回最相關(guān)記憶,它將 8 B 級模型的有效記憶跨度從原本不到 20 k tokens 提升到 160 k tokens 以上,同時顯存占用保持不變。



      • 論文標題:M+: Extending MemoryLLM with Scalable Long-Term Memory
      • 論文鏈接:https://arxiv.org/abs/2502.00592
      • 代碼倉庫:https://github.com/wangyu-ustc/MemoryLLM
      • 開源模型:https://huggingface.co/YuWangX/mplus-8b

      背景:上下文 ≠ 記憶 & 現(xiàn)有記憶模型的缺陷

      上下文窗口并不能直接等價于記憶。GPT-4.1 之類的模型即便支持 100 萬 token,也會隨窗口線性升高顯存與延遲,難以落地本地部署。

      業(yè)界主流做法是 “Token-Level Memory”:把歷史內(nèi)容或三元組存在數(shù)據(jù)庫 / 向量庫,檢索后再拼接回 prompt;MemGPT等系統(tǒng)即屬此類。該類做法不需要重復訓練,直接結(jié)合 GPT-4 這樣的大模型便可以獲得很不錯的性能,但是,它也會有一些隨之而來的問題:(1)冗余:原始文本并非最緊湊表達,重復率高。(2)沖突難解:遇到相互矛盾或不斷更新的信息時,文本級沖突消解復雜。(3)多模態(tài)能力弱:由于數(shù)據(jù)庫格式為文本,處理音頻或者圖片,視頻數(shù)據(jù)將相對困難。

      因此,我們希望探索隱空間 (Latent-Space) 的 Memory -- 既壓縮又可端到端訓練,更接近人類在神經(jīng)激活中存儲信息的方式。

      M + 的關(guān)鍵改進:Long-Term Memory

      在 MemoryLLM 中,我們?yōu)?8B 的 Llama3 模型引入了約 1.67B 的 Memory。Llama3-8B 的 Transformer 共包含 32 層。當?shù)谝粚咏邮盏皆~輸入后,會通過 Embedding 層將詞轉(zhuǎn)化為一系列 4096 維的向量。基于這一特點,我們設(shè)計了 MemoryLLM,在每一層都加入 N 個 Memory Tokens(實驗中 N=12800)。在生成過程中,這些 Memory Tokens 會作為每一層的 Prefix,通過 Cross-Attention 將信息注入后續(xù)層,使模型能 “看到” 保存在 Memory Pool 中的歷史信息。



      在更新階段,我們會將每層 Memory Token 中最后 K 個(實驗中 K=256)與需要寫入的信息一同送入 Transformer,再次經(jīng)過 Cross-Attention,將信息壓入新的 Memory Tokens 中(如下圖所示)。與此同時,我們在原有 Memory 中隨機丟棄 K 個舊 Token,并將新生成的 K 個 Token 放到 Memory 尾部,完成更新。



      基于這樣的設(shè)計,借助每層 12800 個 Memory Vectors,我們在 50k tokens 內(nèi)都能保持良好的信息留存(最早 MemoryLLM-7B 版本只做到 20k,后續(xù)在 GitHub 提供的新版模型 https://github.com/wangyu-ustc/MemoryLLM 可達 50k)。然而,這樣的記憶容量仍無法滿足我們對更長序列的期待。要進一步擴展 Memory,單靠原有的 1.67B 容量已遠遠不夠,因此我們提出了Long-Term Memory。

      如何高效實現(xiàn) Long-Term Memory?考慮到 MemoryLLM 中每一個 Memory Token 本質(zhì)上都來自 Hidden States,我們將那些在更新過程中被 “丟棄” 的 Memory Token 并非直接舍棄,而是將其保存在長期記憶池中(如下圖)。



      僅僅保存是不夠的,我們還需要具備強大的提取能力。最初我們嘗試用 Attention 來從長期記憶中檢索 Hidden States,但實驗表明 Attention 在提取 Hidden States 時效果有限(在論文的消融實驗中做了詳盡對比)。因此我們提出協(xié)同提取器(Co-trained Retriever),并與全模型進行聯(lián)合訓練(如下圖)。



      通過這一結(jié)構(gòu),我們將模型的有效記憶跨度從 50k 一舉提升到 160k,且由于 Memory 主要駐留在 CPU,不會顯著增加 GPU 負擔。

      M + 的實驗結(jié)果

      顯著性能提升及更少的 GPU 使用:在 Longbook-QA 和 Longbook-Event-QA 兩個數(shù)據(jù)集上,我們都在更少 GPU 的使用下(單卡 18GB 左右)獲得了更強大的性能。





      更強的信息留存能力:在 SQuAD 數(shù)據(jù)集上表現(xiàn)出遠超 MemoryLLM-7B 以及相關(guān) ablation baseline 的信息留存能力,可以達到 160k 依舊不完全遺忘過去的信息。





      結(jié)語

      M+ 展示了我們在探索隱空間長期記憶領(lǐng)域的重要進展,也為下一代具備持續(xù)記憶能力的語言模型提供了堅實的技術(shù)支撐。未來,我們將繼續(xù)研究更高效的存儲機制、更智能的檢索策略,以及與多模態(tài)輸入更自然融合的隱空間記憶架構(gòu)。在此方向上,M+ 不僅是對 MemoryLLM 的一次擴展,也是我們對 “讓模型擁有接近人類記憶能力” 這一愿景的又一次有力實踐。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      海港奪冠徹底穩(wěn)了!不僅因為申花以已無力追趕,而是因為這三點!

      海港奪冠徹底穩(wěn)了!不僅因為申花以已無力追趕,而是因為這三點!

      田先生籃球
      2025-11-05 11:48:35
      壞消息,勇士隊庫里在戰(zhàn)勝太陽隊后立即被宣布缺席打國王隊的比賽

      壞消息,勇士隊庫里在戰(zhàn)勝太陽隊后立即被宣布缺席打國王隊的比賽

      好火子
      2025-11-05 23:52:39
      醒醒吧!就算臺灣愿意和平回歸,臺灣也不可能允許解放軍對臺駐軍

      醒醒吧!就算臺灣愿意和平回歸,臺灣也不可能允許解放軍對臺駐軍

      近史談
      2025-11-05 19:29:23
      山東菏澤發(fā)現(xiàn)堯帝墓,比秦始皇陵早兩千多年,填補了歷史考古空白

      山東菏澤發(fā)現(xiàn)堯帝墓,比秦始皇陵早兩千多年,填補了歷史考古空白

      小豫講故事
      2025-11-05 06:00:03
      舅舅借走30萬,7年不還,他兒子當兵政審那天,我一個電話打過去

      舅舅借走30萬,7年不還,他兒子當兵政審那天,我一個電話打過去

      清茶淺談
      2025-10-13 12:51:38
      沉默7天后,歐盟對華攤牌,拒絕承認2758號決議,反制箭在弦上

      沉默7天后,歐盟對華攤牌,拒絕承認2758號決議,反制箭在弦上

      第一心理
      2025-11-05 23:09:03
      李云迪再陷桃色風波,女主照片被扒疑似有兩人視頻流出

      李云迪再陷桃色風波,女主照片被扒疑似有兩人視頻流出

      挪威森林
      2025-11-02 12:56:16
      賽力斯公布方向盤折疊專利

      賽力斯公布方向盤折疊專利

      界面新聞
      2025-11-04 15:13:11
      汪峰演唱會翻車,葛薈婕補刀:只往女人身上使勁,唱不上去很正常

      汪峰演唱會翻車,葛薈婕補刀:只往女人身上使勁,唱不上去很正常

      木子愛娛樂大號
      2025-11-04 17:40:57
      西部再無全敗隊!鵜鶘最后11-0逆轉(zhuǎn)黃蜂獲首勝 無錫安8人上雙制勝

      西部再無全敗隊!鵜鶘最后11-0逆轉(zhuǎn)黃蜂獲首勝 無錫安8人上雙制勝

      醉臥浮生
      2025-11-05 11:36:06
      于和偉說:“我上大一,我大姐去世,肺癌,我愣坐著,沒有眼淚”

      于和偉說:“我上大一,我大姐去世,肺癌,我愣坐著,沒有眼淚”

      百態(tài)人間
      2025-11-04 15:58:52
      全運會男籃第二輪比賽,廣東全運男籃對陣江蘇,兩隊陣容實力對比

      全運會男籃第二輪比賽,廣東全運男籃對陣江蘇,兩隊陣容實力對比

      小呫說故事
      2025-11-05 16:46:31
      弗州競選驚爆冷門:瓊斯逆襲,民主黨以64%勝率上演驚天翻盤

      弗州競選驚爆冷門:瓊斯逆襲,民主黨以64%勝率上演驚天翻盤

      老瑋是個手藝人
      2025-11-05 12:59:08
      墨西哥女總統(tǒng)當街遭男子猥褻,險遭親吻

      墨西哥女總統(tǒng)當街遭男子猥褻,險遭親吻

      觀威海
      2025-11-05 10:50:09
      美國前副總統(tǒng)切尼去世

      美國前副總統(tǒng)切尼去世

      政知新媒體
      2025-11-04 21:46:46
      故事:賴昌星自白:我風流一生,但心里只住過兩個人,她勝過結(jié)發(fā)妻子

      故事:賴昌星自白:我風流一生,但心里只住過兩個人,她勝過結(jié)發(fā)妻子

      蕭竹輕語
      2025-11-03 17:25:34
      不要對固態(tài)電池有太多幻想

      不要對固態(tài)電池有太多幻想

      星海情報局
      2025-11-04 14:15:59
      重慶燃氣抄表員不足工人一年凈減121人 整改不力被罰810萬李金陸掌舵17月離任

      重慶燃氣抄表員不足工人一年凈減121人 整改不力被罰810萬李金陸掌舵17月離任

      長江商報
      2025-11-05 09:54:55
      白應(yīng)蒼被宣判死刑時,仍舊昂首挺胸,毫無悔意,他爹已經(jīng)屁滾尿流

      白應(yīng)蒼被宣判死刑時,仍舊昂首挺胸,毫無悔意,他爹已經(jīng)屁滾尿流

      我心縱橫天地間
      2025-11-05 11:28:28
      阿森納挖到寶了!夏窗新援閃耀歐冠:8次對抗全部成功

      阿森納挖到寶了!夏窗新援閃耀歐冠:8次對抗全部成功

      球事百科吖
      2025-11-05 18:07:05
      2025-11-06 00:04:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      11656文章數(shù) 142498關(guān)注度
      往期回顧 全部

      科技要聞

      大轉(zhuǎn)彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      丈夫突然病亡2天后妻子也離世留下一兒一女 妹妹發(fā)聲

      頭條要聞

      丈夫突然病亡2天后妻子也離世留下一兒一女 妹妹發(fā)聲

      體育要聞

      贏下皇馬,會是利物浦的轉(zhuǎn)折點嗎?

      娛樂要聞

      港星林尚武突發(fā)心臟病去世

      財經(jīng)要聞

      事關(guān)加快建設(shè)金融強國 中央金融辦發(fā)聲

      汽車要聞

      智己LS9入局"9系"混戰(zhàn) 全尺寸SUV市場迎來新變量

      態(tài)度原創(chuàng)

      親子
      時尚
      藝術(shù)
      游戲
      數(shù)碼

      親子要聞

      溫暖守護小患者 上海這家醫(yī)院的眼科有個“兒童樂園”

      今年一定要擁有這件大衣,復古又時髦!

      藝術(shù)要聞

      蒲華:搦管寫竹,墨沈淋漓

      遭日本禁止發(fā)售恐怖游戲上架Steam!內(nèi)容過于凄慘

      數(shù)碼要聞

      小米POCO X1平板現(xiàn)身Geekbench 搭載驍龍7+ Gen 3

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 精品日韩人妻中文字幕| 久久人人爽人人爽人人av| 午夜精品久久久久久| 农安县| 国产精品自拍一二三四区| 国产精品久久国产丁香花| 欧美在线人视频在线观看| 龙游县| 国产亚洲一区二区三不卡| 依兰县| 精品免费看国产一区二区| 国产精品无码不卡在线播放| 综合色久七七综合尤物| 久久午夜夜伦鲁鲁片免费无码影院| 无码成人精品区在线观看| 国产精品久久国产精麻豆| 久久99国产精品尤物| 国产成人综合色就色综合| 中文字幕人妻无码一区二区三区| 奇米四色7777中文字幕| 人妻丰满熟妇av无码区| 9丨精品国产高清自在线看| 成人午夜免费无码视频在线观看 | 麻豆精品久久精品色综合| 亚洲一区二区日韩综合久久| 久久久久久久久久久久中文字幕 | 久久人人97超碰爱香蕉| 精品无套挺进少妇内谢| 男女吃奶做爰猛烈紧视频| 亚欧洲乱码视频在线观看| 国产99视频精品免费视频36| 国产真实乱人偷精品人妻| 9久9久热精品视频在线观看| 最近2019中文字幕免费看| 91精品乱码一区二区三区| 中文字幕一卡二卡三卡| 国产中文字幕久久黄色片| 国99久9在线 | 免费| 精品国产丝袜自在线拍国语| 我要看亚洲黄色太黄一级黄| 亚洲人成网站观看在线观看 |