<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      蘋果提出新型反向傳播:一臺(tái)iPhone 15 Pro Max就能微調(diào)LLM

      0
      分享至



      機(jī)器之心報(bào)道

      編輯:Panda

      用 iPhone 本地跑大模型已經(jīng)不是新鮮事了,但能不能在 iPhone 上微調(diào)模型呢?

      最近,蘋果親自上場(chǎng),用一篇論文展示了其可行性。在這篇論文中,蘋果提出了一種內(nèi)存高效型反向傳播(MeBP)。該方法可在內(nèi)存使用量和計(jì)算時(shí)間之間提供比零階優(yōu)化(ZO/zeroth-order optimization)更好的權(quán)衡,同時(shí)還比 ZO 基線收斂更快、性能更優(yōu)。他們還在 iPhone 15 Pro Max 上驗(yàn)證了 MeBP 的有效性。

      這個(gè)蘋果團(tuán)隊(duì)(宋叢崢與 Xinyu Tang)也在論文中表示會(huì)發(fā)布一個(gè) MeBP 實(shí)現(xiàn),但其公開的鏈接目前還空無(wú)一碼。



      • 論文標(biāo)題:Memory-Efficient Backpropagation for Fine-Tuning LLMs on Resource-Constrained Mobile Devices
      • 論文地址:https://arxiv.org/abs/2510.03425
      • 倉(cāng)庫(kù)地址:https://github.com/apple/ml-mebp

      內(nèi)存高效型反向傳播(MeBP)

      在這篇論文中,蘋果團(tuán)隊(duì)的研究重點(diǎn)是使用 LoRA 微調(diào) LLM。因此,主要的內(nèi)存瓶頸在于模型參數(shù)和中間激活值。該團(tuán)隊(duì)的目標(biāo)是將微調(diào)的內(nèi)存使用量保持在現(xiàn)代移動(dòng)設(shè)備可接受的范圍內(nèi),例如 PocketLLM 所建議的「低于 1GB」。

      使用 MeBP 在設(shè)備上微調(diào) LLM 包含三個(gè)步驟:

      • 壓縮模型基礎(chǔ)權(quán)重(凍結(jié)的參數(shù))以減少磁盤空間占用
      • 編譯包含反向傳播和梯度檢查點(diǎn)的訓(xùn)練圖(training graph)以優(yōu)化內(nèi)存
      • 實(shí)現(xiàn)一個(gè)內(nèi)存高效的運(yùn)行時(shí)(runtime)來(lái)執(zhí)行編譯后的訓(xùn)練圖。

      下面將詳細(xì)描述每個(gè)步驟。

      基礎(chǔ)模型權(quán)重壓縮

      在設(shè)備上部署 LLM 時(shí),壓縮基礎(chǔ)模型權(quán)重以減少磁盤空間使用是一種常見做法。

      在該團(tuán)隊(duì)的實(shí)現(xiàn)中,他們對(duì)包括嵌入在內(nèi)的非 LoRA 參數(shù)使用了 4-bit 對(duì)稱模式 INT4 量化。

      梯度檢查點(diǎn)編譯



      也就是說(shuō),反向圖的輸入是:已被檢查點(diǎn)的激活值、來(lái)自前一個(gè)檢查點(diǎn)的梯度、以及相應(yīng)的可訓(xùn)練權(quán)重;其輸出則是這些輸入的梯度。

      隨后,所有塊的前向圖和反向圖被序列化為設(shè)備運(yùn)行時(shí)兼容的格式,例如模型中間語(yǔ)言(MIL)表示或 MLX 導(dǎo)出的函數(shù)。

      在運(yùn)行時(shí),這些序列化后的圖將被反序列化并編譯以進(jìn)行計(jì)算。

      運(yùn)行時(shí)實(shí)現(xiàn)

      算法 1 概述了 MeBP 的運(yùn)行時(shí)實(shí)現(xiàn)。



      模型首先使用 InitializeModel 函數(shù)進(jìn)行初始化,之后訓(xùn)練循環(huán)中的每個(gè)數(shù)據(jù)點(diǎn)都會(huì)調(diào)用 Backpropagation 函數(shù)。在 InitializeModel 期間,壓縮后的基礎(chǔ)模型權(quán)重被內(nèi)存映射(memory-mapped)。為最小化內(nèi)存占用,基礎(chǔ)模型權(quán)重在訓(xùn)練循環(huán)開始前不會(huì)被解壓。相反,它們會(huì)在計(jì)算需要時(shí)才被按需(on demand)延遲解壓和加載。注意,對(duì)于支持使用量化權(quán)重進(jìn)行計(jì)算的設(shè)備運(yùn)行時(shí)框架,解壓步驟可以被跳過(guò),屆時(shí)只需按需加載壓縮后的權(quán)重。

      在 Backpropagation 函數(shù)中,系統(tǒng)首先執(zhí)行已編譯的前向子圖(subgraphs)以存儲(chǔ)所有必要的檢查點(diǎn);隨后,按相反順序執(zhí)行已編譯的反向子圖,使用存儲(chǔ)的檢查點(diǎn)來(lái)計(jì)算梯度。在前向傳播過(guò)程中,這些檢查點(diǎn)被內(nèi)存映射,而不是保留在內(nèi)存中。

      在每次前向和反向傳播之前,只有必需的基礎(chǔ)模型權(quán)重會(huì)被解壓和加載。如此一來(lái),總內(nèi)存使用量被限制為:所需基礎(chǔ)模型權(quán)重的大小,加上每個(gè)子圖中操作的峰值內(nèi)存使用量。這個(gè)總和遠(yuǎn)小于基礎(chǔ)模型權(quán)重的完整大小。該函數(shù)描述的是單個(gè)數(shù)據(jù)點(diǎn)的梯度計(jì)算。對(duì)于批量輸入,可以使用梯度累積來(lái)計(jì)算梯度,而不會(huì)增加內(nèi)存占用。

      在 MeBP 中,內(nèi)存中僅為優(yōu)化器保留一份 LoRA 權(quán)重及其梯度的副本。

      對(duì)于參數(shù)量從 0.5B 到 4B 的 LLM,LoRA 權(quán)重的大小通常在幾十 MB 的范圍內(nèi),這在內(nèi)存中存儲(chǔ)是合理的。優(yōu)化器狀態(tài)(例如動(dòng)量)可以像基礎(chǔ)模型權(quán)重一樣,被內(nèi)存映射并延遲加載。

      實(shí)驗(yàn)表現(xiàn)如何?

      MeBP 表現(xiàn)如何,還得看實(shí)踐,而作為對(duì)比的基線,他們選擇了 MeZO,因?yàn)樗悄壳耙阎奈ㄒ粦?yīng)用于移動(dòng)設(shè)備 LLM 微調(diào)的優(yōu)化方法。該團(tuán)隊(duì)通過(guò)服務(wù)器端的模擬來(lái)評(píng)估 MeZO 和 MeBP 的效用(utility),并在移動(dòng)設(shè)備上比較它們的性能。

      效用(Utility)比較

      配置上,這個(gè)蘋果團(tuán)隊(duì)使用了 Gemma-3 和 Qwen-2.5,在 WikiText-2 數(shù)據(jù)集上進(jìn)行語(yǔ)言建模任務(wù)實(shí)驗(yàn),以此比較一階(FO)優(yōu)化(即通過(guò)反向傳播獲得梯度)和零階(ZO)優(yōu)化的效用。該團(tuán)隊(duì)專注于參數(shù)量不超過(guò) 4B 的模型,因?yàn)橐苿?dòng)設(shè)備的計(jì)算資源有限。該團(tuán)隊(duì)的評(píng)估指標(biāo)是評(píng)估集上的損失(loss)和下一 token 準(zhǔn)確度。其它配置見原論文,下面重點(diǎn)關(guān)注結(jié)果。

      如圖 1 所示,盡管 ZO 的損失和下一 token 準(zhǔn)確度呈現(xiàn)收斂趨勢(shì),但 ZO 的收斂速度明顯慢于 FO。FO 方法在最初的 100 步內(nèi)就顯著改善了這兩項(xiàng)指標(biāo),而 ZO 在 1,000 步后僅顯示出輕微的改善。即使在 100,000 步之后(即比 FO 多 100 倍的優(yōu)化步數(shù)),對(duì)于同一模型,ZO 的測(cè)試損失仍然高于 FO,測(cè)試準(zhǔn)確度也低于 FO。



      目前 AI 社區(qū)已經(jīng)提出了幾種方法,可以改善 ZO 方法的收斂速度。該團(tuán)隊(duì)也在 Qwen2.5-0.5B 上使用了這些改進(jìn)版 ZO 方法進(jìn)行實(shí)驗(yàn),結(jié)果見下圖。



      盡管這些方法比「純」 ZO 收斂得更快,但其損失和下一 token 準(zhǔn)確度仍然劣于使用 FO 微調(diào)的模型。此外,這些方法通常每次迭代需要更多的計(jì)算時(shí)間,因?yàn)樗鼈冃枰~外的前向傳播來(lái)更準(zhǔn)確地估計(jì)梯度。

      效用結(jié)果表明,在語(yǔ)言建模任務(wù)的 LLM 微調(diào)上,按「每一步」(per-step)來(lái)看,反向傳播的收斂速度明顯快于 ZO 方法。這使得它在計(jì)算時(shí)間方面更適合移動(dòng)部署 —— 前提是每個(gè) FO 優(yōu)化步驟都能被高效地實(shí)現(xiàn)。

      性能比較

      蘋果使用 Swift 在 iOS 中實(shí)現(xiàn)了 MeBP,并在配備 8GB RAM 的 iPhone 15 Pro Max 上評(píng)估了其性能。對(duì)于 MeZO 基線實(shí)現(xiàn),其前向圖被拆分為多個(gè)子圖,并應(yīng)用了延遲解壓來(lái)減少基礎(chǔ)模型權(quán)重的總內(nèi)存使用。每個(gè) MeZO 優(yōu)化步驟涉及兩次前向傳播。其它設(shè)置見原論文。

      結(jié)果見下表。



      總體而言,與 MeZO 相比,MeBP 每個(gè)梯度步驟的計(jì)算時(shí)間要多 43% 到 94%。但是,正如前面的效用對(duì)比所示,MeZO 所需的步數(shù)是一階優(yōu)化的 10 倍到 100 倍以上,因此在時(shí)間方面,MeBP 的收斂速度要快得多。在最壞情況下,MeBP 的內(nèi)存使用量比 MeZO 多出 20%,但其總訓(xùn)練內(nèi)存使用量比以往的移動(dòng)設(shè)備實(shí)現(xiàn)大約小 10 倍。所有測(cè)試的 LLM 均可在 1GB 內(nèi)存內(nèi)高效微調(diào),使其適合在手機(jī)上進(jìn)行后臺(tái)訓(xùn)練。

      此外,該團(tuán)隊(duì)還測(cè)試了解壓開銷與序列長(zhǎng)度的影響,并還分析了每一層的性能;詳見原論文。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      瞬間暴漲3倍!上海有人立馬出手:好怕?lián)尣坏?>
    </a>
        <h3>
      <a href=極目新聞
      2025-11-05 15:06:20
      A股放出三大利好!芯片預(yù)計(jì)150%漲幅空間

      A股放出三大利好!芯片預(yù)計(jì)150%漲幅空間

      君臨財(cái)富
      2025-11-06 16:29:44
      2002年,浙江男子得知銅價(jià)從3萬(wàn)漲到了8萬(wàn)塊錢,立即囤銅125噸,隨后他還做了這樣一件事!

      2002年,浙江男子得知銅價(jià)從3萬(wàn)漲到了8萬(wàn)塊錢,立即囤銅125噸,隨后他還做了這樣一件事!

      牛牛叨史
      2025-11-06 02:39:20
      亞冠激烈沖突!張玉寧遭“胯下之辱”,法比奧暴怒,6人互相推搡

      亞冠激烈沖突!張玉寧遭“胯下之辱”,法比奧暴怒,6人互相推搡

      奧拜爾
      2025-11-06 21:06:17
      信手拈來(lái),約基奇18中12砍33分15板16助,生涯第7次30+15+15

      信手拈來(lái),約基奇18中12砍33分15板16助,生涯第7次30+15+15

      懂球帝
      2025-11-06 12:41:13
      哪些弦外之音是你多年后才醒悟的?網(wǎng)友:好多都沒(méi)聽出來(lái),沒(méi)眼力

      哪些弦外之音是你多年后才醒悟的?網(wǎng)友:好多都沒(méi)聽出來(lái),沒(méi)眼力

      帶你感受人間冷暖
      2025-11-05 00:05:16
      看完全紅嬋遭遇的3大難關(guān),就知道她輸陳芋汐38.46分,真的不丟人

      看完全紅嬋遭遇的3大難關(guān),就知道她輸陳芋汐38.46分,真的不丟人

      嘴炮體壇
      2025-11-06 21:43:47
      11月首款新機(jī)官宣:11月10日,全新開售

      11月首款新機(jī)官宣:11月10日,全新開售

      T科技衍生
      2025-11-07 00:13:35
      800萬(wàn)鎊用9年!31歲老將成利物浦防線大腿,英超爭(zhēng)冠沒(méi)他不可

      800萬(wàn)鎊用9年!31歲老將成利物浦防線大腿,英超爭(zhēng)冠沒(méi)他不可

      銳評(píng)利物浦
      2025-11-06 22:11:33
      中國(guó)可能在等,把三大主要問(wèn)題解決了,再?gòu)氐捉鉀Q臺(tái)灣問(wèn)題

      中國(guó)可能在等,把三大主要問(wèn)題解決了,再?gòu)氐捉鉀Q臺(tái)灣問(wèn)題

      芳芳?xì)v史燴
      2025-11-06 18:37:28
      福建艦與四川艦傳來(lái)大喜訊,中國(guó)雙艦合璧將戰(zhàn)力值拉滿

      福建艦與四川艦傳來(lái)大喜訊,中國(guó)雙艦合璧將戰(zhàn)力值拉滿

      兵國(guó)大事
      2025-11-07 00:05:11
      美軍上將大膽預(yù)言:解放軍的統(tǒng)一之戰(zhàn),會(huì)以這個(gè)名義打響第一槍?

      美軍上將大膽預(yù)言:解放軍的統(tǒng)一之戰(zhàn),會(huì)以這個(gè)名義打響第一槍?

      健身狂人
      2025-10-27 01:01:13
      電商快被小仙女們快逼瘋了?巨型吊牌后續(xù),網(wǎng)上拆吊牌教程已有了

      電商快被小仙女們快逼瘋了?巨型吊牌后續(xù),網(wǎng)上拆吊牌教程已有了

      你食不食油餅
      2025-11-06 14:35:07
      水洗貂皮退貨后續(xù)!商家曝全過(guò)程,顧客買的特價(jià)貂,第7天無(wú)理由

      水洗貂皮退貨后續(xù)!商家曝全過(guò)程,顧客買的特價(jià)貂,第7天無(wú)理由

      奇思妙想草葉君
      2025-11-05 23:48:44
      終于明白,當(dāng)年老王不讓姚振華入股的原因了,原來(lái)是怕發(fā)現(xiàn)……

      終于明白,當(dāng)年老王不讓姚振華入股的原因了,原來(lái)是怕發(fā)現(xiàn)……

      麥小柒
      2025-11-04 14:29:51
      撤銷江北區(qū)渝北區(qū),設(shè)立全新兩江新區(qū)!哪個(gè)板塊將成為大贏家?

      撤銷江北區(qū)渝北區(qū),設(shè)立全新兩江新區(qū)!哪個(gè)板塊將成為大贏家?

      小樹聊房
      2025-11-06 15:03:13
      天吶,這是黃曉明?不得不說(shuō),差點(diǎn)沒(méi)認(rèn)出來(lái)啊

      天吶,這是黃曉明?不得不說(shuō),差點(diǎn)沒(méi)認(rèn)出來(lái)啊

      鄉(xiāng)野小珥
      2025-10-21 14:40:30
      蔡孝乾叛變吳石暴露,李克農(nóng)派出的潛臺(tái)小組,不辱使命絕境立功

      蔡孝乾叛變吳石暴露,李克農(nóng)派出的潛臺(tái)小組,不辱使命絕境立功

      黑句本
      2025-11-03 10:45:13
      王陽(yáng)明悟道:人這一生,所謂的開悟,不過(guò)是想通了3件事

      王陽(yáng)明悟道:人這一生,所謂的開悟,不過(guò)是想通了3件事

      金沛的國(guó)學(xué)筆記
      2025-11-04 15:30:00
      小菲帶一家子到成都吃鮮魚館!筱梅本人超漂亮,玥兒正面像大S!

      小菲帶一家子到成都吃鮮魚館!筱梅本人超漂亮,玥兒正面像大S!

      鄭丁嘉話
      2025-11-06 15:26:14
      2025-11-07 01:11:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11665文章數(shù) 142499關(guān)注度
      往期回顧 全部

      數(shù)碼要聞

      嫌 SD 卡沒(méi)靈魂,微軟前工程師給 40 年前電腦裝90公斤古董硬盤

      頭條要聞

      有報(bào)道稱特朗普要求中方釋放黎智英 外交部回應(yīng)

      頭條要聞

      有報(bào)道稱特朗普要求中方釋放黎智英 外交部回應(yīng)

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂(lè)要聞

      “黑料纏身”的白百何 誰(shuí)給她的勇氣?

      財(cái)經(jīng)要聞

      南銀法巴加速發(fā)展背后:資金饑渴癥待解

      科技要聞

      小鵬機(jī)器人里藏真人?何小鵬發(fā)一鏡到底視頻

      汽車要聞

      是我眼花了么?怎么大猩猩都來(lái)參加新車發(fā)布了?

      態(tài)度原創(chuàng)

      時(shí)尚
      藝術(shù)
      健康
      公開課
      軍事航空

      大衣別這么穿,顯黑又顯胖!

      藝術(shù)要聞

      驚人!一幅畫拍出3.45億,竟然他早已去世62年!真相令人震驚!

      超聲探頭會(huì)加重受傷情況嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國(guó)發(fā)射洲際彈道導(dǎo)彈 俄方回應(yīng)

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 人人爽天天碰天天躁夜夜躁| 国产精品入口麻豆| 国精品无码一区二区三区左线| 国产a在视频线精品视频下载| 国产精品亚洲а∨天堂2021| 国内精品综合九九久久精品| 亚州中文字幕一区二区| 国产成人高清亚洲综合| 亚洲av影院一区二区三区| 国产成人一区二区三区视频免费| 成人午夜福利精品一区二区| 国产精品白浆在线观看免费| 欧产日产国产精品精品| 上司的丰满人妻中文字幕| 成人午夜免费一区二区三区| 东京热人妻无码一区二区av| 亚洲精品免费一二三区| 色婷婷欧美在线播放内射 | 国产熟女一区二区三区蜜臀| 99久久精品国产一区二区暴力| 性欧美乱熟妇xxxx白浆| 久久久精品波多野结衣av| 亚洲国产精品日韩专区av| 日韩精品有码中文字幕| 亚洲高清国产拍精品5G| 日本道高清一区二区三区| 欧美福利在线| 亚洲精品中文字幕码专区| 永吉县| 日本道不卡一二三区视频| a男人的天堂久久a毛片| 欧美s码亚洲码精品m码| 亚洲精品色国语对白在线| 无码内射成人免费喷射| 日韩成人一区二区二十六区| 日本亚洲一区二区精品| 日本一道一区二区视频| 国产老熟女无套内射不卡| 亚洲精品麻豆一二三区| 大尺度国产一区二区视频| 久久精品国产亚洲av麻豆长发|