<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      調(diào)整訓(xùn)練數(shù)據(jù)出場順序大模型就能變聰明!無需擴大模型/數(shù)據(jù)規(guī)模

      0
      分享至

      DELT團隊 投稿
      量子位 | 公眾號 QbitAI

      模型訓(xùn)練重點在于數(shù)據(jù)的數(shù)量與質(zhì)量?其實還有一個關(guān)鍵因素——

      數(shù)據(jù)的出場順序。

      對此,微軟亞洲研究院提出了一種全新的文本數(shù)據(jù)組織范式DELT(Data Efficacy in LM Training),通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,在不同模型尺寸與規(guī)模下都達到了良好性能。



      數(shù)據(jù)效率與效能提升

      該方法用優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來讓語言模型學(xué)得更好,還不用增加數(shù)據(jù)量或擴大模型規(guī)模。

      來看看是怎么做到的。

      訓(xùn)練樣本的組織順序很關(guān)鍵

      首先,我們先來理清幾個概念。

      在語言模型訓(xùn)練中,數(shù)據(jù)使用效率至關(guān)重要?,F(xiàn)有研究多關(guān)注于數(shù)據(jù)效率(Data Efficiency),即如何通過數(shù)據(jù)選擇提升模型訓(xùn)練效率并保持優(yōu)異性能。

      然而,數(shù)據(jù)效能(Data Efficacy),即如何通過數(shù)據(jù)組織增強模型訓(xùn)練表現(xiàn),卻常常被忽視。

      以烹飪?yōu)槔?,?shù)據(jù)效率就像在市場挑選新鮮、合適的食材,而數(shù)據(jù)效能則像名廚把握投放調(diào)料的時機與分寸,讓菜品發(fā)揮出最佳風(fēng)味。

      數(shù)據(jù)組織的重要性

      為了避免過擬合,當前的大語言模型往往在海量數(shù)據(jù)上進行訓(xùn)練,并且訓(xùn)練的次數(shù)非常有限,甚至僅進行一次完整的訓(xùn)練周期(epoch=1),這與早期模型依賴多次迭代訓(xùn)練(epoch>>1)截然不同。

      這些變化讓數(shù)據(jù)呈現(xiàn)的先后順序?qū)Y(jié)果影響巨大

      早期的AI模型類似于讓學(xué)生多次反復(fù)翻閱同一本書,在多輪學(xué)習(xí)中慢慢補齊細節(jié);而現(xiàn)在更像只給一遍通讀,不再反復(fù)回看。

      這就對閱讀順序提出了極高要求,必須精心規(guī)劃學(xué)習(xí)材料出現(xiàn)的先后和結(jié)構(gòu)。因此,訓(xùn)練樣本的組織順序顯得尤為關(guān)鍵。然而,關(guān)于這一點的研究卻很少。

      基于此觀察,微軟亞洲研究院最新提出的文本數(shù)據(jù)組織范式DELT,通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,實現(xiàn)了數(shù)據(jù)的高效利用與效能提升。



      DELT范式不但通過數(shù)據(jù)選擇提升效率,選取高質(zhì)量數(shù)據(jù),加快訓(xùn)練速度;

      而且通過數(shù)據(jù)排序提升效能,在預(yù)訓(xùn)練和后訓(xùn)練階段都顯著提升了模型性能,且適用于通用、數(shù)學(xué)和代碼等多領(lǐng)域任務(wù)。

      給模型按部就班安排訓(xùn)練課程
      數(shù)據(jù)訓(xùn)練效能定義Data Efficacy

      研究首先定義了數(shù)據(jù)訓(xùn)練效能(Data Efficacy),是指通過優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來最大化語言模型的性能表現(xiàn),而無需改變數(shù)據(jù)內(nèi)容或模型架構(gòu)。

      與以往關(guān)注的“數(shù)據(jù)訓(xùn)練效率” (Data Efficiency) 側(cè)重數(shù)據(jù)篩選的研究目的不同,數(shù)據(jù)效能強調(diào)對訓(xùn)練數(shù)據(jù)的評分和排序,以充分挖掘數(shù)據(jù)的潛在價值。

      數(shù)據(jù)順序在語言模型訓(xùn)練中的潛力尚未被充分挖掘, 數(shù)據(jù)效能旨在通過合理的數(shù)據(jù)組織方式,使模型在有限的訓(xùn)練數(shù)據(jù)和資源下實現(xiàn)更高的性能和泛化能力,成為提升語言模型性能的一種新興方法。

      數(shù)據(jù)組織范式DELT介紹



      DELT范式架構(gòu)

      DELT(DataEfficacy inLMTraining)是一種創(chuàng)新的文本數(shù)據(jù)組織范式。

      它集成了數(shù)據(jù)評分(Data Scoring)、數(shù)據(jù)選擇(Data Selection) 和數(shù)據(jù)排序(Data Ordering) 三大核心組件。

      數(shù)據(jù)評分根據(jù)特定的屬性為每個樣本賦予分數(shù),如:難度、質(zhì)量、多樣性等。

      數(shù)據(jù)選擇通過評分篩選出最優(yōu)子集(如:top-k、按閾值篩選等),然后數(shù)據(jù)排序根據(jù)評分重新組織所選擇數(shù)據(jù)的呈現(xiàn)順序(如:基于課程學(xué)習(xí)的分數(shù)從低到高排列)。 為了兼顧數(shù)據(jù)處理效率,DELT范式的數(shù)據(jù)選擇和數(shù)據(jù)排序共用數(shù)據(jù)評分的結(jié)果。

      因此,數(shù)據(jù)評分的規(guī)則設(shè)置非常重要。于是,研究還提出了Learning-Quality Score(LQS)方法。



      LQS打分方式

      該數(shù)據(jù)評分方式結(jié)合了質(zhì)量可學(xué)習(xí)性兩個關(guān)鍵指標,不但可以篩選出低質(zhì)量數(shù)據(jù),而且也能捕捉數(shù)據(jù)在不同階段的訓(xùn)練價值,進一步提供了可靠的數(shù)據(jù)排列順序。

      為了進一步提升數(shù)據(jù)效能,團隊還提出了一種全新的折疊排序方法Folding Ordering(FO)。

      基于課程學(xué)習(xí)的排序(即,按分數(shù)升序排序)可能導(dǎo)致模型遺忘和數(shù)據(jù)內(nèi)部分布偏差。

      折疊排序策略通過多層“折疊”,將數(shù)據(jù)按分數(shù)分層并多次采樣,無重復(fù)且均衡分布。



      Folding排序方式

      相比隨機打亂或單一排序,它既保留難度排序優(yōu)勢,又避免模型過度遺忘或依賴特定數(shù)據(jù),提升了魯棒性和泛化能力。

      與傳統(tǒng)隨機排序方法相比,DELT范式不僅通過減小數(shù)據(jù)規(guī)模提升了訓(xùn)練效率;而且在不同模型尺寸和數(shù)據(jù)規(guī)模下,在各種評測集上都顯著提升了模型性能。



      不同數(shù)據(jù)規(guī)模和模型尺寸下的結(jié)果

      DELT給Data-centric AI領(lǐng)域帶來了全新思路。

      看來,類比于人類教學(xué)實踐,講究個性化與按部就班地安排學(xué)習(xí)內(nèi)容,AI訓(xùn)練也需要類似的學(xué)習(xí)方法。

      論文鏈接:https://arxiv.org/abs/2506.21545
      代碼鏈接:https://github.com/microsoft/DELT

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      調(diào)整!11月6日晚央視直播德國冠軍賽有變,CCTV5、CCTV5+不播乒乓

      調(diào)整!11月6日晚央視直播德國冠軍賽有變,CCTV5、CCTV5+不播乒乓

      林子說事
      2025-11-06 10:52:05
      經(jīng)濟觀察報:國足選洋帥的經(jīng)費僅有150萬美元,遠不及中超名帥

      經(jīng)濟觀察報:國足選洋帥的經(jīng)費僅有150萬美元,遠不及中超名帥

      蘭亭墨未干
      2025-11-06 12:05:02
      是誰導(dǎo)致了美國衰敗?不是“無法無天”的特朗普,也非小布什拜登

      是誰導(dǎo)致了美國衰???不是“無法無天”的特朗普,也非小布什拜登

      軍機Talk
      2025-11-03 15:36:42
      特斯拉一位大股東站出來了:給馬斯克1萬億美元薪酬,我們不同意

      特斯拉一位大股東站出來了:給馬斯克1萬億美元薪酬,我們不同意

      藍色海邊
      2025-11-05 14:34:20
      “早就說過”系列之維爾茨踢左

      “早就說過”系列之維爾茨踢左

      靴室笑談社
      2025-11-06 09:03:44
      他因病不滿足軍銜晉升要求,45歲離休,成最年輕休養(yǎng)員,休養(yǎng)45年

      他因病不滿足軍銜晉升要求,45歲離休,成最年輕休養(yǎng)員,休養(yǎng)45年

      談古論今歷史有道
      2025-11-06 12:00:03
      為什么說福建艦是目前世界上,技術(shù)最先進戰(zhàn)斗力最強大的航母?

      為什么說福建艦是目前世界上,技術(shù)最先進戰(zhàn)斗力最強大的航母?

      歷史有些冷
      2025-11-04 19:25:02
      哈蘭德有什么特別之處?瓜帥:我不知道,因為我本來就不知道

      哈蘭德有什么特別之處?瓜帥:我不知道,因為我本來就不知道

      懂球帝
      2025-11-06 06:38:10
      千島湖困局未徹底解決:鰱鳙放養(yǎng)60多年,“保水魚”保住了什么?

      千島湖困局未徹底解決:鰱鳙放養(yǎng)60多年,“保水魚”保住了什么?

      體育小柚
      2025-11-04 17:46:01
      之前有多囂張,現(xiàn)在就有多狼狽,馬克龍態(tài)度急轉(zhuǎn),中方會答應(yīng)嗎

      之前有多囂張,現(xiàn)在就有多狼狽,馬克龍態(tài)度急轉(zhuǎn),中方會答應(yīng)嗎

      一口娛樂
      2025-11-06 11:30:39
      女子水洗貂退貨后續(xù):老板娘起訴了,買家已社會性死亡,底褲被扒

      女子水洗貂退貨后續(xù):老板娘起訴了,買家已社會性死亡,底褲被扒

      觀察鑒娛
      2025-11-06 10:00:08
      女子在診所拍下感人一幕,妻子輸液時,像個孩子一樣靠在丈夫懷里!

      女子在診所拍下感人一幕,妻子輸液時,像個孩子一樣靠在丈夫懷里!

      張曉磊
      2025-11-03 09:51:21
      你談過最拉胯的男朋友是啥樣?網(wǎng)友:對女人來說,錢才是最重要的

      你談過最拉胯的男朋友是啥樣?網(wǎng)友:對女人來說,錢才是最重要的

      帶你感受人間冷暖
      2025-11-04 00:05:11
      北大畢業(yè)生考取輔警?轉(zhuǎn)正后工資5111元至6839元 網(wǎng)友認為這是“大材小用”

      北大畢業(yè)生考取輔警?轉(zhuǎn)正后工資5111元至6839元 網(wǎng)友認為這是“大材小用”

      閃電新聞
      2025-11-06 12:41:51
      1958年,哪五位高級干部批粟最積極?陳老總為何發(fā)言很多?

      1958年,哪五位高級干部批粟最積極?陳老總為何發(fā)言很多?

      柳絮憶史
      2025-10-29 08:46:07
      中央宣講團成員,已赴多個省份

      中央宣講團成員,已赴多個省份

      政知新媒體
      2025-11-05 22:42:32
      京津冀6校名聲臭到爆,被人民日報點名曝光,畢業(yè)證徹底沒價值

      京津冀6校名聲臭到爆,被人民日報點名曝光,畢業(yè)證徹底沒價值

      戶外阿毽
      2025-11-06 11:12:08
      毛主席視察天津時想見李銀橋,得知他已經(jīng)入獄,偉人只說了2個字

      毛主席視察天津時想見李銀橋,得知他已經(jīng)入獄,偉人只說了2個字

      南書房
      2025-09-28 23:01:03
      當楊振寧在斯德哥爾摩領(lǐng)獎時,全世界都看到杜致禮的微笑

      當楊振寧在斯德哥爾摩領(lǐng)獎時,全世界都看到杜致禮的微笑

      城事錄主
      2025-11-06 05:00:03
      張柏芝被廚子氣出隱疾的瓜

      張柏芝被廚子氣出隱疾的瓜

      熱鬧吃瓜大姐
      2025-11-04 21:11:14
      2025-11-06 13:35:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態(tài)
      11633文章數(shù) 176326關(guān)注度
      往期回顧 全部

      科技要聞

      蘋果“認輸”!曝每年10億美元租用谷歌AI

      頭條要聞

      副院長被指出軌女主任醫(yī)師 在值班室發(fā)生關(guān)系視頻流出

      頭條要聞

      副院長被指出軌女主任醫(yī)師 在值班室發(fā)生關(guān)系視頻流出

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      白百何好友揭露爭獎細節(jié)

      財經(jīng)要聞

      特朗普關(guān)稅遭美國高院大法官輪番質(zhì)疑

      汽車要聞

      方向盤?不存在的 特斯拉 Cybercab亞太首秀

      態(tài)度原創(chuàng)

      手機
      親子
      本地
      公開課
      軍事航空

      手機要聞

      vivo S50 系列手機入網(wǎng),支持 90W 快充

      親子要聞

      胡圖圖幼小銜接采取積分制,表現(xiàn)好就加分

      本地新聞

      這屆干飯人,已經(jīng)把博物館吃成了食堂

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國發(fā)射洲際彈道導(dǎo)彈 俄方回應(yīng)

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 日韩精品一区二区三区日韩| 亚洲乱熟女一区二区三区| 少妇av一区二区三区无码| 亚洲美免无码中文字幕在线 | 精品久久人人做爽综合| 无码人妻精品一区二区三区66| 国产精品三级中文字幕| 人妻少妇精品视频专区| 隆回县| 少妇爽到爆视频网站免费| 欧美大胆老熟妇乱子伦视频| 亚洲精品无码久久一线| 国产一区二区三区内射高清| 亚洲av专区一区| 国产999久久高清免费观看| 伊人久久大香线蕉综合网| 中文字幕一区日韩精品| 亚洲成av人片无码不卡播放器 | 91老肥熟女九色老女人| 亚洲十八禁一区二区三区| 中文字幕亚洲综合久久| 三上悠亚精品一区二区久久| 成人国产精品日本在线观看| 亚洲一区二区三区水蜜桃| 国产成人人综合亚洲欧美丁香花 | 老子午夜精品无码| 乱人伦人妻精品一区二区| 又粗又硬又黄a级毛片| 国产精品人妻系列21p| 九色综合狠狠综合久久| 云阳县| 婷婷丁香五月亚洲中文字幕| 久久国产精品波多野结衣| 国产精品国产三级国产午| 欧洲性开放老太大| 欧美精品一区二区三区在线观看| 亚洲三级香港三级久久| 在线观看免费人成视频色| 激情综合网激情五月激情| 亚洲成av人片在www鸭子| 国产精品一区中文字幕|