<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      大模型推理學(xué)習(xí)新范式!ExGRPO框架:從盲目刷題到聰明復(fù)盤

      0
      分享至

      大模型在強(qiáng)化學(xué)習(xí)過程中,終于知道什么經(jīng)驗(yàn)更寶貴了!

      來自上海人工智能實(shí)驗(yàn)室、澳門大學(xué)、南京大學(xué)和香港中文大學(xué)的研究團(tuán)隊(duì),最近提出了一套經(jīng)驗(yàn)管理和學(xué)習(xí)框架ExGRPO——

      通過科學(xué)地識(shí)別、存儲(chǔ)、篩選和學(xué)習(xí)有價(jià)值的經(jīng)驗(yàn),讓大模型在優(yōu)化推理能力的道路上,走得更穩(wěn)、更快、更遠(yuǎn)。



      實(shí)驗(yàn)結(jié)果顯示,與傳統(tǒng)的在線策略RLVR(基于可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí))方法相比,ExGRPO在不同基準(zhǔn)上均帶來了一定程度的性能提升。

      尤其在一些極具挑戰(zhàn)性的任務(wù)(如AIME數(shù)學(xué)競(jìng)賽題)上,提升效果更為明顯,證明了ExGRPO在攻克復(fù)雜推理難題上的有效性。

      而且該研究也揭示了一些有趣的現(xiàn)象,比如滾雪球效應(yīng)。

      不過在展開之前,我們先來回答一個(gè)核心問題——

      大模型推理的下一步,為什么我們需要“經(jīng)驗(yàn)驅(qū)動(dòng)”的訓(xùn)練方法?

      2025年初以來,賦能大模型推理能力的技術(shù)路線以基于可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Verifiable Rewards)為主導(dǎo)。

      簡(jiǎn)單來說,就是讓模型像個(gè)學(xué)生一樣,不斷地“刷題”(生成推理步驟),然后由“判卷老師”(獎(jiǎng)勵(lì)模型)來打分,模型根據(jù)分?jǐn)?shù)高低調(diào)整自己的“解題思路”。

      但RLVR存在一個(gè)天然缺陷:經(jīng)驗(yàn)浪費(fèi)

      在標(biāo)準(zhǔn)的RLVR訓(xùn)練中,模型生成的推理軌跡(Rollouts)只會(huì)被使用一次,之后就被丟棄。這意味著模型從來不會(huì)回頭復(fù)盤,甚至不記得自己是如何答對(duì)或答錯(cuò)的。

      以現(xiàn)實(shí)世界作比,它們像一個(gè)只做新題、從不復(fù)習(xí)的學(xué)生。每當(dāng)模型做完一道題,無論這道題的解法多么精妙、多么有啟發(fā)性,都可能都會(huì)在一次參數(shù)更新后,把這次寶貴的“解題經(jīng)驗(yàn)”忘得一干二凈。

      這種“學(xué)完就忘”的模式,由于Rollout代價(jià)昂貴不僅導(dǎo)致了計(jì)算資源浪費(fèi),也讓訓(xùn)練過程變得非常不穩(wěn)定。

      因此,學(xué)會(huì)“溫故而知新”,讓模型根據(jù)“錯(cuò)題本”,把每一次寶貴的成功經(jīng)驗(yàn)都內(nèi)化為自己的能力對(duì)訓(xùn)練效率和能力提升都至關(guān)重要。

      值得注意的是,強(qiáng)化學(xué)習(xí)著名學(xué)者David Silver和Richard S. Sutton在《Welcome to the Era of Experience》的Position Paper中提到:

      • 人類數(shù)據(jù)正在用盡,經(jīng)驗(yàn)將是下一個(gè)超級(jí)數(shù)據(jù)源,是能夠?yàn)锳I帶來能力提升的下一個(gè)突破口。

      但是,一個(gè)看似簡(jiǎn)單卻被忽視的問題是:

      既然經(jīng)驗(yàn)這么重要,那么什么樣的經(jīng)驗(yàn)才值得反復(fù)學(xué)習(xí)?在大模型全面鋪開應(yīng)用的當(dāng)下,面對(duì)經(jīng)驗(yàn)這個(gè)超級(jí)數(shù)據(jù)源的增長(zhǎng),其量級(jí)和高復(fù)雜性之高是我們不得不考慮的因素。

      針對(duì)這一挑戰(zhàn),ExGRPO框架應(yīng)運(yùn)而生。




      圖1. 主流人工智能范式的簡(jiǎn)要時(shí)間軸示意圖。縱軸表示該領(lǐng)域總投入和計(jì)算資源中專注于強(qiáng)化學(xué)習(xí)(RL)的比例。截取自David Silver, Richard S. Sutton. Welcome to the Era of Experience.

      什么樣的“經(jīng)驗(yàn)”才是好經(jīng)驗(yàn)?

      在設(shè)計(jì)一個(gè)“復(fù)習(xí)”系統(tǒng)前,我們首先要搞清楚一個(gè)根本問題:

      對(duì)一個(gè)正在學(xué)習(xí)推理的模型來說,什么樣的“解題經(jīng)驗(yàn)”才是最有價(jià)值的?是不是所有做對(duì)的題目都值得反復(fù)回味?

      為了找到答案,該工作進(jìn)行了一系列有趣的探索性實(shí)驗(yàn)(見圖2),并發(fā)現(xiàn),一份“高質(zhì)量”的經(jīng)驗(yàn),其價(jià)值體現(xiàn)在兩個(gè)關(guān)鍵維度上:問題的難度解題路徑的質(zhì)量

      問題的甜蜜點(diǎn):中等難度的問題

      作者把模型在訓(xùn)練中遇到的問題,根據(jù)它當(dāng)下的“正確率”動(dòng)態(tài)地分成了三類:簡(jiǎn)單題(正確率>75%)、中等題(25%-75%)和難題(<25%)。

      然后,分別只用這三類問題來進(jìn)行On-Policy RLVR訓(xùn)練模型。

      結(jié)果一目了然:只刷“中等難度”問題的模型,最終性能提升最大

      這也符合一般直覺,簡(jiǎn)單題模型通常已經(jīng)掌握了,反復(fù)練習(xí)邊際效益遞減,容易“學(xué)廢”;對(duì)于難題,遠(yuǎn)超模型當(dāng)前能力,強(qiáng)行學(xué)習(xí)容易讓模型“受挫”,產(chǎn)生胡亂猜測(cè)的壞習(xí)慣。

      而中等難度的題恰好處于模型的最近發(fā)展區(qū),既有挑戰(zhàn)性,又能通過努力解決,是學(xué)習(xí)效率最高的甜蜜點(diǎn)。

      解題路徑的“自信度”:低熵軌跡

      另一方面,同樣是做對(duì)一道題,解題過程(下文也稱為軌跡)的質(zhì)量也千差萬(wàn)別。

      有的解法思路清晰、一步到位;有的則繞來繞去、充滿了不確定性,甚至可能是蒙對(duì)的。如何量化這種解題思路的質(zhì)量呢?

      外部的強(qiáng)模型也許是一個(gè)選擇,但是在訓(xùn)練中使用代價(jià)過高并且會(huì)拖慢速度。

      為了找到可靠的在線代理指標(biāo),作者以較強(qiáng)能力的Qwen3-32B模型作為參考:評(píng)價(jià)推理過程的對(duì)錯(cuò),并看看有沒有內(nèi)源性的在線指標(biāo)能夠和外部Judge的判斷正相關(guān)。

      在此,作者發(fā)現(xiàn)推理軌跡的Token平均熵是一個(gè)優(yōu)秀的指標(biāo),在所有做對(duì)的題目中,那些推理過程邏輯更正確的解法,其對(duì)應(yīng)的熵值顯著更低。

      進(jìn)一步地,高熵軌跡很多時(shí)候只是幸運(yùn)的瞎猜,反復(fù)學(xué)習(xí)這些軌跡不僅沒有幫助,反而可能污染模型的邏輯能力。




      圖2:模型經(jīng)驗(yàn)=問題+對(duì)應(yīng)推理過程。什么才是“好問題”和“好推理過程”? (a) 使用中等難度問題訓(xùn)練的模型性能最佳。(b) 邏輯正確的推理過程通常表現(xiàn)出更低的熵值。 (c) 中等難度推理正確的熵值也更密集于低熵值區(qū)域。

      這樣符合我們的認(rèn)知直覺:在人類學(xué)習(xí)中,難度適中的題目、邏輯清晰的解法,往往是最高效的學(xué)習(xí)材料。太簡(jiǎn)單的題目讓人停滯不前,太難的題目則令人無從下手。

      ExGRPO框架: 為模型打造的“高價(jià)值錯(cuò)題本+溫習(xí)系統(tǒng)”

      基于上述洞見,作者設(shè)計(jì)了ExGRPO框架,包含了兩個(gè)核心部件:經(jīng)驗(yàn)管理和混合經(jīng)驗(yàn)優(yōu)化。

      △圖3:ExGRPO框架概覽:經(jīng)驗(yàn)管理 + 策略優(yōu)化

      經(jīng)驗(yàn)管理:精挑細(xì)選,分類歸檔

      作者將模型經(jīng)驗(yàn)定義為問題+對(duì)應(yīng)推理過程,分兩個(gè)層級(jí)進(jìn)行經(jīng)驗(yàn)的管理和挑選,具體它分為三步:

      1、經(jīng)驗(yàn)收集:ExGRPO會(huì)建立一個(gè)“經(jīng)驗(yàn)回放池”,像一個(gè)巨大的“錯(cuò)題本”,專門收集模型在訓(xùn)練過程中所有成功的推理案例。這也是傳統(tǒng)強(qiáng)化學(xué)習(xí)和先前相關(guān)工作中均擁有的基礎(chǔ)機(jī)制。

      2、經(jīng)驗(yàn)劃分與存儲(chǔ):根據(jù)每個(gè)問題最新的“在線正確率”,將經(jīng)驗(yàn)池中的問題動(dòng)態(tài)地劃分到不同的“難度分區(qū)”里。這就像給錯(cuò)題本按章節(jié)和難度進(jìn)行分類。這樣,所有經(jīng)驗(yàn)都被貼上了“簡(jiǎn)單”、“中等”、“困難”的標(biāo)簽,管理起來一目了然。

      同時(shí),為了防止模型在簡(jiǎn)單問題上“刷分”而產(chǎn)生過擬合,ExGRPO還擁有一個(gè)“退休機(jī)制”(Retired Set),將模型已經(jīng)完全掌握(例如連續(xù)多次全部成功解答)的問題移出學(xué)習(xí)隊(duì)列,讓模型始終聚焦于更具挑戰(zhàn)性的任務(wù)。

      3、經(jīng)驗(yàn)篩選:按照之前分析實(shí)驗(yàn)得到的啟示和洞見,ExGRPO從兩個(gè)層次挑選經(jīng)驗(yàn):

      • 問題篩選:利用高斯分布概率模型,有偏地優(yōu)先從中等難度的分組中抽取問題。這樣能確保模型總是在學(xué)習(xí)效率最高的甜蜜點(diǎn)上。
      • 軌跡篩選:對(duì)于選出的問題,如果它歷史上有多個(gè)成功解法,只挑選出當(dāng)前模型看來熵最低的那一個(gè),也就是最篤定清晰的那個(gè)解法。

      通過這套精細(xì)化管理,確保了每次復(fù)習(xí)的都是最高質(zhì)量的黃金經(jīng)驗(yàn)。

      混合策略優(yōu)化目標(biāo):溫故而知新

      選好了復(fù)習(xí)材料,接下來就是如何復(fù)習(xí)經(jīng)驗(yàn)了。

      ExGRPO采用了一種混合策略的優(yōu)化目標(biāo),除了對(duì)重要性采樣進(jìn)行修正外,在每一次訓(xùn)練迭代中,Mini-Batch中一部分計(jì)算資源用于讓模型探索全新的問題(On-policy),另一部分則用于學(xué)習(xí)從經(jīng)驗(yàn)池中精心篩選出的經(jīng)驗(yàn)(Off-policy)。

      巧妙地平衡了探索新知(On-Policy Exploration)和復(fù)習(xí)舊識(shí)(Experience Exploitation)。




      圖4:ExGRPO混合策略優(yōu)化目標(biāo)。ρ代表經(jīng)驗(yàn)在Mini-Batch優(yōu)化中的混合比例。

      這種“一半時(shí)間學(xué)新,一半時(shí)間復(fù)習(xí)”的模式,讓模型既能不斷拓展認(rèn)知邊界,又能持續(xù)鞏固和內(nèi)化已有的成功經(jīng)驗(yàn),從而在保證訓(xùn)練穩(wěn)定性的同時(shí),極大地提升了學(xué)習(xí)效率。

      此外,作者還引入了策略塑形(Policy Shaping)機(jī)制,確保模型在復(fù)習(xí)過往成功經(jīng)驗(yàn)時(shí),不會(huì)變得過于僵化,喪失探索創(chuàng)新的能力。

      ExGRPO實(shí)驗(yàn)結(jié)果和分析:更強(qiáng)、更穩(wěn)、更高效

      作者在6個(gè)不同規(guī)模(1.5B到8B)和架構(gòu)(Qwen、Llama)的模型(Base、Instruct)上,對(duì)ExGRPO進(jìn)行了全面的測(cè)試,涵蓋了從AIME、MATH等數(shù)學(xué)推理的 benchmark,到GPQA、MMLU-Pro等通用推理benchmark。

      與傳統(tǒng)的在線策略RLVR方法相比,平均所有模型和測(cè)試集,ExGRPO相對(duì)于On-Policy方法(Dr. GRPO),分別帶來了+3.5和+7.6個(gè)點(diǎn)的分布內(nèi)、分布外性能提升。

      尤其在一些極具挑戰(zhàn)性的任務(wù)(如AIME數(shù)學(xué)競(jìng)賽題)上,提升效果更為明顯,證明了ExGRPO在攻克復(fù)雜推理難題上的有效性。

      △表1:ExGRPO在多個(gè)數(shù)學(xué)與通用推理基準(zhǔn)上的性能表現(xiàn)

      △圖5:ExGRPO在不同模型架構(gòu)和尺寸上的泛化能力

      • 賦能強(qiáng)模型

      即使是在已經(jīng)很強(qiáng)的模型(如經(jīng)過外部R1軌跡數(shù)據(jù)作為RLVR引導(dǎo)的LUFFY)上進(jìn)行持續(xù)學(xué)習(xí),ExGRPO依然能帶來穩(wěn)定的性能增益,而標(biāo)準(zhǔn)的在線RL方法反而會(huì)導(dǎo)致性能下降。

      • “救活”弱模型

      此外,作者發(fā)現(xiàn)對(duì)于像Llama-3.1 8B Base基模,由于其初始推理能力較弱,標(biāo)準(zhǔn)的On-Policy強(qiáng)化學(xué)習(xí)方法根本無法進(jìn)行有效訓(xùn)練,很快就會(huì)訓(xùn)練崩潰。

      而ExGRPO憑借其經(jīng)驗(yàn)回放機(jī)制,能夠捕捉到早期偶然的lucky hits,并將其作為寶貴的學(xué)習(xí)信號(hào)反復(fù)利用,最終成功地將模型“救活”并穩(wěn)定地提升其性能。




      圖6:在Llama-3.1 8B訓(xùn)練過程中On-Policy與ExGRPO的學(xué)習(xí)動(dòng)態(tài)對(duì)比。ExGRPO能夠穩(wěn)定訓(xùn)練并獲得更高的獎(jiǎng)勵(lì),而On-Policy則容易出現(xiàn)訓(xùn)練崩潰。

      此外,該研究也揭示了一些有趣的現(xiàn)象,比如滾雪球效應(yīng)。高熵的經(jīng)驗(yàn)中,經(jīng)常包含著一些看似正確但邏輯上有瑕疵的步驟(比如在數(shù)學(xué)題里濫用代碼塊來黑箱計(jì)算)。

      如果讓模型反復(fù)學(xué)習(xí)這些經(jīng)驗(yàn),就會(huì)像滾雪球一樣,讓錯(cuò)誤的推理習(xí)慣根深蒂固。ExGRPO的經(jīng)驗(yàn)篩選機(jī)制,切斷了這種錯(cuò)誤學(xué)習(xí)的路徑。

      迎接“經(jīng)驗(yàn)即媒介”的AI新時(shí)代

      正如強(qiáng)化學(xué)習(xí)領(lǐng)域的先驅(qū)David Silver和Richard Sutton所言:

      • 我們正處于一個(gè)新時(shí)期的風(fēng)口浪尖,在這個(gè)時(shí)期,經(jīng)驗(yàn)將成為能力提升的主要媒介。

      團(tuán)隊(duì)表示,ExGRPO的核心貢獻(xiàn),是為模型推理能力的提升,提供了一套系統(tǒng)性的、基于經(jīng)驗(yàn)的學(xué)習(xí)框架。有理由相信, Principled Experience Management(有原則的經(jīng)驗(yàn)管理)將成為未來構(gòu)建更強(qiáng)大、更高效的AI模型訓(xùn)練生態(tài)中的關(guān)鍵一環(huán)。

      它不再讓寶貴的成功經(jīng)驗(yàn)付諸東流,而是通過智能地識(shí)別、管理和重放高價(jià)值經(jīng)驗(yàn),像錯(cuò)題本一般,讓模型真正擁有了“溫故而知新”的能力。

      這不僅顯著提升了訓(xùn)練的效率和穩(wěn)定性,也為我們打開了通往更強(qiáng)大、更通用的人工智能的一扇新窗。

      論文:https://arxiv.org/pdf/2510.02245
      Code:https://github.com/ElliottYan/LUFFY/tree/main/ExGRPO
      模型:https://huggingface.co/collections/rzzhan/exgrpo-68d8e302efdfe325187d5c96

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      返回時(shí)間已定!神舟二十號(hào)快速返回:比神舟十二縮短15小時(shí)

      返回時(shí)間已定!神舟二十號(hào)快速返回:比神舟十二縮短15小時(shí)

      火星一號(hào)
      2025-11-04 21:46:57
      有一個(gè)拎不清的親戚是啥體驗(yàn)?網(wǎng)友:看得我肺都要?dú)庹?>
    </a>
        <h3>
      <a href=解讀熱點(diǎn)事件
      2025-10-25 00:10:08
      湖南省人民醫(yī)院院長(zhǎng)肖亞洲的人生歷程

      湖南省人民醫(yī)院院長(zhǎng)肖亞洲的人生歷程

      筆墨V
      2025-11-06 08:59:58
      董路:不知邵佳一是否正直,他和李鐵曾是哥們,但不會(huì)犯同樣錯(cuò)誤

      董路:不知邵佳一是否正直,他和李鐵曾是哥們,但不會(huì)犯同樣錯(cuò)誤

      風(fēng)過鄉(xiāng)
      2025-11-06 10:55:20
      趙少康“大罷免”亮票2次,遭臺(tái)北地檢署起訴:從重量刑

      趙少康“大罷免”亮票2次,遭臺(tái)北地檢署起訴:從重量刑

      海峽導(dǎo)報(bào)社
      2025-11-06 11:55:13
      中國(guó)空軍未來5年面臨很大的換裝壓力

      中國(guó)空軍未來5年面臨很大的換裝壓力

      流云青史
      2025-11-04 16:42:47
      山姆被罵上熱搜!800萬(wàn)會(huì)員抵制阿里高管,集體喊退卡

      山姆被罵上熱搜!800萬(wàn)會(huì)員抵制阿里高管,集體喊退卡

      吃瓜局
      2025-11-05 15:22:55
      不是玄學(xué)!明日立冬,最旺自己的5件事,別忘了告訴家人

      不是玄學(xué)!明日立冬,最旺自己的5件事,別忘了告訴家人

      白宸侃片
      2025-11-06 09:06:11
      曝妻兒3人被發(fā)小殺害真相,飯桌聊黃金遭惦記,百日祭現(xiàn)反常一幕

      曝妻兒3人被發(fā)小殺害真相,飯桌聊黃金遭惦記,百日祭現(xiàn)反常一幕

      壹月情感
      2025-11-05 21:24:33
      兩家冷卻液供應(yīng)商回應(yīng)理想MEGA召回事件

      兩家冷卻液供應(yīng)商回應(yīng)理想MEGA召回事件

      中國(guó)能源網(wǎng)
      2025-11-04 12:54:07
      國(guó)家重拳整治!四類退休人員成重點(diǎn),一個(gè)逃不掉

      國(guó)家重拳整治!四類退休人員成重點(diǎn),一個(gè)逃不掉

      慧眼看世界哈哈
      2025-11-06 05:46:35
      來得真快,越南偷建21座人工島,中方要逮四條大魚,南海混戰(zhàn)開始

      來得真快,越南偷建21座人工島,中方要逮四條大魚,南海混戰(zhàn)開始

      花花娛界
      2025-11-06 11:09:42
      中俄談妥了,米舒斯京離開人民大會(huì)堂,臨走前簽字,美國(guó)怕啥來啥

      中俄談妥了,米舒斯京離開人民大會(huì)堂,臨走前簽字,美國(guó)怕啥來啥

      臨云史策
      2025-11-06 13:10:24
      如果在家突發(fā)心梗,黃金5分鐘自救法,快了解,關(guān)鍵時(shí)刻可自救

      如果在家突發(fā)心梗,黃金5分鐘自救法,快了解,關(guān)鍵時(shí)刻可自救

      風(fēng)信子的花
      2025-10-24 23:59:39
      喝酒四巨頭:不到兩年全沒,有的去世當(dāng)天喝4瓶白酒,最小的才26

      喝酒四巨頭:不到兩年全沒,有的去世當(dāng)天喝4瓶白酒,最小的才26

      墨印齋
      2025-09-22 10:00:58
      突然刷屏:“退卡、差評(píng)!”山姆深夜回應(yīng)

      突然刷屏:“退卡、差評(píng)!”山姆深夜回應(yīng)

      每日經(jīng)濟(jì)新聞
      2025-11-04 14:01:07
      社評(píng):別讓安世事件成為歐洲市場(chǎng)經(jīng)濟(jì)的污點(diǎn)

      社評(píng):別讓安世事件成為歐洲市場(chǎng)經(jīng)濟(jì)的污點(diǎn)

      環(huán)球網(wǎng)資訊
      2025-11-04 23:33:02
      荷蘭急瘋了自捅一刀!全面禁止對(duì)中國(guó)DUV設(shè)備出口后,ASML一夜蒸發(fā)8%

      荷蘭急瘋了自捅一刀!全面禁止對(duì)中國(guó)DUV設(shè)備出口后,ASML一夜蒸發(fā)8%

      億通電子游戲
      2025-11-06 12:53:50
      11月6日全紅嬋收官戰(zhàn),預(yù)賽不敵陳芋汐組合!晚間決戰(zhàn),CCTV5直播

      11月6日全紅嬋收官戰(zhàn),預(yù)賽不敵陳芋汐組合!晚間決戰(zhàn),CCTV5直播

      鄉(xiāng)野小珥
      2025-11-06 13:30:12
      鄰居藏獒偷肉他不管,我每天喂它血肉,出差半月后警察:你鄰居死了

      鄰居藏獒偷肉他不管,我每天喂它血肉,出差半月后警察:你鄰居死了

      懸案解密檔案
      2025-10-13 10:40:42
      2025-11-06 14:11:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      11633文章數(shù) 176326關(guān)注度
      往期回顧 全部

      科技要聞

      蘋果“認(rèn)輸”!曝每年10億美元租用谷歌AI

      頭條要聞

      女星安吉麗娜朱莉訪烏 隨身保鏢被烏軍征兵處抓走服役

      頭條要聞

      女星安吉麗娜朱莉訪烏 隨身保鏢被烏軍征兵處抓走服役

      體育要聞

      送走兩位全明星,公牛成了東部第一

      娛樂要聞

      白百何好友揭露爭(zhēng)獎(jiǎng)細(xì)節(jié)

      財(cái)經(jīng)要聞

      特朗普關(guān)稅遭美國(guó)高院大法官輪番質(zhì)疑

      汽車要聞

      方向盤?不存在的 特斯拉 Cybercab亞太首秀

      態(tài)度原創(chuàng)

      旅游
      家居
      手機(jī)
      房產(chǎn)
      公開課

      旅游要聞

      安徽黃山:峰林盡染秋意濃

      家居要聞

      別樣府院 暢享詩(shī)意生活

      手機(jī)要聞

      華為 Mate 70 Air 中框采用高分子與金屬?gòu)?fù)合材料一體成型工藝

      房產(chǎn)要聞

      中旅·三亞藍(lán)灣,以一座城市會(huì)客廳回應(yīng)世界的濱海想象

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产乱子影视频上线免费观看| 东京热人妻丝袜无码AV一二三区观| 少妇高潮喷水在线观看| AV无码不卡一区二区三区| 欧美怡春院一区二区三区| 国产视频 视频一区二区| 国产精品久久国产精麻豆99网站| 中文文字幕文字幕亚洲色| 一区二区三区在线 | 欧洲| 亚洲欧洲色图片网站| 国产偷国产偷亚洲高清人| 成人啪精品视频网站午夜| 国产精品免费看久久久| 国产麻豆一区二区精彩视频| 国产欧美精品区一区二区三区 | 91高清免费国产自产拍| 融水| 在线天堂最新版资源| 日韩毛片在线视频x| 高潮射精日本韩国在线播放| 久久精品国产亚洲夜色AV网站| 大尺度国产一区二区视频| 亚洲av无在线播放中文| 中文字幕熟妇人妻在线视频| 国产360激情盗摄全集| 韩国V欧美V亚洲V日本V| 人妻少妇偷人无码视频| 国产中文字幕精品喷潮| 在线高清免费不卡全码| 日本黄色三级一区二区三区| 好了av四色综合无码| 久久人妻国产精品| 国产成人无码性教育视频| 欧美性潮喷xxxxx免费视频看| 国产日韩精品欧美一区灰 | 99久久99久久久精品久久| 高清偷拍一区二区三区| 在线高清免费不卡全码| 久久亚洲精品情侣| 国产成人午夜福利精品| 成人一区二区人妻不卡视频|