<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      LLM能替代數據科學家了?DeepAnalyze幫你告別手動分析數據

      0
      分享至

      • DeepAnalyze團隊 投稿
        量子位 | 公眾號 QbitAI

      你是否還在為復雜的文件和海量數據而苦惱?是否希望能夠自動從數據中挖掘出真正有價值的信息?

      最近,來自人大與清華的研究團隊推出DeepAnalyze —— 你的專屬「數據科學家」。只需一個指令,它便能自動化分析你的數據、自主完成各類數據科學任務:

      • 數據任務:支持自動化數據準備、數據分析、數據建模、數據可視化、數據洞察
      • 數據研究:可在非結構化數據、半結構化數據、結構化數據中進行開放式深度研究,生成研究報告



      DeepAnalyze是首個面向數據科學的Agentic LLM,無需任何workflow,僅憑一個LLM即可像數據科學家一樣,自主完成多種復雜的數據任務。

      DeepAnalyze的論文、代碼、模型、數據均已開源,收獲1.1K+GitHub星標,歡迎大家體驗!

      DeepAnalyze —— 你的專屬「數據科學家」

      DeepAnalyze在環境中自主編排和優化各種操作,完成復雜的數據科學任務。

      DeepAnalyze在真實環境中學習復雜任務

      數據無處不在,而數據科學一直被視為人類智能的重要體現。從Kaggle比賽到日常的數據分析實踐,大量評測都在考察數據科學家在數據準備、分析、建模、可視化與洞察等方面的綜合能力。

      當前的數據智能體(Data Agent)通常依賴人工設計的workflow,來驅動大模型完成特定的數據分析與可視化任務。雖然在各類單點任務上已取得了令人矚目的成果,但由于LLM的自主性仍然有限,它們距離理想的“全能自主數據科學家”依然存在明顯差距。

      隨著大型語言模型智能水平的不斷提升,一個關鍵問題也愈發突出:如何讓LLM真正具備自主完成復雜數據科學任務的能力?



      DeepAnalyze通過在真實環境中訓練,學會自主編排、自適應優化操作,最終完成復雜的數據科學任務。為實現此,DeepAnalyze提出課程學習式Agentic訓練范式(Curriculum-based Agentic Training ofDeepAnalyze)和面向數據的軌跡合成框架(Data-grounded Trajectory Synthesis)。

      課程學習式Agentic訓練

      數據科學任務本身具有高度復雜性,這讓基礎LLM在早期訓練階段往往難以順利完成任務。任務復雜性導致模型幾乎得不到正向獎勵信號(即“獎勵稀疏”問題),強化學習過程容易停滯,甚至出現訓練崩潰的情況。

      為了解決這一難題,DeepAnalyze提出了「課程學習式 Agentic 訓練」。其模擬人類數據科學家的學習路徑,讓LLM在真實環境中從簡單到復雜、從單一任務到綜合任務逐步進階。通過這種漸進式訓練,模型的能力得以穩步提升,避免在復雜任務中因為“獎勵信號為零”而導致學習失敗。

      訓練過程包括兩大階段:

      • 單能力微調:
      • 訓練LLM在代碼生成、結構化數據理解、邏輯推理等方面的基礎能力;
      • 多能力Agentic訓練:
      • 在真實任務環境中,讓LLM學會運用多種能力,像數據科學家一樣自主完成復雜任務。

      面向數據的軌跡合成

      在數據科學領域,缺乏完整的長鏈問題求解軌跡,這讓LLM在探索解題空間時缺乏有效指導,只能進行低效、盲目的“試錯式”探索,難以獲得有意義的中間監督信號。

      為了解決這一難題,DeepAnalyze提出了「面向數據的軌跡合成」方法。其能夠自動合成50萬條數據科學推理與環境交互數據,為大模型在龐大的搜索空間中提供正確路徑的示范和引導。

      數據合成包含兩個關鍵部分:

      • 推理軌跡合成:
      • 基于現有的 TableQA、結構化知識理解、數據科學代碼生成任務,構建帶有完整推理路徑的訓練數據;
      • 交互軌跡合成:
      • 構建多智能體系統,從結構化數據源(如Spider和BIRD)中自動合成數據科學交互軌跡,提供和真實環境的交互軌跡。

      DeepAnalyze支持面向數據的深度研究

      DeepAnalyze支持面向數據的深度研究,能夠自動生成具備分析師水準的研究報告。
      在數據研究報告生成任務中,無論是內容深度還是報告結構,DeepAnalyze的表現都顯著優于現有的閉源LLM。



      分析報告:



      作者介紹



      張紹磊,中國人民大學信息學院助理教授,位于中國人民大學講席教授范舉教授團隊。

      他博士畢業于中國科學院計算技術研究所,導師為馮洋研究員。他的研究方向涵蓋大語言模型、多模態大模型、AI for Data Science。

      相關研究成果在NeurIPS、ACL、ICLR等國際人工智能與自然語言處理會議發表論文30余篇,開源的多語言大模型、多模態大模型、數據科學大模型在GitHub社區累計獲得5000+星標。

      他長期擔任CCF-A類國際會議ACL ARR的領域主席和責任編輯。個人主頁:zhangshaolei1998@github.io。



      范舉,中國人民大學教授、博士生導師,國家級青年人才,中國計算機學會數據庫專委會、大數據專委會執行委員。

      研究方向包括:數據治理技術與系統、智能數據庫系統等。

      相關研究成果在計算機領域國際頂級期刊/會議發表論文60余篇。作為負責人先后主持國家自然科學基金優秀青年基金項目、重點項目、面上項目,以及多項產學研合作項目。

      先后獲得ICDE 2025 Best Paper Runner-Up、ACM SIGMOD Research Highlight Award、ACM China Rising Award、寶鋼優秀教師等獎勵。

      團隊介紹

      RUC-DataLab是中國人民大學信息學院、數據工程與知識工程教育部重點實驗室設立的科研團隊,負責人是范舉教授,團隊專注于數據系統+人工智能 (Data+AI)交叉領域,致力于將數據技術與人工智能技術深度融合,從而打造更加智能、高效的新型數據系統。

      實驗室的研究方向包括:(1)數據庫系統智能化(AI4DB):利用人工智能技術提升數據庫系統的查詢性能、自治能力等;(2)數據庫技術賦能AI系統(DB4AI):利用數據管理技術支撐大模型訓練的高效處理、大模型推理的低延遲、高吞吐優化;(3)數智融合的新型數據科學系統(AI4DS):利用推理大模型、多模態語義理解與智能體等技術,提升數據科學系統的智能化水平與執行性能,有效釋放數據價值。

      論文:https://arxiv.org/pdf/2510.16872
      代碼:https://github.com/ruc-datalab/DeepAnalyze
      模型:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
      數據:https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K
      更多示例:https://ruc-deepanalyze.github.io/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      斷供的人多了,銀行都開始讓步了

      斷供的人多了,銀行都開始讓步了

      亞哥談古論今
      2025-10-30 19:29:44
      追夢評勇士隊友Top5:庫湯領銜希爾德在列,杜蘭特巴特勒落選

      追夢評勇士隊友Top5:庫湯領銜希爾德在列,杜蘭特巴特勒落選

      懂球帝
      2025-11-06 08:14:10
      所有人不許吃肉?準大一素食女生發文求助,網友:誰做她室友誰倒霉

      所有人不許吃肉?準大一素食女生發文求助,網友:誰做她室友誰倒霉

      趣筆談
      2025-08-18 15:51:25
      中美兩國正式停戰!特朗普主動對華示好!中美正式進入蜜月期?

      中美兩國正式停戰!特朗普主動對華示好!中美正式進入蜜月期?

      娛樂督察中
      2025-11-06 08:21:53
      長沙垮塌事件!建筑是上個世紀的,24歲死者家屬簽協議,善后到位

      長沙垮塌事件!建筑是上個世紀的,24歲死者家屬簽協議,善后到位

      鋭娛之樂
      2025-11-06 08:32:46
      北京世茂大廈七折拍賣易主,“藥王”揚子江藥業超22億接盤

      北京世茂大廈七折拍賣易主,“藥王”揚子江藥業超22億接盤

      新京報
      2025-11-05 21:53:20
      巴薩糟心一戰!3次落后3度扳平:弗里克氣到兩眼要噴火 1數據丟人

      巴薩糟心一戰!3次落后3度扳平:弗里克氣到兩眼要噴火 1數據丟人

      風過鄉
      2025-11-06 06:34:00
      全中國最大的騙局,竟然是茅臺專賣店,一瓶飛天都不賣年收入過億

      全中國最大的騙局,竟然是茅臺專賣店,一瓶飛天都不賣年收入過億

      好賢觀史記
      2025-11-05 09:54:41
      封得好!網紅戶晨風被央視公開點名批評,徹底涼透了

      封得好!網紅戶晨風被央視公開點名批評,徹底涼透了

      雷科技
      2025-11-05 22:28:30
      Shein第三方平臺被法國暫停運營,巴黎首店開業遭現場抗議和沖擊

      Shein第三方平臺被法國暫停運營,巴黎首店開業遭現場抗議和沖擊

      藍洞新消費
      2025-11-06 08:28:54
      黃仁勛“最直白表態”:中國這么做,將贏了美國

      黃仁勛“最直白表態”:中國這么做,將贏了美國

      觀察者網
      2025-11-06 08:23:17
      擠眉弄眼,油腔滑調,瘦的脫相,沒馬國明霸氣,佘詩曼也帶不動他

      擠眉弄眼,油腔滑調,瘦的脫相,沒馬國明霸氣,佘詩曼也帶不動他

      白面書誏
      2025-11-05 19:53:53
      張柏芝的兒子謝振軒長得好帥,五官棱角分明,顏值超過爸爸謝霆鋒

      張柏芝的兒子謝振軒長得好帥,五官棱角分明,顏值超過爸爸謝霆鋒

      鄭丁嘉話
      2025-10-29 09:22:22
      湖北縣域高鐵站掀起“規模競賽”,7大站點規格直逼地級市

      湖北縣域高鐵站掀起“規模競賽”,7大站點規格直逼地級市

      觀察眼看世界
      2025-11-05 19:30:03
      國際米蘭2-1排名第三,亞特蘭大1-0絕殺意甲四隊全勝

      國際米蘭2-1排名第三,亞特蘭大1-0絕殺意甲四隊全勝

      李帕在北漂
      2025-11-06 06:37:05
      白百何好友下場了!揭露爭獎細節,放話大不了魚死網破電影不上了

      白百何好友下場了!揭露爭獎細節,放話大不了魚死網破電影不上了

      萌神木木
      2025-11-05 22:10:00
      美國商務部長炮轟中國芯片:天天說制造先進芯片,但中國根本沒有

      美國商務部長炮轟中國芯片:天天說制造先進芯片,但中國根本沒有

      動漫里的童話
      2025-11-04 21:58:28
      鄭麗文最新人事安排出爐,邱毅直呼“棋高一著”!洪秀柱發出提醒

      鄭麗文最新人事安排出爐,邱毅直呼“棋高一著”!洪秀柱發出提醒

      愛史紀
      2025-11-05 22:29:19
      中國航母震撼全球!第五艘開始實現真正超越,美國優勢不再?

      中國航母震撼全球!第五艘開始實現真正超越,美國優勢不再?

      科學知識點秀
      2025-10-23 08:00:03
      有點被迫?C羅談求婚:喬治娜向我要了一枚戒指,我沒有單膝下跪

      有點被迫?C羅談求婚:喬治娜向我要了一枚戒指,我沒有單膝下跪

      茜子足球
      2025-11-05 12:23:32
      2025-11-06 09:40:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11633文章數 176326關注度
      往期回顧 全部

      科技要聞

      蘋果“認輸”!曝每年10億美元租用谷歌AI

      頭條要聞

      90后女業主"房貸倒掛":房子貸款650萬 市價僅360萬

      頭條要聞

      90后女業主"房貸倒掛":房子貸款650萬 市價僅360萬

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      特朗普關稅遭美國高院大法官輪番質疑

      汽車要聞

      方向盤?不存在的 特斯拉 Cybercab亞太首秀

      態度原創

      數碼
      藝術
      房產
      手機
      公開課

      數碼要聞

      Siri 最強外援:消息稱蘋果擬每年支付 10 億美元集成谷歌 Gemini

      藝術要聞

      毛主席書法作品首次在美國現身,內容引人關注!

      房產要聞

      最新!海南樓市10月熱銷榜單出爐!

      手機要聞

      vivo S30系列成基數,OPPO Reno14系列最牛

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 樱花草视频www日本韩国| 亚洲性日韩一区二区三区| 久久人妻国产精品| 亚洲国产日韩一区三区| 国产精品白浆免费视频| 综合欧美视频一区二区三区| 精品久久久久久无码免费| 久久精品国产福利亚洲av| 亚州中文字幕一区二区| 99国产午夜福利在线观看| 男女爽爽无遮挡午夜视频 | 亚洲精品国产一二三区| 国产欧美日韩亚洲一区二区三区 | 亚洲女人天堂成人av在线 | 亚洲精品综合一区二区三区| 26uuu另类亚洲欧美日本| 农民人伦一区二区三区| 天天澡天天揉揉av无码| 97成人碰碰久久人人超级碰oo | 狠狠五月深爱婷婷网| 狠狠婷婷综合久久久久久| 成人午夜无人区一区二区| 18禁网站免费无遮挡无码中文| 午夜通通国产精品福利| 真实单亲乱l仑对白视频| 色噜噜噜亚洲男人的天堂| 永昌县| 成人永久免费A∨一级在线播放 | 国产麻豆成人传媒免费观看| 给我中国免费播放片在线| 亚洲一区二区三区18禁| 九九热免费精品视频在线| 一区二区丝袜美腿视频| av男人的天堂在线观看国产 | 久久精品国产亚洲av天海翼| 欧美性猛交xxxx免费看| 亚洲一级特黄大片在线观看| 2019nv天堂香蕉在线观看| 少妇被黑人到高潮喷出白浆| 色www永久免费视频| 久久国产综合色免费观看|