<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網易首頁 > 網易號 > 正文 申請入駐

      AI百科全書新思路:科學家用第一性原理重構知識體系

      0
      分享至

      無論是渴望洞悉前沿科技的愛好者,困惑于理論與應用脫節的學生,還是探尋長尾知識的科研工作者,都日益感受到一個共同的困境:在信息洪流中,要找到系統、可靠且深入淺出的中文知識解讀,正變得愈發艱難。

      大模型看似提供了捷徑,但其固有的“幻覺”與內容的碎片化,使其難以成為可供信賴與沉淀的知識基石。正因如此,系統性地構建一套高質量的AI 時代中文科學百科全書——致力于打通領域知識壁壘、將高深科學通俗化、并有效覆蓋被忽略的長尾領域——已是當務之急,更是時代所需。

      就在不久前,馬斯克號稱要用其 AI 百科 Grokipedia 挑戰維基百科。實際上,在馬斯克提出 Grokipedia 概念之前的一個月,有一支由高校和企業組成的中國團隊已經意識到了構建 AI 時代的百科全書的重要性,并打造了科學百科 SciencePedia,但其核心思路與前者存在本質不同,旨在突破人類知識的瓶頸。

      該團隊構建了一個相對可靠和全面的基礎科學知識庫,該知識庫創新性的利用大語言模型的長思維鏈(LCoT,Long Chain-of-Thought)的推理能力,從第一性原理出發,系統地推演了基礎科學的知識體系,從而形成了一個以 LCoT 為主體的新型語料庫,奠定了系統生成科學百科全書的基礎。

      該團隊表示,通過此前的統計物理的理論研究,大語言模型通過強化學習獲得的 LCoT 的能力是涌現出來的。通過系統的制備 LCoT 的語料庫,試圖彌補互聯網語料重結果而輕推理步驟的不足。

      “經校驗的 LCoT 語料不僅在大幅減少了 AI 的幻覺問題,還極大地提升了推理語料的豐富程度?!痹撜撐墓餐ㄓ嵶髡?、中國科學院理論物理研究所陳錕副研究員對 DeepTech 表示。


      圖丨左至右:李鈺、黃遠、張林峰、么志遠、陳錕(來源:陳錕)

      據介紹,目前 SciencePedia 包含約 20 萬個細粒度的條目,涵蓋了包括數學、物理、化學、生物、工程、計算科學與天文七大領域的客觀知識,已構建 300 萬條科學推理網絡思維鏈并提供了超過 10 萬的練習題。

      在底層 LCoT 知識庫的支持下,SciencePedia 正試圖不僅可查到知識的“終點”,也能探索知識形成的“路徑”,為科學研究、教育和跨學科創新提供了一種新的工具。

      如果說傳統知識系統提供的是一個點,那么,LCoT 知識庫是將這些點串聯起來的“網”。更重要的是,它揭示了很多知識點在跨學科之間的潛在聯系。在此基礎上,除了構建學習工具幫助用戶學習復雜的概念、推薦最優學習方案之外,還可以成為探索跨領域研究方向的探索引擎。項目團隊認為,AI 生成 SciencePedia 有望高效解決百科全書構建的“冷啟動”難題,為進一步的開放的社區共建與人機協同提供基礎。


      (來源:https://sciencepedia.bohrium.com/)

      相關論文以《基于可驗證長鏈條思維的逆向知識搜索:構建跨領域科學百科全書》(Inverse Knowledge Search over Verifiable Long Chain of Thoughts: Building a Cross-Domain Scientific Encyclopedia)為題發表在預印本網站 arXiv[1]。

      聯合團隊來自于中國科學院理論物理研究所、深勢科技、蘭州大學、北京科學智能研究院、上海交通大學、北京大學等單位。蘭州大學與中國科學院理論物理研究所聯合培養博士生李鈺和深勢科技資深 AI 算法研究員黃遠是共同第一作者;深勢科技創始人兼首席科學家張林峰、蘭州大學么志遠青年研究員和中國科學院理論物理研究所陳錕副研究員擔任共同通訊作者。


      圖丨相關論文(來源:arXiv)

      能追溯、能驗證的第一性原理科學知識庫:“知其然知其所以然”

      如何廣泛覆蓋長尾知識、保證高質量的內容同時揭示學科之間的交叉是 SciencePedia 的三大技術難點。這項研究的核心價值是通過基于還原論的推理方法,從頭構建一套基于 LCoT 語料科學知識庫;在此基礎上構建的 SciencePedia 便能同時克服上述難點。

      與傳統的論文庫或教科書知識的不同在于,SciencePedia 所基于的知識庫在形式上更像一套由科學知識的問答對構成的《十萬個為什么》。其構建的基本思路是使用“蘇格拉底詰問法”對一系列的科學知識點做“打破砂鍋問到底”的質問,從而將高層次知識點解構成更加底層的知識點。這就是科學上著名的第一性原理方法,對應了“還原論”的科學方法論。

      為通過這一方法系統的制備 LCoT 知識庫,研究團隊設計了一套由“蘇格拉底問答智能體”驅動的自動化流程,它基于約 200 門學科課程,生成了近 300 萬個高質量的科學問題的問答對。每個問題都是通過多個獨立的大模型分別生成詳細的 LCoT,再經過嚴格的答案交叉驗證篩選過程,最終只保留可被驗證的內容,進而形成一個覆蓋了七大學科領域的可驗證的科學知識庫。


      圖丨問題生成與交叉驗證的三階段流程(來源:arXiv)

      在此基礎上,團隊還開發了名為頭腦風暴搜索引擎(Brainstorm)的新型工具,實現了逆向知識搜索:用戶輸入一個概念,引擎將返回所有以輸入概念為終點的、來自不同學科的第一性原理推導路徑。這些路徑不僅揭示了概念的來源,更展現了其在不同領域中的交叉應用。

      傳統的知識體系檢索體系(例如基于谷歌搜索的信息獲取方式)搜索的是人類語料。由于人類語料本身存在重結論而輕過程的問題,它的搜索結果也主要是關于知識點本身,而缺乏知識點之間關聯的信息。

      而作為基于 LCoT 語料庫的搜索引擎,頭腦風暴搜索引擎嘗試通過查詢引用到知識點的 LCoT,來探索與其他知識點長程關聯的搜索,成為一個領域交叉應用的發現引擎。


      圖丨頭腦風暴搜索引擎與柏拉圖寫作智能體架構(來源:arXiv)

      SciencePedia 的知識點文本,正是通過頭腦風暴搜索引擎通過發掘知識點之間的跨領域關聯而構建起來的。為了讓高深的科學概念傳遞給更多的讀者,研究人員還在輸出層構建了“柏拉圖寫作智能體”,并將寫作風格設置為貼近生活的的費曼風格的高級科普模式,這樣就可以把頭腦風暴搜索引擎找到的抽象難懂的推理鏈,改寫為通俗易懂且可信度高的科學文章。


      圖丨左右圖分別是知識點密度和事實錯誤率的比較(來源:arXiv)

      據團隊介紹,由于“柏拉圖寫作智能體”基于 LCoT 知識庫與頭腦風暴搜索引擎進行寫作,它在發散思維的同時還致力于減少 AI 的幻覺問題。相比于大模型直接寫作,“柏拉圖”創作的文本相對大幅度地提升了知識點密度和事實準確性方面表現,有助于提高科學知識的傳播質量。

      得益于上述底層原理的創新,SciencePedia 覆蓋了七大科學領域中的近 20 萬不同粒度的知識點,初步實現了中英雙語與長尾知識點的較均衡覆蓋。這一點對于科學內容稀缺的中文互聯網社區具有重要的意義。

      需要了解的是,維基百科的中文詞條比英文詞條少兩個數量級,并且質量嚴重劣化。而在科學前沿領域,詞條知識多為長尾,由于人類專家精力有限,即使對于英文詞條亦難保證質量與數量。

      陳錕指出,“盡管 SciencePedia 還沒有覆蓋社會學、歷史等科目,詞條總量不如維基百科,但在科學領域范圍,我們的詞條覆蓋了維基百科缺乏的很多長尾知識。即使是一些小眾知識點,也能提供較為豐富和高質量的文本。典型例子是 SciencePedia 對 Transmon 等部分前沿概念提供了比維基百科更詳盡的信息。此外,中文維基遠不及英文版,但我們的 SciencePedia 力求做到中英文質量一致?!?/p>

      值得關注的是,SciencePedia 據稱并未借助人類語料從頭構建。相比于馬斯克的 Grokipedia 因抄襲維基百科所涉及的版權問題,SciencePedia 在設計方面有助于規避部分潛在的類似問題。

      突破人類語料壓縮推理局限,架起知識點之間的“橋梁”

      SciencePedia 除了貢獻了相對高質量的詞條之外,還通過頭腦風暴搜索引擎批量挖掘出了大量人類互聯網此前沒能覆蓋的學科交叉知識。

      由于人類專家精力的限制,包括論文、維基百科、教科書和互聯網數據等在內人類語料普遍重結果而輕過程。因此這些語料中的現有知識體系更像是一座座“孤島”。知識島之間至關重要的“橋梁”,也就是知識點之間的邏輯推理過程被顯著壓縮了,成為了無法被谷歌等傳統搜索引擎發現的知識“暗物質”。

      因此,傳統的搜索引擎傳統只會告訴你知識“是什么”,而對于“為什么”、知識“由何而來”,以及在“哪里有用”等問題提供的信息往往有限。這些知識間橋梁的缺失,導致了現有人類知識語料固有的局限性:知識點難驗證、難理解、難交叉。

      如果人類語料中的知識“橋梁”如此匱乏,那么基于人類知識訓練的大模型是否也對此無能為力呢?

      此前,研究團隊對于大模型中長思維鏈推理能力的本質做了系列研究,提出大模型通過強化學習突破人類語料限制的核心機理:通過構建最小復雜網絡模型 CoNet,并與模型的強化學習訓練進行對比研究。

      研究團隊認為,通過強化學習誘導的相變物理,大模型長推理涌現出長程關聯,正好提供了將一座知識“島”與另一座知識“島”連接的“橋梁”(DeepTech 此前報道:大模型深度思考竟與物理相變“異曲同工”:科學家揭示“臨界學習”奧秘,助力 80 億參數模型攻克量子場論核心計算)[3]。因此,在強化學習后訓練之后的新一代大模型,有潛力突破人類語料在推理鏈上的局限。


      (來源:https://www.bohrium.com/sciencepedia/Backpropagatio)

      下面我們通過從藍天聯系到量子力學的例子,來說明知識點之間“橋梁”連接的重要性。

      “天空是藍色的”形成的原因在于電子和光子的相互作用時散射最強,對于空氣分子來說,散射最強的是紫色部分。但由于太陽光中藍光的能量比紫光強,并且人眼對藍光更敏感,因此我們看到的天空是藍色。

      那它和量子力學有什么關系呢?其推理過程中散射最強的是藍色,正是百年前經典物理的“兩朵烏云”之一的紫外發散難題。這一朵烏云最終誕生了量子力學。由于其中的技術細節繁雜,人類語料很難展開所有的細節,導致類似的推理過程的語料非常欠缺。讓這些關鍵的橋梁編程了知識的“暗物質”。

      陳錕表示:“從藍天聯想到量子力學是非常有意義的知識,如果我們只了解結論而摒棄推理過程,相當于拆掉了知識點之間的‘橋梁’,丟失了知識之間的關聯信息。”

      據了解,SciencePedia 通過構造底層 LCoT 知識庫很大程度上解壓縮了人類的科學知識庫。進一步地,通過頭腦風暴搜索引擎,通過搜索這個知識庫挖掘不同知識點之間的交叉領域的關聯,SciencePedia 為更好地揭示知識點之間的應用關聯提供了一種新的路徑。


      圖丨關鍵字圖的層次結構(來源:arXiv)

      目前,研究團隊正在進行上下文協議(MCP,Model Context Protocol)服務的測試,未來會逐步向用戶開放。屆時,用戶可基于該服務來基于 LCoT 科學知識庫來創作科普文章、科幻小說等多方面的高質量內容。

      例如,當新一屆諾貝爾獎頒發時,基于 SciencePedia 有望快速生成一篇高質量的諾獎的深度分析新聞稿?;蛘?,用戶提供一些靈感和想法,SciencePedia 在短時間內生成科幻文章。

      因為人類的知識非常龐雜,這項工作從某種意義上來看只是一個起點。目前,SciencePedia 僅包括七門學科,未來研究團隊還將進一步覆蓋更廣泛的學科和領域范圍,包括歷史、天文、地理、經濟學和醫藥等。其未來發展重心將轉向開放的社區共建與人機協同。團隊希望未來與全球專家學者組建“SciencePedia 社區委員會”,并協力開發在線課程、教育工具等應用。

      陳錕表示:“我們相當于培育了一顆更系統化的客觀知識體系的種子,最終還需要靠與社區更多互動,共同探索知識形態,通過共同灌溉讓它長成枝繁葉茂的大樹。”

      正如很多科學探索一樣,答案并非知識的“終點”,它從哪里來又用到哪里去本身也是重要的、容易被忽視的知識。SciencePedia 項目向我們展示了如何通過大模型系統地解決這一問題。

      這一橫向解決不同領域通用問題的研究范式,是大模型時代的 AGI for Science 與傳統的專注于領域專用問題的 AI for Science 的縱向范式的最大不同。SciencePedia 的出現讓我們看到了一個新的希望:或許,在被海量信息淹沒的時代,它為重新找到對客觀知識的深度理解提供了新的可能性。

      參考資料:

      1.arXiv相關論文:https://arxiv.org/abs/2510.26854

      2.SciencePedia 體驗網址:https://sciencepedia.bohrium.com/

      3.CoNet 相關論文:https://arxiv.org/pdf/2509.23629

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      快船2連敗后,哈登提出明確要求,泰倫盧確認2件事,一人要被重用

      快船2連敗后,哈登提出明確要求,泰倫盧確認2件事,一人要被重用

      體壇大辣椒
      2025-11-05 16:37:35
      猛料越扒越有!釋永信在少林寺有多過分,可能遠超世人的想象

      猛料越扒越有!釋永信在少林寺有多過分,可能遠超世人的想象

      天行艦
      2025-08-21 00:00:06
      王家衛沒想到,錄音事件后,王傳君卻因一句“我不喜歡”口碑暴增

      王家衛沒想到,錄音事件后,王傳君卻因一句“我不喜歡”口碑暴增

      妙知
      2025-11-03 11:10:13
      一名意大利記者因向歐盟發言人提出一個涉及以色列的問題,遭解雇了

      一名意大利記者因向歐盟發言人提出一個涉及以色列的問題,遭解雇了

      環球網資訊
      2025-11-05 23:45:10
      足協認定2大錯判!蓉城關鍵戰“被黑”,胡荷韜進球被吹+漏判點球

      足協認定2大錯判!蓉城關鍵戰“被黑”,胡荷韜進球被吹+漏判點球

      奧拜爾
      2025-11-05 22:54:18
      “未來國足六小天鵝”橫空出世!王鈺棟領銜天才軍團征戰熊貓杯

      “未來國足六小天鵝”橫空出世!王鈺棟領銜天才軍團征戰熊貓杯

      中山印象體育攝影師
      2025-11-05 15:36:24
      廣東企業遼寧收購股權疑遇空手套,當地法院判數千萬費用分文不退

      廣東企業遼寧收購股權疑遇空手套,當地法院判數千萬費用分文不退

      報人老張
      2025-11-05 11:37:39
      鄭麗文公布第四波人事任命,親美派垂死掙扎,朱立倫不淡定了!

      鄭麗文公布第四波人事任命,親美派垂死掙扎,朱立倫不淡定了!

      輝輝歷史記
      2025-11-04 20:18:00
      俄美媒體不約而同就武統臺島發聲,俄媒:解放軍表現一定比俄軍好

      俄美媒體不約而同就武統臺島發聲,俄媒:解放軍表現一定比俄軍好

      文史旺旺旺
      2025-11-04 20:10:06
      人為什么會得糖尿???原來糖尿病是這樣來的,現在知道還不遲

      人為什么會得糖尿病?原來糖尿病是這樣來的,現在知道還不遲

      泠泠說史
      2025-11-05 17:29:45
      換了8個手機都用不了?小伙買電車跑網約車,結果車子成“屏蔽器”

      換了8個手機都用不了?小伙買電車跑網約車,結果車子成“屏蔽器”

      瀟湘晨報
      2025-11-04 15:49:23
      大連最近的裁員消息可太讓人揪心了

      大連最近的裁員消息可太讓人揪心了

      歲月有情1314
      2025-11-05 14:46:16
      安徽首家縣級三甲醫院,黨委書記被查

      安徽首家縣級三甲醫院,黨委書記被查

      醫學界
      2025-11-05 13:08:40
      歐冠慘案誕生!英超豪強踢瘋了,狂轟4球,超級后衛長途奔襲破門

      歐冠慘案誕生!英超豪強踢瘋了,狂轟4球,超級后衛長途奔襲破門

      足球狗說
      2025-11-05 06:08:44
      浙江多地教師秋招“神仙打架”,招錄比現1:107,碩士博士都來了

      浙江多地教師秋招“神仙打架”,招錄比現1:107,碩士博士都來了

      鬼菜生活
      2025-11-05 02:05:23
      烈士墓前鮮花堆積如山,吳朱墓前冷熱懸殊,為何觀眾更念這位將軍

      烈士墓前鮮花堆積如山,吳朱墓前冷熱懸殊,為何觀眾更念這位將軍

      文詡歷史
      2025-11-05 18:24:47
      若美國11艘航母全部出動,誰能扛得住?俄:全球僅有一個國家可以

      若美國11艘航母全部出動,誰能扛得住?俄:全球僅有一個國家可以

      尋途
      2025-11-04 21:14:29
      要價5000萬!曝曼聯相中巴薩棄將 拉什福德無緣回歸

      要價5000萬!曝曼聯相中巴薩棄將 拉什福德無緣回歸

      球事百科吖
      2025-11-05 01:39:04
      張靚穎“零透光”裙驚爆熱搜,性感曲線令全場屏息,時尚女王?

      張靚穎“零透光”裙驚爆熱搜,性感曲線令全場屏息,時尚女王?

      娛樂領航家
      2025-10-28 22:00:07
      央視原著名主持人官宣復出

      央視原著名主持人官宣復出

      夢婷
      2025-11-05 12:43:24
      2025-11-06 00:27:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15823文章數 514266關注度
      往期回顧 全部

      科技要聞

      大轉彎!特朗普再提名馬斯克盟友任NASA局長

      頭條要聞

      丈夫突然病亡2天后妻子也離世留下一兒一女 妹妹發聲

      頭條要聞

      丈夫突然病亡2天后妻子也離世留下一兒一女 妹妹發聲

      體育要聞

      贏下皇馬,會是利物浦的轉折點嗎?

      娛樂要聞

      港星林尚武突發心臟病去世

      財經要聞

      事關加快建設金融強國 中央金融辦發聲

      汽車要聞

      智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

      態度原創

      時尚
      藝術
      教育
      房產
      數碼

      今年一定要擁有這件大衣,復古又時髦!

      藝術要聞

      蒲華:搦管寫竹,墨沈淋漓

      教育要聞

      最新:2026年南京中考體育考試內容及評分標準曝光!

      房產要聞

      最新!海南樓市10月熱銷榜單出爐!

      數碼要聞

      小米POCO X1平板現身Geekbench 搭載驍龍7+ Gen 3

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产亚洲无日韩乱码| 国产成人精品午夜福利在线观看| 日韩中文字幕v亚洲中文字幕| 四虎精品视频永久免费| 国产精品久久久久7777| 无码专区视频精品老司机| 日韩熟女熟妇久久精品综合| 成人精品一区日本无码网| 欧洲亚洲精品免费二区| 乱码午夜-极品国产内射| 亚洲综合色区另类av| 国产成人欧美一区二区三区在线| 乌克兰丰满女人a级毛片右手影院| 4hu四虎永久免费地址ww416| 国产乱弄免费视频观看| 91福利国产午夜亚洲精品| 国产亚洲tv在线观看| 国内精品无码一区二区三区| 天堂网亚洲综合在线| 国产精品视频一品二区三| 久久午夜无码免费| 国产一区二区日韩在线| 爽爽精品dvd蜜桃成熟时电影院| 欧洲中文字幕一区二区| 久久人人97超碰精品| 久久91精品牛牛| 欧洲免费一区二区三区视频| 内射中出无码护士在线| 狠狠综合久久久久综| 免费无码AV一区二区波多野结衣| 亚洲av色在线播放一区| 开心婷婷五月激情综合社区| 欧美亚洲h在线一区二区| 日韩精品中文字幕国产一| 日本强好片久久久久久aaa| 久久亚洲美女精品国产精品| 中文字幕理伦午夜福利片| 精品人妻系列无码人妻免费视频| 国产精品国产片在线观看| 欧美视频专区一二在线观看| 一区二区三区精品不卡|