<blockquote id="ue9b1"></blockquote>
    
    

    <style id="ue9b1"></style>
      <sub id="ue9b1"><p id="ue9b1"><form id="ue9b1"></form></p></sub>

      <strong id="ue9b1"><button id="ue9b1"><mark id="ue9b1"></mark></button></strong>
      成年午夜性影院,下面一进一出好爽视频,国产无遮挡又黄又爽又色,国产精品爽爽v在线观看无码,国产人妻久久精品一区二区三区,国产伦精品一区二区三区免费迷,国产欧美精品一区二区三区,日韩精品一区二区三区视频
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      AI百科全書新思路:科學家用第一性原理重構知識體系

      0
      分享至

      無論是渴望洞悉前沿科技的愛好者,困惑于理論與應用脫節(jié)的學生,還是探尋長尾知識的科研工作者,都日益感受到一個共同的困境:在信息洪流中,要找到系統(tǒng)、可靠且深入淺出的中文知識解讀,正變得愈發(fā)艱難。

      大模型看似提供了捷徑,但其固有的“幻覺”與內容的碎片化,使其難以成為可供信賴與沉淀的知識基石。正因如此,系統(tǒng)性地構建一套高質量的AI 時代中文科學百科全書——致力于打通領域知識壁壘、將高深科學通俗化、并有效覆蓋被忽略的長尾領域——已是當務之急,更是時代所需。

      就在不久前,馬斯克號稱要用其 AI 百科 Grokipedia 挑戰(zhàn)維基百科。實際上,在馬斯克提出 Grokipedia 概念之前的一個月,有一支由高校和企業(yè)組成的中國團隊已經(jīng)意識到了構建 AI 時代的百科全書的重要性,并打造了科學百科 SciencePedia,但其核心思路與前者存在本質不同,旨在突破人類知識的瓶頸。

      該團隊構建了一個相對可靠和全面的基礎科學知識庫,該知識庫創(chuàng)新性的利用大語言模型的長思維鏈(LCoT,Long Chain-of-Thought)的推理能力,從第一性原理出發(fā),系統(tǒng)地推演了基礎科學的知識體系,從而形成了一個以 LCoT 為主體的新型語料庫,奠定了系統(tǒng)生成科學百科全書的基礎。

      該團隊表示,通過此前的統(tǒng)計物理的理論研究,大語言模型通過強化學習獲得的 LCoT 的能力是涌現(xiàn)出來的。通過系統(tǒng)的制備 LCoT 的語料庫,試圖彌補互聯(lián)網(wǎng)語料重結果而輕推理步驟的不足。

      “經(jīng)校驗的 LCoT 語料不僅在大幅減少了 AI 的幻覺問題,還極大地提升了推理語料的豐富程度?!痹撜撐墓餐ㄓ嵶髡?、中國科學院理論物理研究所陳錕副研究員對 DeepTech 表示。


      圖丨左至右:李鈺、黃遠、張林峰、么志遠、陳錕(來源:陳錕)

      據(jù)介紹,目前 SciencePedia 包含約 20 萬個細粒度的條目,涵蓋了包括數(shù)學、物理、化學、生物、工程、計算科學與天文七大領域的客觀知識,已構建 300 萬條科學推理網(wǎng)絡思維鏈并提供了超過 10 萬的練習題。

      在底層 LCoT 知識庫的支持下,SciencePedia 正試圖不僅可查到知識的“終點”,也能探索知識形成的“路徑”,為科學研究、教育和跨學科創(chuàng)新提供了一種新的工具。

      如果說傳統(tǒng)知識系統(tǒng)提供的是一個點,那么,LCoT 知識庫是將這些點串聯(lián)起來的“網(wǎng)”。更重要的是,它揭示了很多知識點在跨學科之間的潛在聯(lián)系。在此基礎上,除了構建學習工具幫助用戶學習復雜的概念、推薦最優(yōu)學習方案之外,還可以成為探索跨領域研究方向的探索引擎。項目團隊認為,AI 生成 SciencePedia 有望高效解決百科全書構建的“冷啟動”難題,為進一步的開放的社區(qū)共建與人機協(xié)同提供基礎。


      (來源:https://sciencepedia.bohrium.com/)

      相關論文以《基于可驗證長鏈條思維的逆向知識搜索:構建跨領域科學百科全書》(Inverse Knowledge Search over Verifiable Long Chain of Thoughts: Building a Cross-Domain Scientific Encyclopedia)為題發(fā)表在預印本網(wǎng)站 arXiv[1]。

      聯(lián)合團隊來自于中國科學院理論物理研究所、深勢科技、蘭州大學、北京科學智能研究院、上海交通大學、北京大學等單位。蘭州大學與中國科學院理論物理研究所聯(lián)合培養(yǎng)博士生李鈺和深勢科技資深 AI 算法研究員黃遠是共同第一作者;深勢科技創(chuàng)始人兼首席科學家張林峰、蘭州大學么志遠青年研究員和中國科學院理論物理研究所陳錕副研究員擔任共同通訊作者。


      圖丨相關論文(來源:arXiv)

      能追溯、能驗證的第一性原理科學知識庫:“知其然知其所以然”

      如何廣泛覆蓋長尾知識、保證高質量的內容同時揭示學科之間的交叉是 SciencePedia 的三大技術難點。這項研究的核心價值是通過基于還原論的推理方法,從頭構建一套基于 LCoT 語料科學知識庫;在此基礎上構建的 SciencePedia 便能同時克服上述難點。

      與傳統(tǒng)的論文庫或教科書知識的不同在于,SciencePedia 所基于的知識庫在形式上更像一套由科學知識的問答對構成的《十萬個為什么》。其構建的基本思路是使用“蘇格拉底詰問法”對一系列的科學知識點做“打破砂鍋問到底”的質問,從而將高層次知識點解構成更加底層的知識點。這就是科學上著名的第一性原理方法,對應了“還原論”的科學方法論。

      為通過這一方法系統(tǒng)的制備 LCoT 知識庫,研究團隊設計了一套由“蘇格拉底問答智能體”驅動的自動化流程,它基于約 200 門學科課程,生成了近 300 萬個高質量的科學問題的問答對。每個問題都是通過多個獨立的大模型分別生成詳細的 LCoT,再經(jīng)過嚴格的答案交叉驗證篩選過程,最終只保留可被驗證的內容,進而形成一個覆蓋了七大學科領域的可驗證的科學知識庫。


      圖丨問題生成與交叉驗證的三階段流程(來源:arXiv)

      在此基礎上,團隊還開發(fā)了名為頭腦風暴搜索引擎(Brainstorm)的新型工具,實現(xiàn)了逆向知識搜索:用戶輸入一個概念,引擎將返回所有以輸入概念為終點的、來自不同學科的第一性原理推導路徑。這些路徑不僅揭示了概念的來源,更展現(xiàn)了其在不同領域中的交叉應用。

      傳統(tǒng)的知識體系檢索體系(例如基于谷歌搜索的信息獲取方式)搜索的是人類語料。由于人類語料本身存在重結論而輕過程的問題,它的搜索結果也主要是關于知識點本身,而缺乏知識點之間關聯(lián)的信息。

      而作為基于 LCoT 語料庫的搜索引擎,頭腦風暴搜索引擎嘗試通過查詢引用到知識點的 LCoT,來探索與其他知識點長程關聯(lián)的搜索,成為一個領域交叉應用的發(fā)現(xiàn)引擎。


      圖丨頭腦風暴搜索引擎與柏拉圖寫作智能體架構(來源:arXiv)

      SciencePedia 的知識點文本,正是通過頭腦風暴搜索引擎通過發(fā)掘知識點之間的跨領域關聯(lián)而構建起來的。為了讓高深的科學概念傳遞給更多的讀者,研究人員還在輸出層構建了“柏拉圖寫作智能體”,并將寫作風格設置為貼近生活的的費曼風格的高級科普模式,這樣就可以把頭腦風暴搜索引擎找到的抽象難懂的推理鏈,改寫為通俗易懂且可信度高的科學文章。


      圖丨左右圖分別是知識點密度和事實錯誤率的比較(來源:arXiv)

      據(jù)團隊介紹,由于“柏拉圖寫作智能體”基于 LCoT 知識庫與頭腦風暴搜索引擎進行寫作,它在發(fā)散思維的同時還致力于減少 AI 的幻覺問題。相比于大模型直接寫作,“柏拉圖”創(chuàng)作的文本相對大幅度地提升了知識點密度和事實準確性方面表現(xiàn),有助于提高科學知識的傳播質量。

      得益于上述底層原理的創(chuàng)新,SciencePedia 覆蓋了七大科學領域中的近 20 萬不同粒度的知識點,初步實現(xiàn)了中英雙語與長尾知識點的較均衡覆蓋。這一點對于科學內容稀缺的中文互聯(lián)網(wǎng)社區(qū)具有重要的意義。

      需要了解的是,維基百科的中文詞條比英文詞條少兩個數(shù)量級,并且質量嚴重劣化。而在科學前沿領域,詞條知識多為長尾,由于人類專家精力有限,即使對于英文詞條亦難保證質量與數(shù)量。

      陳錕指出,“盡管 SciencePedia 還沒有覆蓋社會學、歷史等科目,詞條總量不如維基百科,但在科學領域范圍,我們的詞條覆蓋了維基百科缺乏的很多長尾知識。即使是一些小眾知識點,也能提供較為豐富和高質量的文本。典型例子是 SciencePedia 對 Transmon 等部分前沿概念提供了比維基百科更詳盡的信息。此外,中文維基遠不及英文版,但我們的 SciencePedia 力求做到中英文質量一致?!?/p>

      值得關注的是,SciencePedia 據(jù)稱并未借助人類語料從頭構建。相比于馬斯克的 Grokipedia 因抄襲維基百科所涉及的版權問題,SciencePedia 在設計方面有助于規(guī)避部分潛在的類似問題。

      突破人類語料壓縮推理局限,架起知識點之間的“橋梁”

      SciencePedia 除了貢獻了相對高質量的詞條之外,還通過頭腦風暴搜索引擎批量挖掘出了大量人類互聯(lián)網(wǎng)此前沒能覆蓋的學科交叉知識。

      由于人類專家精力的限制,包括論文、維基百科、教科書和互聯(lián)網(wǎng)數(shù)據(jù)等在內人類語料普遍重結果而輕過程。因此這些語料中的現(xiàn)有知識體系更像是一座座“孤島”。知識島之間至關重要的“橋梁”,也就是知識點之間的邏輯推理過程被顯著壓縮了,成為了無法被谷歌等傳統(tǒng)搜索引擎發(fā)現(xiàn)的知識“暗物質”。

      因此,傳統(tǒng)的搜索引擎?zhèn)鹘y(tǒng)只會告訴你知識“是什么”,而對于“為什么”、知識“由何而來”,以及在“哪里有用”等問題提供的信息往往有限。這些知識間橋梁的缺失,導致了現(xiàn)有人類知識語料固有的局限性:知識點難驗證、難理解、難交叉。

      如果人類語料中的知識“橋梁”如此匱乏,那么基于人類知識訓練的大模型是否也對此無能為力呢?

      此前,研究團隊對于大模型中長思維鏈推理能力的本質做了系列研究,提出大模型通過強化學習突破人類語料限制的核心機理:通過構建最小復雜網(wǎng)絡模型 CoNet,并與模型的強化學習訓練進行對比研究。

      研究團隊認為,通過強化學習誘導的相變物理,大模型長推理涌現(xiàn)出長程關聯(lián),正好提供了將一座知識“島”與另一座知識“島”連接的“橋梁”(DeepTech 此前報道:大模型深度思考竟與物理相變“異曲同工”:科學家揭示“臨界學習”奧秘,助力 80 億參數(shù)模型攻克量子場論核心計算)[3]。因此,在強化學習后訓練之后的新一代大模型,有潛力突破人類語料在推理鏈上的局限。


      (來源:https://www.bohrium.com/sciencepedia/Backpropagatio)

      下面我們通過從藍天聯(lián)系到量子力學的例子,來說明知識點之間“橋梁”連接的重要性。

      “天空是藍色的”形成的原因在于電子和光子的相互作用時散射最強,對于空氣分子來說,散射最強的是紫色部分。但由于太陽光中藍光的能量比紫光強,并且人眼對藍光更敏感,因此我們看到的天空是藍色。

      那它和量子力學有什么關系呢?其推理過程中散射最強的是藍色,正是百年前經(jīng)典物理的“兩朵烏云”之一的紫外發(fā)散難題。這一朵烏云最終誕生了量子力學。由于其中的技術細節(jié)繁雜,人類語料很難展開所有的細節(jié),導致類似的推理過程的語料非常欠缺。讓這些關鍵的橋梁編程了知識的“暗物質”。

      陳錕表示:“從藍天聯(lián)想到量子力學是非常有意義的知識,如果我們只了解結論而摒棄推理過程,相當于拆掉了知識點之間的‘橋梁’,丟失了知識之間的關聯(lián)信息。”

      據(jù)了解,SciencePedia 通過構造底層 LCoT 知識庫很大程度上解壓縮了人類的科學知識庫。進一步地,通過頭腦風暴搜索引擎,通過搜索這個知識庫挖掘不同知識點之間的交叉領域的關聯(lián),SciencePedia 為更好地揭示知識點之間的應用關聯(lián)提供了一種新的路徑。


      圖丨關鍵字圖的層次結構(來源:arXiv)

      目前,研究團隊正在進行上下文協(xié)議(MCP,Model Context Protocol)服務的測試,未來會逐步向用戶開放。屆時,用戶可基于該服務來基于 LCoT 科學知識庫來創(chuàng)作科普文章、科幻小說等多方面的高質量內容。

      例如,當新一屆諾貝爾獎頒發(fā)時,基于 SciencePedia 有望快速生成一篇高質量的諾獎的深度分析新聞稿。或者,用戶提供一些靈感和想法,SciencePedia 在短時間內生成科幻文章。

      因為人類的知識非常龐雜,這項工作從某種意義上來看只是一個起點。目前,SciencePedia 僅包括七門學科,未來研究團隊還將進一步覆蓋更廣泛的學科和領域范圍,包括歷史、天文、地理、經(jīng)濟學和醫(yī)藥等。其未來發(fā)展重心將轉向開放的社區(qū)共建與人機協(xié)同。團隊希望未來與全球專家學者組建“SciencePedia 社區(qū)委員會”,并協(xié)力開發(fā)在線課程、教育工具等應用。

      陳錕表示:“我們相當于培育了一顆更系統(tǒng)化的客觀知識體系的種子,最終還需要靠與社區(qū)更多互動,共同探索知識形態(tài),通過共同灌溉讓它長成枝繁葉茂的大樹?!?/p>

      正如很多科學探索一樣,答案并非知識的“終點”,它從哪里來又用到哪里去本身也是重要的、容易被忽視的知識。SciencePedia 項目向我們展示了如何通過大模型系統(tǒng)地解決這一問題。

      這一橫向解決不同領域通用問題的研究范式,是大模型時代的 AGI for Science 與傳統(tǒng)的專注于領域專用問題的 AI for Science 的縱向范式的最大不同。SciencePedia 的出現(xiàn)讓我們看到了一個新的希望:或許,在被海量信息淹沒的時代,它為重新找到對客觀知識的深度理解提供了新的可能性。

      參考資料:

      1.arXiv相關論文:https://arxiv.org/abs/2510.26854

      2.SciencePedia 體驗網(wǎng)址:https://sciencepedia.bohrium.com/

      3.CoNet 相關論文:https://arxiv.org/pdf/2509.23629

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      國錦賽八強前瞻:中國軍團形勢嚴峻,兩人晉級即是奢望

      國錦賽八強前瞻:中國軍團形勢嚴峻,兩人晉級即是奢望

      史虇的生活科普
      2025-11-05 12:53:07
      破防?40歲C羅語出驚人:奪世界杯非我夢想!7場比賽定義GOAT不公

      破防?40歲C羅語出驚人:奪世界杯非我夢想!7場比賽定義GOAT不公

      我愛英超
      2025-11-04 23:12:05
      土耳其8560萬人口,創(chuàng)造1.3萬億美元GDP,浙江6700萬人是多少?

      土耳其8560萬人口,創(chuàng)造1.3萬億美元GDP,浙江6700萬人是多少?

      劉森森
      2025-10-01 01:00:05
      李進勇火速恢復民進黨籍!其“中選會主委”任內被指操控選舉

      李進勇火速恢復民進黨籍!其“中選會主委”任內被指操控選舉

      海峽導報社
      2025-11-05 11:55:06
      曼聯(lián)允許桑喬免費轉會!幻想賣錢徒增煩惱,找回狀態(tài)也不考慮續(xù)約

      曼聯(lián)允許桑喬免費轉會!幻想賣錢徒增煩惱,找回狀態(tài)也不考慮續(xù)約

      羅米的曼聯(lián)博客
      2025-11-05 11:42:45
      所有人不許吃肉?準大一素食女生發(fā)文求助,網(wǎng)友:誰做她室友誰倒霉

      所有人不許吃肉?準大一素食女生發(fā)文求助,網(wǎng)友:誰做她室友誰倒霉

      趣筆談
      2025-08-18 15:51:25
      被照顧還是真實力?翁帆最新動態(tài)曝光:受聘出任清華大學建筑教授

      被照顧還是真實力?翁帆最新動態(tài)曝光:受聘出任清華大學建筑教授

      烏娛子醬
      2025-11-05 11:14:55
      許律師發(fā)朋友圈云淡風輕,王空姐未刪多年合照,網(wǎng)友:細思極恐!

      許律師發(fā)朋友圈云淡風輕,王空姐未刪多年合照,網(wǎng)友:細思極恐!

      一只番茄魚
      2025-11-04 10:24:48
      賴清德下令臺軍實彈備戰(zhàn);蔣萬安向大陸亮明立場:反對兩岸統(tǒng)一

      賴清德下令臺軍實彈備戰(zhàn);蔣萬安向大陸亮明立場:反對兩岸統(tǒng)一

      軍機Talk
      2025-11-05 10:58:08
      王藝迪奪冠前后,法國老頭的兩次強烈反應,他得需要個心理醫(yī)生

      王藝迪奪冠前后,法國老頭的兩次強烈反應,他得需要個心理醫(yī)生

      何咯說
      2025-11-05 06:55:40
      11月4日起,部分退休人員將迎養(yǎng)老金二次核算,補發(fā)1000難不難?

      11月4日起,部分退休人員將迎養(yǎng)老金二次核算,補發(fā)1000難不難?

      云鵬敘事
      2025-11-04 09:25:05
      緣分天定?32歲男子3次相親,均是同一人!網(wǎng)友:這顏值還猶豫

      緣分天定?32歲男子3次相親,均是同一人!網(wǎng)友:這顏值還猶豫

      趣筆談
      2025-11-05 08:21:39
      已經(jīng)退休的“飛天將軍”聶海勝,如今過著怎樣的生活?

      已經(jīng)退休的“飛天將軍”聶海勝,如今過著怎樣的生活?

      粵語音樂噴泉
      2025-11-04 07:20:43
      白所成宣判死刑,被稱“緬北名媛”的愛女白應蘭,如今又在何處?

      白所成宣判死刑,被稱“緬北名媛”的愛女白應蘭,如今又在何處?

      鋭娛之樂
      2025-11-04 22:57:22
      揭秘大馬士革刀:世界最鋒利的名刀,真的有那么厲害?

      揭秘大馬士革刀:世界最鋒利的名刀,真的有那么厲害?

      歷史不白說
      2025-11-01 17:16:24
      女工穿露屁股蛋熱褲修車爆紅!看完修車現(xiàn)場:評論區(qū)強烈要求戴安全帽哈哈

      女工穿露屁股蛋熱褲修車爆紅!看完修車現(xiàn)場:評論區(qū)強烈要求戴安全帽哈哈

      斗圖
      2025-09-09 22:36:29
      當面硬剛!范戴克直播中再懟魯尼,有理有據(jù),爭執(zhí)現(xiàn)場太刺激

      當面硬剛!范戴克直播中再懟魯尼,有理有據(jù),爭執(zhí)現(xiàn)場太刺激

      夜白侃球
      2025-11-05 11:16:17
      汪小菲夫婦帶著一對兒女成都游玩,奶奶張?zhí)m也來了一家五口好開心

      汪小菲夫婦帶著一對兒女成都游玩,奶奶張?zhí)m也來了一家五口好開心

      翰林濤濤
      2025-11-05 08:32:43
      屠穎骨灰已到臺北,現(xiàn)場畫面曝光,親屬哭成淚人,供臺擺放太簡約

      屠穎骨灰已到臺北,現(xiàn)場畫面曝光,親屬哭成淚人,供臺擺放太簡約

      好賢觀史記
      2025-11-05 12:12:20
      又一魔獸電影將登大熒幕!漢尼拔演員參演

      又一魔獸電影將登大熒幕!漢尼拔演員參演

      游民星空
      2025-11-05 12:24:17
      2025-11-05 13:48:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15819文章數(shù) 514264關注度
      往期回顧 全部

      科技要聞

      馬斯克萬億美元薪酬投票在即,大股東反對

      頭條要聞

      牛彈琴:美國上演極致"流氓外交" 讓西方媒體目瞪口呆

      頭條要聞

      牛彈琴:美國上演極致"流氓外交" 讓西方媒體目瞪口呆

      體育要聞

      開拓者的11號簽,變成了灰熊未來核心?

      娛樂要聞

      王家衛(wèi)事件再次升級,可憐了這些明星

      財經(jīng)要聞

      中方官宣!對美關稅,調整!

      汽車要聞

      首家"A+H"豪華新能源車企 賽力斯登陸港交所主板

      態(tài)度原創(chuàng)

      旅游
      本地
      數(shù)碼
      時尚
      公開課

      旅游要聞

      恢復電子簽證,菲律賓旅游業(yè)期待找回“丟失的中國市場份額”

      本地新聞

      秋顏悅色 | 在榆中,秋天是一場盛大的視覺交響

      數(shù)碼要聞

      7年前的GTX 1650 SUPER原型卡重見天日:少了128個核心 但多了PCIe 4.0

      2025羽絨服8大流行趨勢,溫暖時髦過冬天!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 午夜av高清在线观看| 亚洲人成小说网站色在线 | 国产精品成| 美腿丝袜亚洲综合在线视频| 日韩精品中文字幕人妻| 国产精品午夜福利在线观看| 亚洲人午夜精品射精日韩| 国产极品精品自在线不卡| 激情视频乱一区二区三区| 猫咪www免费人成网站| 97国产成人无码精品久久久| 久久国产精品乱子乱精品| 国产精品一二区在线观看| 欧美肥老太牲交大战| 国内精品久久人妻无码妲| 国产成人精品无码一区二区| 亚洲男人第一无码av网| 狠狠色丁香婷婷综合尤物| 亚洲天堂av免费在线看| 日韩成人无码影院| 小污女小欲女导航| 久久视频这里只精品| 欧美丰满妇大ass| 你懂的在线视频一区二区| 亚洲久悠悠色悠在线播放| 国产亚洲一区二区三区av| 成人免费av在线观看| 久久se精品一区精品二区| 精品免费看国产一区二区| 性人久久久久| 亚洲色欲色欱WWW在线| 一区二区福利在线视频| 青春草在线视频观看| 玩弄漂亮少妇高潮白浆| 在线 欧美 中文 亚洲 精品| 欧美高清freexxxx性| 国产性一交一乱一伦一色一情 | 精品国产一区二区三区av性色| 亚洲成av人片乱码色午夜| 保靖县| 久久96热在精品国产高清|