![]()
新智元報道
編輯:KingHZ
【新智元導讀】學界殺入主賽道!UCL 校園團隊 EuniAI 拋出開源智能體 Prometheus,在 SWE-bench Verified 上 71.2% Pass@1、主榜實錘合并;成本低至 $0.23/issue。
來自倫敦大學學院(UCL)的初創團隊EuniAI開源發布了AI軟件智能體Prometheus。
該系統在SWE-bench Verified上取得71.2%的Pass@1成功率,成績已被官方確認并合并至主榜單。
令人矚目的是,這一成果來自高校科研團隊,卻已與產業巨頭同臺競技,展現出學術研發在AI工程領域的產業級突破。
從學術論文到全球榜單
高校科研的「產業級突破」
Prometheus源自論文:
![]()
論文地址:https://arxiv.org/abs/2507.19942
開源代碼:https://github.com/EuniAI/Prometheus
官網Demo:https://euni.ai/
官方榜單確認:https://github.com/SWE-bench/experiments/pull/339
![]()
它不僅通過開源代碼和Neo4J知識圖譜技術,讓AI「讀懂代碼」,還能在實際GitHub項目中實現自動修復錯誤、驗證補丁,甚至生成可直接提交的修復說明。
全球榜單:成績亮眼
SWE-bench Verified:71.2% Pass@1(官方確認 merge)
SWE-bench Lite:35.33% Pass@1(開源模型SOTA)
平均API成本:僅$0.23/issue
![]()
技術亮點:讓AI真正「理解」代碼結構
Prometheus的突破在于:它不是提示工程的產物,而是圖結構推理的系統性設計。
統一知識圖譜(UnifiedKnowledge Graph)將代碼結構整合文件結構、AST抽象語法樹和文檔信息,將復雜代碼庫轉化為可推理的知識網絡,實現多語言語法理解與跨文件依賴分析。
多智能體協作框架(Multi-Agent System)包含六個專職Agent,從問題分類、環境重現到補丁生成與驗證,實現端到端自動化開發閉環。
跨語言與可擴展性覆蓋Python、Java、Rust、C/C++、Go、TypeScript、PHP、Ruby等主流語言,支持真實世界項目自動構建與測試。
低成本+高可復現性Prometheus使用DeepSeek-V3模型,性能與GPT-4o相近,但成本僅為其1/9。支持在筆記本級硬件上運行完整修復流程。
![]()
在線Demo
從論文到真實工程的橋梁
為展示Prometheus的工程化能力,EuniAI團隊在官網上線了交互式演示平臺:https://euni.ai/
該平臺支持用戶直接連接項目,選擇待修復任務,系統將自動完成以下全自動流程操作:
自動環境構建與依賴安裝
問題分析與知識圖譜檢索
補丁生成與自動驗證
結果可視化與差異對比(Diff View)
目前Demo版本支持Python與多語言項目,提供限量邀請碼注冊體驗,并持續向學術機構與開發者開放內測合作。
我們希望AI不再只是「補代碼」,而是理解項目結構、能獨立調試和修復的工程伙伴。 ——EuniAI團隊
EuniAI團隊由UCL助理教授葉荷(HeYe)領銜,成員來自倫敦大學學院、KTH皇家理工學院和CMU等國際高校。
他們以「科研與開源并行」的方式,推動AI智能體真正落地,讓學術創新真正服務于軟件開發一線。
未來展望
EuniAI團隊對下一代智能代碼分析與自動修復系統的展望:
「Prometheus的愿景,是讓AI不僅寫代碼、修代碼,更能理解整個軟件生態,并與人類工程師共同進化。」
未來,EuniAI團隊計劃讓Prometheus擁有更強的「工程意識」:
智能修復代理(Issue Resolution Agent):自動檢測、修復并提交補丁,實現端到端自動化修復。
知識圖譜生成(Codebase → Graph):一鍵將代碼庫結構化,提升上下文檢索與跨語言理解。
項目記憶與學習(Agent Memory + Post-Train Model):讓智能體具備項目經驗與長期記憶,不斷自我優化。
自動構建與驗證(Automated Build Agent):生成補丁后自動測試與驗證,保障修復質量。
生態集成(MCP & TerminalAutomation):支持Model Context Protocol與終端自動化,構建完整的AI工程流水線。
Prometheus不止是一款智能體系統,它是下一代代碼理解與自動修復平臺的起點。
立即體驗Demo!
https://euni.ai/
上傳一個項目與待修復任務,見證AI從識別問題、生成補丁、到自動驗證的全過程。
(限量邀請碼正在開放中)
參考資料:
https://arxiv.org/abs/2507.19942
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.