網易首頁 > 網易號 > 正文申請入駐

OpenAI首個GPT-5找Bug智能體：全自動讀代碼找漏洞寫修復

2025-10-31 12:52:13　來源: 量子位

香港舉報

分享至

henry 發自凹非寺
量子位 | 公眾號 QbitAI

AI Coding火了大半年，AI Debugging也來了！

剛剛，OpenAI發布由GPT-5驅動的“白帽”Agent——Aardvark（土豚）

這只“AI安全研究員”能幫助開發者和安全團隊，在大規模代碼庫中自動發現并修復安全漏洞

據OpenAI報告，Aardvark已識別出了92%的已知與人工注入漏洞，而且能定位僅在復雜條件下出現的問題。

OpenAI副總裁Matt Knight表示：

我們的開發者發現，土豚在清晰地解釋問題并引導他們找到修復方案方面確實非常有價值。這個信號告訴我們，我們正走在一條有意義的道路上。

而且，不僅OpenAI。

整個10月Anthropic谷歌微軟基本上是前腳跟后腳發布了類似的白帽Agent。

這是怎么一回事。

Agentic AI +自動修補漏洞

OpenAI對這款白帽Aardvark的官方描述是——代理型安全研究員（agentic security researcher）

Aardvark的核心任務是持續分析源代碼倉庫，以識別安全漏洞、評估可利用性、確定風險等級，并提出有針對性的修復方案。

它通過監控代碼提交（commits）與變更來工作，自動識別潛在漏洞、推斷攻擊路徑并生成修復建議。

Aardvark并不依賴傳統的程序分析技術（如模糊測試fuzzing或軟件成分分析SCA），而是運用大語言模型驅動的推理與工具使用能力來理解代碼行為，像人類安全研究員那樣閱讀、分析代碼、編寫測試并運行驗證。

具體來說，它的工作流程從Git倉庫出發，依次經歷：威脅建模→漏洞發現→沙盒驗證→Codex 修復→人工復審→ 提交Pull Request。

分析：對整個倉庫進行全面分析，生成反映項目安全目標與設計的威脅模型（threat model）。
提交掃描：新代碼提交時，結合倉庫和威脅模型掃描差異；首次連接倉庫時回溯歷史提交。同時解釋發現的漏洞，在代碼中標注，便于人工復審。
驗證：一旦識別出潛在漏洞，將在隔離環境中觸發潛在漏洞，確認可利用性，同時說明驗證步驟，確保結果準確且誤報率低。
修復：Aardvark與OpenAI Codex深度集成，為漏洞生成修復補丁，附于報告中，便于一鍵審閱與應用。

目前，Aardvark可無縫集成GitHub、Codex及現有開發流程，在不影響開發效率的前提下提供可執行的安全洞察。

內部測試顯示，它不僅能識別安全漏洞，還能發現邏輯缺陷、不完整修復及隱私風險

而且，Aardvark 已在內部和合作伙伴項目中測試運行，表現出色，驗證了其實際可用性。

正如開頭提到的，它不僅能夠進行深度分析、定位僅在復雜條件下出現的問題，在對“黃金測試倉庫（golden repositories）”的基準測試中，也實現了92%的識別率。

此外，Aardvark也已應用于多個開源項目，發現并負責披露了眾多漏洞，其中10個已獲得CVE編號。

OpenAI表示將為部分非商業開源倉庫提供公益掃描服務，并提升整個開源生態與供應鏈的安全性。

Aardvark現已開啟內測，有需要的開發者可以直接在官網申請。

AI編程完，AI來修

就像開頭提到的，不僅是OpenAI，其他科技巨頭也在積極布局Agentic?AI+代碼安全

整個10月，谷歌、Anthropic、微軟就像提前約好了似的，紛紛發布相關動作，OpenAI這次反而顯得稍晚。

例如，Anthropic在10月4號表示將Claude Sonnet 4.5應用于代碼安全任務。

據悉，Claude Sonnet 4.5在發現代碼漏洞和其他網絡安全技能方面，性能已經超越了Opus 4.1，并且價格更低、速度更快。

谷歌在10月6號發布了CodeMender，利用Gemini Deep Think模型，實現自主調試和漏洞修復。

微軟在10月16號發布了Vuln.AI，正式宣告使用AI進行漏洞管理，而在10月的最后一天，OpenAI也是姍姍來遲，跟上了這次更新的節奏。

（注：各家在發布前均進行了數月的測試和驗證）

那么，為什么這些巨頭都選擇在此時發力AI代碼安全呢？

OpenAI以及其他公司的解釋高度一致：人工Debug與傳統的自動化方法（如模糊測試）已經跟不上大規模代碼庫的漏洞發現與修復需求

一方面，企業級網絡中設備、服務、代碼庫數量巨大，另一方面AI技術雖能提高生產力，但也被用于快速尋找漏洞、生成攻擊代碼。

因此，在漏洞數量激增、攻擊手段日益智能化的背景下，借助AI自動化發現與修復漏洞，已成為確保軟件安全和降低企業風險的關鍵手段。

不過，大廠說管說，倒是有網友發現了“華點”：

我們有一個會制造安全漏洞的Agent，也有一個會修復安全漏洞的Agent，這就是最好的商業模式。

[1]https://x.com/OpenAI/status/1983956431360659467

[2]https://openai.com/index/introducing-aardvark/

[3]https://www.anthropic.com/research/building-ai-cyber-defenders?utm_source=chatgpt.com

[4]https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/

[5]https://www.microsoft.com/insidetrack/blog/vuln-ai-our-ai-powered-leap-into-vulnerability-management-at-microsoft/?utm_source=chatgpt.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

OpenAI虧麻了，對手正在AI賺錢路上加速趕超，估值破萬億

智東西 2025-11-05 20:53:08
5 跟貼 5
微軟聯手AI算力獨角獸，簽數十億刀AI基建訂單、部署數萬塊英偉達GPU

智東西 2025-11-05 21:24:05
7 跟貼 7

微軟機房大量英偉達GPU開始吃灰

量子位 2025-11-04 12:45:47
14 跟貼 14

AI也邪修！Qwen3改Bug測試直接搜GitHub，太擬人了

量子位 2025-09-04 14:49:30
7 跟貼 7
AI不會讓你成為10倍工程師

量子位 2025-08-11 10:02:45
3 跟貼 3

大摩實測OpenAI投資的家務機器人：現階段僅是“融資策略”，而非真正實用工具

華爾街見聞官方 2025-11-05 14:57:11
0 跟貼 0

剛剛，華為AI推理大招開源，時延降90%，吞吐提22倍，上下文10倍級擴展

智東西 2025-11-05 17:53:14
4 跟貼 4
從風口黑馬到“斷供現場”，Trae背靠字節也擋不住“紅線”鎖喉

鈦媒體APP 2025-11-05 17:53:06
47 跟貼 47

Codeforces難題不夠刷？謝賽寧等造了AI出題機，能生成原創編程題

機器之心Pro 2025-10-20 14:17:05
0 跟貼 0
OpenAI引爆新賽道：AI不再賣技術，而是賣「活人感」！

新智元 2025-11-05 19:52:01
0 跟貼 0
長視頻AI數字人來了！字節×浙大(1)

機器之心Pro 2025-09-04 17:27:37
0 跟貼 0
當Search Agent遇上不靠譜搜索結果，清華團隊祭出自動化紅隊框架

機器之心Pro 2025-10-16 16:00:02
0 跟貼 0
我MiniMax，用實習生處理數據，照樣屠榜開源大模型

量子位 2025-11-04 13:14:18
4 跟貼 4
智能體驅動：企業從“界面操作”到“智能助力”的必然路徑

鈦媒體APP 2025-10-20 16:40:12
0 跟貼 0
Sakana AI造了個數字生命「培養皿」，AI學會打架、結盟、搶地盤

機器之心Pro 2025-11-05 13:58:14
0 跟貼 0
開源RL框架Verlog來了，專為LLM智能體打造，400回合不成問題

機器之心Pro 2025-10-08 15:52:12
0 跟貼 0
OpenAI被指欺詐？

機器之心Pro 2025-09-28 17:01:32
0 跟貼 0
2025世界大學校長論壇 | 重磅嘉賓搶先看！

中國高等教育學會 2025-11-06 00:01:28
0 跟貼 0
OpenAI合縱亞馬遜，微軟連橫Anthropic，硅谷只有利益沒有盟友

量子位 2025-11-05 14:41:39
1 跟貼 1
何小鵬和雷軍真正的塑料兄弟

雷科技 2025-06-06 21:23:05
59 跟貼 59
OpenAI官宣：全球企業客戶突破100萬席位數量超700萬

財聯社 2025-11-06 03:48:05
0 跟貼 0
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
6 跟貼 6
造福or替代程序員？實測阿里新模型

虎嗅APP 2025-07-23 22:42:47
13 跟貼 13
肉體消亡并非終點，上載新生竟藏著致命漏洞

柒柒看劇 2025-11-04 09:48:28
1 跟貼 1
在星巴克和瑞幸店里“枯坐”一整天，我們發現了咖啡的資本密碼

飯統戴老板 2025-09-10 19:37:27
35 跟貼 35
1斤豆芽賣28.8元？網友直呼“吃不起”，知名餐飲品牌回應

都市快報橙柿互動 2025-11-02 16:20:16
8617 跟貼 8617
PS5上最貴游戲竟然是微軟的？頂配版賣到了200美元

游民星空 2025-11-05 21:24:36
9 跟貼 9
佐赫蘭·馬姆達尼成為美國紐約市史上首位印度裔市長

央視新聞客戶端 2025-11-05 11:23:28
9202 跟貼 9202
世界和平全靠這款軟件了

肥羅愛追劇 2025-11-04 08:20:44
1 跟貼 1
幾千年終于到了

長盛投資思維 2025-11-04 14:29:09
0 跟貼 0
烏克蘭公布“罕見”作戰畫面！外媒：烏特種部隊乘“黑鷹”直升機突襲波克羅夫斯克

環球網資訊 2025-11-05 16:09:59
7080 跟貼 7080
幾種降壓藥安全性排名!最安全的竟是它，危害最大的需警惕!

鑫鑫知識分享 2025-11-04 16:44:45
0 跟貼 0
美股三大指數集體收漲谷歌創歷史收盤新高

每日經濟新聞 2025-11-06 05:05:06
0 跟貼 0
要擺脫Steam？索尼PS5與PC跨平臺購買傳聞引熱議

游民星空 2025-11-05 18:12:12
3 跟貼 3
AI理解語言的終極密碼，千問3向量模型開源，性能超谷歌OpenAI

機器之心Pro 2025-06-11 19:17:56
0 跟貼 0
輕量高效，即插即用：Video-RAG為長視頻理解帶來新范式

機器之心Pro 2025-10-20 18:23:17
0 跟貼 0
小鵬全新飛行汽車亮相：續航超500公里！何小鵬打出“安全牌”：高管先飛，必須飛滿5000公里

每日經濟新聞 2025-11-05 19:25:06
1634 跟貼 1634
國務院公告后搜索暴漲3倍上海人立馬出手：怕搶不到

極目新聞 2025-11-05 15:06:20
430 跟貼 430
大模型公司不搞瀏覽器搞Agent，實測找到原因了

量子位 2025-10-31 16:54:34
2 跟貼 2
余承東：我有一個夢想馬路上的所有車里都有華為的技術

每日經濟新聞 2025-07-23 17:06:16
161 跟貼 161

手機 / 數碼

房產 / 家居

OpenAI首個GPT-5找Bug智能體：全自動讀代碼找漏洞寫修復

大轉彎!特朗普再提名馬斯克盟友任NASA局長

美國發射洲際彈道導彈 俄羅斯：俄方不參加軍備競賽

美國發射洲際彈道導彈 俄羅斯：俄方不參加軍備競賽

贏下皇馬，會是利物浦的轉折點嗎？

港星林尚武突發心臟病去世

事關加快建設金融強國 中央金融辦發聲

智己LS9入局"9系"混戰 全尺寸SUV市場迎來新變量

態度原創

超聲探頭會加重受傷情況嗎？

最新！海南樓市10月熱銷榜單出爐！

科教融合 四川越西舉辦青少年機器人比賽

今年一定要擁有這件大衣，復古又時髦！

美國發射洲際彈道導彈俄羅斯：俄方不參加軍備競賽

美國發射洲際彈道導彈俄羅斯：俄方不參加軍備競賽

事關加快建設金融強國中央金融辦發聲

智己LS9入局"9系"混戰全尺寸SUV市場迎來新變量

科教融合四川越西舉辦青少年機器人比賽