Anthropic 根據內部測試指出,Mythos 能在極短的時間內,自主發現數千個高風險的零日漏洞,攻擊範圍幾乎涵蓋了當前所有主流的作業系統和網頁瀏覽器。更關鍵的是,這些能力不需要專業資安背景即可啟動。
當中最引人注目的,是該模型找出了一個隱藏在重視安全的開源作業系統 OpenBSD 中長達 27 年的缺陷,以及一個在知名影音處理框架 FFmpeg 中、過去經歷五百萬次自動化掃描測試都未能察覺的 16 年陳年漏洞。
Anthropic 表示,AI 的寫程式能力已達一定水準,而在發現和利用軟體漏洞方面,其能力可以超越絕大多數人類,僅次於經驗最豐富的開發者。Anthropic 近期承認 Opus 4.6 在開發有效漏洞利用程式碼方面表現不佳,成功率幾乎為零,而 Mythos Preview 的漏洞利用成功率高達 72.4%。《The Register》形容,Mythos 就是一個能「產生」零日漏洞的 AI 模型。
不過更讓網路安全專家不安的,不只漏洞發現數量,而是 Mythos 展現出了一種極其危險的新型攻擊潛力。過去,單一的微小漏洞或許不足以造成致命威脅,但 Mythos 具備將多個不起眼漏洞串聯起來的能力,形成一種新型攻擊。
例如,它能夠自主編寫複雜的 JIT 堆積噴灑程式碼,成功逃脫瀏覽器與作業系統的沙盒限制,甚至在無需人為介入的情況下,串聯多個漏洞以獲取作業系統的最高管理員權限。這種能力大幅縮減漏洞發現與被利用之間的時間差,削弱了現有的防禦機制。Anthropic 研究人員表示,背後主因是 Mythos 擁有更進階的推理能力。
「由於 Claude Mythos Preview 的網路安全特性,我們不打算將其公開發布,」Anthropic 前沿紅隊網路安全負責人 Newton Cheng 接受《VentureBeat》採訪時表示,「鑑於 AI 的發展速度,這類能力很快就會擴散,甚至可能超出那些致力於安全部署 AI 的機構與企業所能掌控的範圍。這將對經濟、公共安全與國家安全造成嚴重影響。」
進一步來說,Anthropic 其實在論證,他們開發的這款工具功能強大,足以重塑網路安全格局,而唯一負責任的做法就是限制其使用範圍,同時給予防禦者先機。