首頁 科技 科技要聞

Claude原始碼外洩 意外曝光核心運作

Anthropic推送的檔案 包含51.2萬行原始碼 暴露其工具呼叫邏輯、記憶體架構、權限模型等運作

人工智慧公司Anthropic在3月31日更新工具時,洩露其聊天機器人「Claude Code」的原始碼。示意圖。(Riccardo Milani/Hans Lucas/AFP via Getty Images)
人工智慧公司Anthropic在3月31日更新工具時,洩露其聊天機器人「Claude Code」的原始碼。示意圖。(Riccardo Milani/Hans Lucas/AFP via Getty Images)

【記者李思齊/綜合報導】美國人工智慧(AI)公司Anthropic週二(3月31日)表示,該公司更新工具時,不慎洩露其AI聊天機器人「Claude Code」的原始碼。這些內容很快在網路上被傳播複製。

Claude Code是Anthropic向開發者提供的AI寫程式工具。據Anthropic發言人的聲明,此次外洩源於公開在「NPM註冊表」(NPM Registry)推送的@anthropic-ai/claude-code 2.1.88版本,由於打包設定錯誤,意外包含一個59.8MB的JavaScript來源對照檔(source map),這個檔案原本用於內部偵錯。

該檔案指向51.2萬行完整的TypeScript原始碼,涉及檔案數量約在1,900個到2,300個之間。

洩漏事件很快被一名軟體工程師在X平台上公開,其貼文包括一個下載連結。消息在社群上傳開後,這批原始碼被上傳到世界上最大開源平台GitHub,成為許多開發者研究的對象。

Anthropic聲明,「今天(週二)稍早,Claude Code的版本推送中包含了部分內部原始碼。其中並未涉及或洩露敏感的客戶資料或憑證。這是由人為錯誤導致的發布「打包失誤」(packaging mistake),並非安全漏洞。我們正在採取措施以防止此類情況再次發生。」

Anthropic專有技術外洩

截至週三(4月1日)上午,Anthropic透過版權手段,強制刪除開發者們分享在GitHub平台上的逾8千份Claude Code原始指令副本和改編版本。

Anthropic的發言人表示,這次失誤未涉及公司AI模型中寶貴的內部權重(weights)。

這次洩漏暴露的是Claude Code的CLI客戶端與代理層,包括其工具呼叫邏輯、記憶體架構、權限模型、用量計算、邏輯推理模式、自動重試功能等。

這些屬於Anthropic產品層的專有技術,這些技術和工具被稱為駕馭AI能力的「馬具」(Harness),即一套控制、串接並發揮AI效能的工具或框架;但不包含Claude語言模型的內部權重、訓練資料或核心AI基礎架構。

駭客獲得找漏洞的新資訊

不過,由於完整原始碼已被上傳到GitHub,這讓眾多在AI領域的新創公司及Anthropic的競爭對手們,更容易檢視Claude Code的邏輯、尋找潛在弱點或設計繞過方式。

Claude Code的很多安全限制都寫在底層原始碼中,例如不能編寫有危害的內容、不能去詐騙等。底層指令包含很多產品的關鍵設計理念、回答提問的策略、安全與優先等級邏輯等核心資訊。獲得底層原始碼的不法分子或可設計有針對性的程式,來繞過Claude Code的安全限制。

這也讓駭客獲得大量新資訊來尋找漏洞,然後利用這些漏洞來攻擊Claude Code,這會給Anthropic及該工具的使用者帶來風險。外洩事件可能影響Anthropic的安全聲譽,以致影響現有或潛在客戶的信任。

Anthropic在自身網站沒有發布有關洩漏的資訊。通常公司的原始碼外洩後,公司需要更新安全策略與打包流程。◇