人工智慧(AI)新創公司Anthropic週四(4日)發布研究報告,呼籲全球主要AI實驗室放緩甚至暫停開發最先進的AI系統,並警告AI正逐步接近「遞迴式自我改進」(Recursive Self-Improvement)能力,即AI系統在幾乎無需人類干預下就能自行升級,可能導致社會制度更難跟上AI進展速度。
根據Anthropic的報告指出,旗下AI模型Claude目前已撰寫超過80%公司內部程式碼,並參與研究與實驗工作,顯示AI正加速AI本身的發展進程。
Anthropic表示,目前AI模型的能力進步速度極快,正朝向「遞迴式自我改進」方向發展,也就是AI系統不再需要大量人工參與,就能夠自主優化與升級。
此機制被視為AI跨越人類智慧門檻並引發「智慧爆炸」的核心關鍵,已成為Google DeepMind與Anthropic等頂尖實驗室的研發重心。智慧爆炸是指AI發展到能自主設計更強大的下一代版本,並形成自我改進循環。而當機器的智慧以指數級速度飆升,最終恐達到人類無法預測或控制的地步。
暫緩開發 讓社會治理跟上技術
報告指出,目前尚未真正出現這種情況,遞迴式自我改進也不是必然會發生,但這種狀況的到來「可能比大多數政府與機構預測得更早」,「現有證據表明,在AI開發過程中的每一步,人類的角色都在不斷縮小」。
該公司研究人員認為,全球若能做到「放緩或臨時暫停尖端AI開發」,將有助於讓社會治理與安全研究跟上技術發展的速度。
不過,報告也說,「若缺乏全球協調機制,企業與政府將不得不在激烈競爭與地緣政治壓力下,做出艱難的安全相關決策。」如果只有單一業者停手,可能使競爭對手加快研發腳步。
Anthropic認為,如果希望全球真正實現暫停AI開發,就需要美國與中國等主要AI技術國家,以及一系列AI巨頭科技公司共同參與,同時建立一套可查核的監督系統。
Anthropic強調安全也引爭議
創立於2021年的Anthropic近年因推出Claude系列AI模型而迅速崛起,並在與OpenAI等科技巨頭的競爭中備受市場關注。近期傳出Anthropic完成了新一輪融資,公司估值已接近1兆美元,並已祕密啟動上市程序。
不過,該公司長期強調AI安全問題,也在業界引發爭議。風險投資人、川普政府非正式顧問薩克斯(David Sacks)曾批評Anthropic,認為其表面以「安全」為名,實際上是試圖透過監管限制競爭對手的發展。部分批評人士還指出,Anthropic反覆強調旗下最新AI模型存在潛在安全危險,也具有一定市場行銷效果。
Anthropic於2026年4月推出最先進且神祕的預覽版模型Claude Mythos,並展現出極為強大的自主網路安全能力。測試證實,該模型能夠自主發現並串聯多個「零日漏洞」,其挖掘與利用安全漏洞的能力遠超以往的AI模型(如Claude Opus 4.6等)。它甚至在各大作業系統與瀏覽器中,找出了隱藏數十年、連人類專家和自動化工具都未曾發現的系統安全漏洞。
由於擔心該模型若被駭客武器化,將引發災難性的網路攻擊,因此Anthropic拒絕向大眾開放Mythos,改採取封閉發布策略,僅提供給少數特定的大型科技公司、資安機構及關鍵基礎設施聯盟(如微軟、蘋果、亞馬遜、CrowdStrike、歐盟網路安全局等)進行防禦性的漏洞修復。
Anthropic此舉也被一些專業人士解讀為,是展示其技術實力的一種方式。
業界對AI未來仍存分歧
目前,人工智慧產業對於AI是否已接近「通用人工智慧」(AGI)仍存在巨大分歧。AGI是指接近、具備甚至超越人類智慧,能夠理解、學習並執行人類任何智力任務的理論系統。
AI領域知名學者、Meta前首席AI科學家勒昆(Yann LeCun)表示,現有的大型語言模型難以真正達到人類智慧水準。他曾形容,目前AI的智商更接近「貓的水準」,遠遠不如人類。
但Anthropic執行長阿莫戴(Dario Amodei)則多次警告,AI可能加劇社會不平等,甚至取代大量初級白領工作。
Anthropic公司表示,未來數月將與政策制定者、研究人員及其他AI公司展開討論,研究建立全球協調機制,以應對AI快速發展帶來的風險。◇


loading...
