
商傳媒|葉安庭/綜合外電報導
舊金山——專為代理式AI系統打造的資安平台Votal AI,今日(19日)宣布在其「持續代理式紅隊演練」(Continuous Agentic Red Teaming, CART)平台中,推出兩項創新功能,以協助企業強化自主AI系統的資安韌性。這兩項新功能包括一套經強化學習人類回饋(RLHF)訓練的對抗性攻擊模型,以及開源的全面攻擊目錄。
Votal AI由資安領域資深人士Bobby Gupta(執行長)和Jyotirmoy Sundi(技術長)共同創立。此波發布恰逢2026年RSA資安大會(訂於3月23日至26日在舊金山莫斯康中心舉行)登場前夕。屆時,Votal AI將於會中進行實況展示,模擬多階段攻擊活動以對抗實際運作中的代理式AI系統。此舉旨在使資安決策者能在代理式AI廣泛採用及潛在風險升高的背景下,評估並部署持續紅隊演練解決方案。
應對代理式AI擴大攻擊面挑戰
隨著自主代理式AI系統能自主調度工具、查詢資料、執行交易並做出決策,其攻擊面已大幅擴展,遠超傳統大型語言模型(LLM)的範疇。單一次成功的「越獄」(jailbreak)或工具濫用,可能導致未經授權的API呼叫、資料外洩、跨租戶污染或法規遵循違規。面對這些非確定性且具自主性的代理,傳統單點式的紅隊演練已顯不足。
Votal AI的CART平台旨在彌補這項資安漏洞,提供專為代理式AI時代量身打造的自動化、持續性對抗測試。平台不僅能大規模提供可執行的情資、合規性對應,並協助大規模進行修復。
兩大創新功能助力資安防禦
-
RLHF訓練的對抗性攻擊模型: 此模型透過人類紅隊專家的強化學習進行微調,不僅從提示(prompts)中學習,更從實際的繞過結果中獲取經驗,進而生成適應性強且有效的攻擊。該模型能夠導航CART平台所設計的七階段代理式AI殺傷鏈,包含提示注入、權限提升、偵察、透過RAG/記憶中毒進行持久化、透過工具濫用進行命令與控制、橫向移動,以及達成目標行動。同時,模型會持續根據新興威脅(包括最新研究、常見漏洞與暴露情報、情資饋送)進行再訓練,與攻擊者同步演進,為高風險部署提供基於證據的保證。
-
** 開源攻擊目錄:** Votal AI將其結構化的攻擊目錄開源,內容涵蓋逾35個資安類別、185種命名技術、18種編碼/混淆類型以及8種多代理情境。此目錄與Pangea、CrowdStrike、OWASP LLM Top 10、NIST AI風險管理框架、MITRE ATLAS、歐盟AI法案、GDPR、HIPAA、PCI-DSS等多項標準與規範保持一致。資安團隊、研究人員和開發者可檢查、客製化並貢獻攻擊向量(經審查後納入CART平台),實現特定產業的擴展性,例如醫療保健領域的受保護健康資訊洩漏、金融領域的未經授權交易,以及製造業的工業控制系統操控等。
Votal AI共同創辦人暨執行長Bobby Gupta與共同創辦人暨技術長Jyotirmoy Sundi表示:「隨著代理式AI逐漸成為關鍵基礎設施,資安需求顯而易見:靜態或週期性測試已不再足夠。這些系統會做出具有實際世界影響的自主決策,因此需要持續且適應性強的紅隊演練。透過釋出我們經RLHF訓練的攻擊模型並開源攻擊目錄,我們正在為資安長、AI副總裁及資訊長等專業人士提供透明且社群驅動的工具,以便從一開始就建立具韌性且符合規範的AI生態系統。」
Votal AI平台的重要功能還包括超過10萬個動態攻擊提示,分佈於逾35個類別;其RLHF訓練的適應性攻擊者效能比人類紅隊成員快20倍;具備領先業界的30毫秒防護牆延遲;提供22個預設產業掃描套件及6種驗證類型,並支援完整的合規性對應與稽核報告。
Votal AI總部位於舊金山,其持續代理式紅隊演練(CART)平台主要服務醫療保健、金融、製造業及政府部門等受監管的企業。


