エージェント・スミスが現実に? Digital.ai(デジタルエーアイ)が自律型エージェント攻撃の脅威を解説
ソフトウェアセキュリティーを展開するDigital.ai(デジタルエーアイ)が、AIを駆使したサイバー攻撃の新たな脅威について警鐘を鳴らしている。同社のEngineering DirectorであるCole Herzog氏は、現代のサイバー脅威が単なる「AI支援型」の段階を通り越し、AI自らが主体となって動く「自律型エージェント攻撃(AAA:Autonomous Agentic Attacker)」の時代に突入したと指摘した。
この進化の不気味さを、Herzog氏は映画『マトリックス』に登場する反乱プログラム、エージェント・スミスになぞらえて解説している。かつてのエージェント・スミスがシステムの制約を離れて自己増殖し、プログラムを次々と上書きしていったように、最新のAI攻撃ツールもまた、LLMの「ガードレール」を巧みに回避しながら自律的に動く能力を備え始めている。同氏が公開されているLLMに対し、攻撃者を模倣するよう指示したところ、そのLLMは自らのセキュリティーチェックを回避する手法を自ら提案し、さらにはセキュリティー研究者を装うよう助言したという。これは、AIがすでに自律的な「自己認識」を持って防御を突破しようとする段階にあることを示唆している。
具体的な実例として、Herzog氏は「PROMPTFLUX」などのツールの存在を挙げた。これはGoogleのGemini APIを利用し、実行中に自らのコードを「再生成的」に書き換えることで、特定の実行パターンに依存する検知システムを無力化する。攻撃ツールそのものが、エージェント・スミスのように配備中もリアルタイムで進化し、新しい脆弱性を自ら発見しては自らを改変し続けるのだ。
こうした事態を受け、Digital.aiは防御側もまた劇的な進化を遂げる必要があると主張している。従来の「構文(シンタックス)」に基づいた、つまり既知の悪いシグネチャーを探す手法では、瞬時に形を変えるAIエージェントには対応できない。今後は、コードが持つ「意味(セマンティック)」、すなわち悪意ある意図そのものを特定する防御への転換が不可欠となるという。人間が介在せず、AI同士が知能を競い合う「オートボット対ディセプティコン」のような機械的な戦争は、もはやSFではなく現実の脅威として目前に迫っているようだ。
出典:Digital.ai
