Open fulfulggg opened 1 week ago
実世界の敵対的攻撃は、顔認証や自動運転といった視覚ベースのシステムのセキュリティに重大な脅威をもたらします。既存の敵対的パッチ手法は主に攻撃性能の向上に焦点を当てていますが、人間が容易に検知できるパッチを生成してしまうことが多く、環境との整合性、つまりパッチを環境に溶け込ませることが困難です。本論文では、パッチの視覚的な自然さと環境整合性の両方を考慮した、新しい敵対的パッチ生成手法を提案します。提案手法であるプロンプト誘導型環境整合性敵対的パッチ(PG-ECAP)は、パッチを環境に調和させ、環境へのシームレスな統合を保証します。この手法は、拡散モデルを活用することで、環境整合性と検知回避効果の両方を備えたパッチを生成します。自然さと整合性をさらに向上させるために、プロンプトアライメント損失と潜在空間アライメント損失という2つのアライメント損失を導入し、生成されたパッチが環境に自然に適合しつつ、敵対的特性を維持するようにします。デジタルおよび物理ドメインの両方における広範な実験により、PG-ECAPは攻撃成功率と環境整合性において既存の手法を凌駕することを実証しました。
@yukihiko-fuyuki が以下のラベルを提案し、適用しました:
この論文は、AIシステムを騙すための「敵対的パッチ」を、より自然で目立たないように生成する新しい手法を提案しています。
簡単に言うと、この研究は、AIシステムを騙す「ステルスパッチ」を作る方法を提案しており、そのパッチは効果的であると同時に、周囲に溶け込むため、人間には見破られにくいという特徴があります。
タイトル: プロンプトで制御可能な環境整合性のある敵対的パッチ
リンク: https://arxiv.org/abs/2411.10498
概要:
実世界の敵対的攻撃は、顔認証や自動運転といった視覚ベースのシステムのセキュリティに重大な脅威をもたらします。既存の敵対的パッチ手法は主に攻撃性能の向上に焦点を当てていますが、人間が容易に検知できるパッチを生成してしまうことが多く、環境との整合性、つまりパッチを環境に溶け込ませることが困難です。本論文では、パッチの視覚的な自然さと環境整合性の両方を考慮した、新しい敵対的パッチ生成手法を提案します。提案手法であるプロンプト誘導型環境整合性敵対的パッチ(PG-ECAP)は、パッチを環境に調和させ、環境へのシームレスな統合を保証します。この手法は、拡散モデルを活用することで、環境整合性と検知回避効果の両方を備えたパッチを生成します。自然さと整合性をさらに向上させるために、プロンプトアライメント損失と潜在空間アライメント損失という2つのアライメント損失を導入し、生成されたパッチが環境に自然に適合しつつ、敵対的特性を維持するようにします。デジタルおよび物理ドメインの両方における広範な実験により、PG-ECAPは攻撃成功率と環境整合性において既存の手法を凌駕することを実証しました。