Generating Adversarial Computer Programs using Optimized Obfuscations

1 はじめに

機械学習(ML)モデルは，ソフトウェアエンジニアリング業務に利用される機会が増えています．プログラムのリファクタリング、エディタでの自動補完、GUIコードの合成などのアプリケーションは、GitHubのような人気のあるウェブサイトから調達した、プログラムの大規模なリポジトリで学習したMLモデルの恩恵を受けている（Allamanis et al. また、プログラムの推論や評価（Srikant & Aggarwal, 2014; Si et al., 2018）、バグの発見と修正（Gupta et al., 2017; Pradel & Sen, 2018）、マルウェアやプログラムの脆弱性の検出（Li et al., 2018; Zhou et al., 2019）などにも採用されており、従来のプログラム解析ツールを補完しています。これらのモデルがこのようなアプリケーションに採用され続ける中で、敵対的な攻撃に対してどれだけ堅牢であるかを理解することが重要です。このような攻撃は、特にセキュリティ（Zhou et al., 2019）やコンプライアンスの自動化（Pedersen, 2010）などの設定において、悪影響を及ぼす可能性があります。例えば、攻撃者は、悪意のあるプログラムの変更を細工して、モデルがそれらを良性のものとして誤って分類するように仕向けたり、オープンソースとしてライセンスされているコードを組織のプロプライエタリなコードベースで受け渡すように変更したりすることができます。

プログラムを敵対的に擾乱することは、2つの目標を達成する必要があります。 1つは、プログラムの擾乱されたバージョンを与えられたときに、学習されたモデルの判断を反転させること、もう1つは、擾乱が目に見えないことです。敵対的攻撃は主に画像分類で検討されており（Goodfellow et al., 2014; Carlini & Wagner, 2017; Madry et al., 2018）、画像のピクセルに加えられた計算された小さな変更は、感知不能の要件を満たすのに十分です。このような変更は、画像を擾乱する前と同じように見せることで人間の注意を逃れますが、その一方で、基礎的な表現を分類器の判断を反転させるほど変更します。

しかし、プログラムの場合は、より厳格な難読性が要求されます。変更が人間の注意を引かないだけでなく、変更されたプログラムは、重要な点として、機能的には妨害されていないプログラムと同じように動作しなければなりません。プログラムの難読化は、このようなプログラムの変更を実現するための手段です。コンピュータ・プログラムの難読化は、リバース・エンジニアリングの試みを回避する方法として、長い間利用されてきました。難読化とは、人間がプログラムの一部を理解するのを妨げるだけで、元のセマンティクスや機能を維持したまま、プログラムを変換することです。例えば、一般的な難読化の手法として、変数名を変更することで、プログラムの意図を読み手から隠そうとするものがあります。プログラムステートメントint sum = 0の変数sumの名前をint xyz = 0に変更しても、コンパイラがこの変数をどのように解析するかは変わらないし、プログラム内の計算や状態も変わらないので、この変数がプログラムの中でどのような役割を果たしているかを理解することができない。このように、プログラムのごく少数の部分を変更することで、人間がプログラムをどのように理解するかにわずかな影響を与えるだけで、人間にもコンパイラにも気づかれないような変化をもたらす方法を提供します。本研究では、プログラムに対する敵対的な摂動を、難読化変換を適用することの特別なケースとして捉えています。

想像を絶する変化をもたらす変換候補のセットを特定した上で、変換されたプログラムが敵対的になるような方法で特定のサブセットを選択する必要がある。この問題に最も接近した最近の試み（Yefet et al., 2019; Ramakrishnan et al., 2020; Bielik & Vechev, 2020）は、厳密な定式化を提供していない。彼らは、最適な変換のサブセットを選択するための原理的なアプローチを提示することなく、様々な変換を使用することを推奨している。我々は、解かれたときに、変換する正確な位置と、その位置に適用する変換を提供する定式化を提示する。図1はその例です。

ランダムに選択されたローカル変数（name）を、最先端のプログラムの攻撃生成アルゴリズム（Ramakrishnan et al.、2020）で生成された名前virtualnameに置き換えても、我々の提案するサイト最適化を適用しない限り、（セットアイテムを予測する）プログラムサマライザを欺くことはできません。セクション2で詳細な比較を行っています。我々は、敵対的プログラムを定義する際に中心となる2つの問題、すなわち、摂動を適用するプログラム内のサイトを特定することと、選択されたサイトに適用する特定の摂動を特定することを明らかにした。摂動とは、既存のトークンを置き換えたり、新しいトークンを挿入したりすることです。

本論文では、サイトの位置と各位置に対する摂動の選択をモデル化した摂動プログラムの一般的な数学的定式化を提供する。この定式化は、プログラミング言語やモデルを学習させるタスクに依存せず、プログラムへの複数の変換の適用をシームレスにモデル化する。
本研究では、提案した定式化を効率的に解くための一次最適化アルゴリズムを提案し、その結果、敵対的プログラムの微分可能な生成器を得る。さらに、最適化の性能を向上させるために、ランダム化された平滑化アルゴリズムを提案する。
我々のアプローチは、PythonおよびJavaプログラムの大規模データセットにおいて、最先端の攻撃生成アルゴリズム(Ramakrishnan et al., 2020)と比較して、攻撃成功率が1.5倍になることを実証した。
さらに、本手法をMLモデルの学習に用いた場合、最先端の手法と比較して、敵対的な攻撃に対する堅牢性が向上することを示しています。

e4exp / paper_manager_abstract

Generating Adversarial Computer Programs using Optimized Obfuscations #545

1 はじめに