人工知能でフェイク画像を見破る #AI #AdobeSensei #Photoshop

28年前、Photoshopは写真をデジタルな世界に取り入れ、人と画像との関係性を再定義しました。いまや画像編集は、芸術的表現を新たな高みに押し上げ、家族の記憶を守り、失踪児童の捜索にまでも役立っています。その反面、このような強力なツールを「（写真に）毒を盛って人を欺く」ことに悪用する者もいます。どんなテクノロジーも同様に人の意図によって善にも悪にも使うことができます。

1710年にジョナサンスウィフト（Jonathan Swift）が残した「虚偽は駆け巡り、真実はそのあとをもたつきながら追従する」という言葉があります。現代においては、真正性と真実と虚偽とメディアの相互作用で印象や信念が形成されていく仕組みに、私たちは社会全体として対処できていません。ソーシャルメディアがそこに加わることで、虚偽が駆け巡るスピードはさらに加速しました。

AI：古い問題を解決するための新しいソリューション

https://www.youtube.com/embed/7e5Q0TgPR54

アドビのシニアリサーチサイエンティスト、ヴラッドモラリウ（Vlad Morariu）は、長年コンピューター画像解析の関連テクノロジーに携わった能力を活かし、2016年よりアメリカ国防高等研究計画局（DARPA）にあるメディア科学捜査プログラムの一環として画像改ざん検出の研究を始めました。

ヴラッドは、写真に加えられたデジタル修正の痕跡を記録追跡するツールはすでに多く存在すると言います。「ファイル規格には、画像がどのように保存され、どんな操作が加えられたかを示す情報格納用のメタデータ領域があります。ノイズ分布、強いエッジ、ライティングといった画像ピクセル情報を分析して修正を検出する調査ツールもあります。画像が修正されていないことを証明するために電子透かしを用いることもできます。」

もちろん、それらのツールはいずれも写真の真正性の深い理解を完全なかたちで提供することは難しく、あらゆる状況にも実用的に対応できるものではありません。いくつかのツールは簡単に騙すことができ、いくつかはその適切な使い方に熟練と長い作業時間を要します。

ヴラッドは、AIと機械学習のような新しいテクノロジーを使えば、デジタル画像改ざんをより簡単に、信頼性高く、すばやく検出し、同時にどの部分が改ざんされているのかを示すことができるのではないかと考えました。

14年前、メリーランド大学のコンピューター科学の博士課程で初めて取り組んで以来、ヴラッドはこの研究を発展させてきました。Learning Rich Features for Image Manipulation Detectionという最近の論文でいくつかの新しいテクニックについて説明しています。

「私たちは一般的な3つの改ざんテクニックにフォーカスしました。異なる画像を組み合わせた『接合』、写真中のオブジェクトを複製して移動配置する『複製移動』、写真からオブジェクトを消して背景で埋める『除去』です。」

画像に修正が加えられるたびに、のちの研究に役立つ手がかりが残されます。「それぞれの画像編集テクニックには、高コントラストなエッジ、人為的に均一化された領域、異なるノイズパターンなど、固有の痕跡を残します。」と彼は述べています。痕跡について、通常は人の目では判断できませんが、ピクセルレベルの詳細解析を行ったり、それらを強調するフィルターを適用することで、容易に検出できます。

上記で述べたテクニックをAIで処理することで、これまで科学捜査のエキスパートが何時間もかけて行っていた解析が、数秒でできるようになりました。このプロジェクトの成果として、AIが画像改ざんの箇所を特定できるようになったということが言えます。AIは修正操作の種類を特定し、写真上でそれが適用された領域をハイライトすることができます。

「何千何万もの改ざん前後の画像を活用し、深層学習のためのニューラルネットワークをトレーニングしました。ここでは2つの異なるテクニックを1つのネットワーク上に融合することで検出能力を互いに補完し、性能向上に役立てています。」

あるテクニックでは、RGBストリーム（ピクセルごとのレッド、グリーン、ブルー値の変化）を使った改ざん検出方法で、もう一つはノイズストリームフィルターを使って検出しています。画像のノイズは、デジタルカメラのセンサーまたは写真編集に使ったソフトウェアの副作用により生じる、色彩と明度に含まれるランダムな値のばらつきで、「砂の嵐」のように見えます。写真もカメラも固有のノイズパターンを示すため、真正領域と改ざん領域の間でノイズ特性の不一致を検出できます。これは2つ以上の写真を合成したようなケースに顕著です。

https://blog.adobe.com/media_c989a39155be37585db4740f61c51e4e7f477c16.gif

左から真正画像、改ざん画像、改ざん検出に用いられたRGB/ノイズストリーム、改ざん領域、AI解析結果（それぞれ「接合」「複製移動」「除去」が示されている）（出典：NC2016データセット）

これらのテクニックはまだ完全なものではなく、ましてや写真の「絶対的真正性」を保証するものでもありませんが、デジタル改ざんの社会的インパクトに向き合うための新しい方法と選択肢を示しています。そして、真正性についての問いにより効果的な答えをもたらす可能性も秘めています。

ヴラッドは、デジタルファイルを繰り返し保存し直す際に写真全体に生じる輝度の変化や圧縮ノイズなど、他の種類の痕跡も検出できるようにアルゴリズムを拡張していきたいと考えています。

ヒューマンファクター

私たちを取り巻く報道環境において、私たちが信頼を寄せられるメディアは存在し得るのか？それはどのようなものか？という問いに答えるのに、技術自体は十分なものではありません。Adobe Researchのシニアプリンシパルサイエンティスト、ジョンブラント（John Brandt）は、技術ではなく、信頼と評判の確立という回答に落ちつくと述べており、「AP通信（Associated Press）及びその他の報道組織では、ニュースメディアへ用いる写真のデジタル編集ガイドラインを作成し公開しています。」と説明します。

言い換えれば、ニュースサイトや新聞の写真について、その掲載までの経路と、画像に不適切な操作を加えないというパブリッシャーの倫理をある程度信頼するしかないということです。

同じことは音声と動画の修正を民主化する新しいテクニックについても言えます。彼は「アドビがここで果たせる大きな役割は、真正性の検証と追跡を支援するテクノロジーを開発し、制作および出版プロセスに組み込むことだと考えています。」と述べています。

「社会的責任を念頭に置いたテクノロジー開発は重要ですが、そのテクノロジーが世に出れば、結果的に社会において何らかの役割を担うことになります。それゆえに、新しいテクノロジーが生み出す可能性がある負のインパクトに対しては、私たち全員が社会制度と社会的慣習の変化によって応えていく共同責任を担っているのです。」

Human & Machine特集（英語）では他にもAI関連の記事を取り上げています。

この記事は 2018/6/22にポストされた Spotting Image Manipulation with AIの抄訳です。