Adobe Photoshopによる顔写真の加工を検知する、アドビリサーチとカリフォルニア大学バークレー校の共同研究 #Photoshop

1990年にリリースされた最初のバージョンのAdobe Photoshopは、クリエイティビティと表現の民主化に向けた大きな一歩でした。それ以来、Photoshopはクリエイティビティ、さらに広くは私たちのビジュアルカルチャーに重大な影響を与え続けてきました。

Photoshopをはじめとするアドビのクリエイティブツールが世界にもたらした影響について私たちは誇りに思っていますが、そういったテクノロジーに伴う倫理的な側面についても認識しています。いたるところで画像編集が行われている現在の世の中において、私たちが目にするものに信頼がおけるかどうかは、ますます重要な関心事となっています。フェイクコンテンツは、深刻かつますます差し迫った問題です。アドビは新しいテクノロジーの実用化において、最も有用かつ責任ある方法を見つけることに全力で取り組んでおり、その一環として、人工知能（AI）など新しいテクノロジーの活用によってデジタルメディアに対する信頼と真正性を高める方法を模索しています。

このような問題意識を背景に、アドビの研究者であるリチャードツァン（略歴英語）（Richard Zhang）とオリバーワン（略歴英語）（Oliver Wang）は、カリフォルニア大学バークレー校の共同研究者であるシェンユーワン（Sheng-Yu Wang）とアンドリューオーウェンス（Andrew Owens）博士ならびにアレクセイ A エフロス（Alexei A. Efros）教授とともに、Photoshopのフィルターの「顔立ちを調整」機能で加工された画像領域を検出する技術を開発しました。この研究は、DARPA（米国国防先端研究計画局）のMediFor（Media Forensics＝メディア鑑識）プログラム（英語）のスポンサーを受けています。まだ初期段階にありながらも、このアドビリサーチとカリフォルニア大学バークレー校の共同研究（英語）は、デジタル画像の加工箇所を検出および解析する、画像鑑識技術の民主化への一歩です。

この新しい研究は、画像、ビデオ、オーディオ、ならびにドキュメントの改変をより高い精度で検出するというアドビの広範な取り組みの一部です。これまでのアドビの研究では、「接合」「複製移動」「除去」による画像改変に焦点を当てていましたが、今回の技術はPhotoshopの「顔立ちを調整」フィルターに着目したものです。なぜなら、このツールが表情の調整をはじめとする、顔立ちの改変によく利用される機能だからです。この機能では微細な調整も可能なため、人物の顔の劇的な改変と同様に微妙な改変も検出できるかどうか、興味深い研究対象となり得ます。

新しい研究は、以下の基本的な課題に取り組むものです：

加工された顔画像を、人間よりも確実に判別できるツールを作れるか
そのツールは、画像に加えられた改変を解読できるか
できたとして、それらの改変をもとの状態に復元できるか

深層学習の一形態である畳み込みニューラルネットワーク（CNN）を訓練することによって、加工された顔画像を認識することができます。研究者たちはインターネットから数千もの顔画像を取得し、Photoshopの自動化スクリプトで「顔立ちを調整」による改変を加えたものを、広範囲なケースをカバーする画像データとして用意、そのうちの一部をランダム選択して訓練データとして利用しました。さらに、このデータセットには、アーティストによって手作業で修正された画像も追加されています。これは、自動生成された画像だけでは補えない、人間のクリエイティビティを反映した人手による修正の方法論やテクニックも、テスト用データセットでカバーできるようにするためです。

オリバーワンは次のように述べています。「私たちは、被験者に片方が改変されていることを伝えたうえで、画像のペア（オリジナルと改変版）を見せることから始めました。この技術の有用性を示すには、人間の目よりも遥かに優れたパフォーマンスを示す必要があるからです。」

人間の目による判定の正答率は、偶然よりすこし良い53%でした。いっぽう、実験を重ねるにつれ、ニューラルネットワークツールは99%もの正答率を達成するまでになりました。

このツールは、顔画像の改変がなされた領域と、そこに適用されたゆがみ効果の内容も特定できます。さらに、改変された画像から逆算してオリジナルの状態に戻す実験の結果は、研究者自身でさえも感動するものでした。

カリフォルニア大学バークレー校のアレクセイ A エフロス教授は、次のように述べています。「人物の顔の幾何学的構成にはあまりに多くのバリエーションがあるため、そのような解析は不可能であるように思えるでしょう。しかしながら、このケースにおいては、深層学習プロセスが、ゆがみ効果の痕跡のような低次レベルの画像データと、顔の要素のレイアウトといった高次レベルのヒントの両方を取り扱うため、うまくいくようです。」

リチャードツァンは次のように付け加えます。「画像編集を魔法のようにもとに戻せる汎用的な『取り消し』ボタンは、まだ実現にはほど遠いアイデアです。しかし、私たちは消費するデジタル情報をそのまま信じることがより困難になっている世界に住んでいるのですから、この領域の研究をさらに探求していきたいと考えています。」

この取り組みは今後どのように発展していくのでしょうか？アドビの使命は、クリエイターの役に立ち、消費者を尊重することです。私たちが目指しているのは、アイデアを実現するためのツールの提供により、お客さまのイマジネーションを解き放つことですが、同時に私たちのツールで作成されたデジタルメディアの真正性を確認し、その悪用を特定し、思いとどまらせるために、アドビリサーチのいくつものプロジェクトを横断して取り組んでいます。

アドビリサーチを率いるガヴィンミラー（Gavin Miller）は次のように述べています。「これは、特定の種類の画像編集を検出するための重要なステップであり、もとに戻す機能は驚くほどうまく機能します。こういったテクノロジーの存在だけでなく、それが多くの場合のように人を喜ばせるためであれ、ときに誤った方向に誘導する目的であれ、コンテンツには加工されている可能性があることを知っている、賢明な皆さんの存在が、フェイク画像に対抗する最良の防御策となるでしょう。」

コンテンツの真正性の問題は、私たちがお客さま、パートナー企業、そしてコミュニティと一緒に探求し続ける、業界全体に関わるトピックです。進化し続けるデジタルキャンバスに流れ込むクリエイティビティとストーリーテリングを促進しながらも、それと両立しうるセーフガードの実装とはなにかについて、継続して議論が取り交わされることを歓迎します。

画像鑑識の民主化の旅は始まったばかりです。

この記事は2019年6月14日に公開されたAdobe Research and UC Berkeley: Detecting Facial Manipulations in Adobe Photoshopの抄訳です