AI と機械学習は現代のフォトグラフィをどのように変えているか?

もはや SF 映画のワンシーンではありません。人工知能(AI)や機械学習(ML)は、私たちの日常生活にさまざまな形で影響を与えています。Netflix を見ているときに、おすすめの番組や映画が表示されたら、そこには AI が関わっています。マーケティングの分野であれば、必要なクリック数を得るためにどれだけ費用をかけるべきかという予測を広告プラットフォームが行うとき、その裏では ML が動いています。

簡単に言うと、コンピュータは AI を使って、通常は人間が行うことを代行したり、人間の知性を模倣します。コンピュータが大量のデータを収集すると、AI はそのデータを分析して取るべき行動を決定します。ML は AI のサブセットで、人間が学習するのと同じように、データを使って AI を徐々に改善します。これは、何らかの方法でプログラムされているわけではなく、すべて自力で行われます。機械が経験から学習するのです。

クリエイティビティは、人間が生まれつき持つ想像力に関わるコンセプトですが、意外にも AI や ML と共に発展した領域です。Adobe Creative Cloud 戦略開発マネージャーのクリス・ダフィーは、彼の AI Extends the Creative Mind という記事の中で、「AI は平凡な作業の自動化を促進し、クリエイターがインスピレーションやデザインにより多くの時間を費やせる環境を実現する」と述べています。

そして、AI や ML によって最も変化しているクリエイティブの領域は、おそらくフォトグラフィです。初心者からプロのフォトグラファーまで、誰でもより良い写真の編集や合成を素早く効率的に作成できる環境が、AI や ML の力を借りて提供されています。

画像編集

どんなレベルの写真家にとっても、完璧な写真撮影は最初の一歩に過ぎません。素晴らしい写真に仕上げるには、適切な編集が必要です。たとえば、写真を修正したり強調するために、背景の変更、プリセットの適用による写真の見た目の変更、色の調整、明るさやコントラストの変更などの作業が行われます。

画像編集に利用可能な機能は数多く、フォトグラファーにとって、画像を適切に処理するための方法を正しく理解することは骨の折れる行為です。しかし、画像編集アプリに AI や ML 機能が搭載されたことで、より多くの編集機能をより簡単に使用できるようになりました。例えば、写真を明るくしたり、色を鮮やかにしたり、邪魔な要素を隠すと言った作業を素早く効率的に行えます。AI や ML は、数回のクリックだけで画像を完全に変化させることができます。しかも時間のかかる作業を排除します。

ここからは、AI と ML が劇的な変化をもたらす、画像編集に関わる主要な機能をご紹介します。

画像処理と補正

画像処理とは、情報を失わずに写真の質を向上させるプロセスで、その目的はクリエイターの望む解像度、色、スタイルの実現です。この過程で行われる作業は、コントラストの強調、かすんだ背景の明瞭化、視覚的な歪みの除去などさまざまです。しかし、必要なすべての機能を使いこなせるようになるには時間がかかりますし、最終的な品質は作業者の判断に依存するため主観的なものになります。AI を活用した画像処理ソフトウェアを使用すれば、クリエイターは熟練者の知識を手に、手作業を排除しつつ、目指す結果へと作業を進められます。

たとえば、Raw 形式(最低限の処理のみ行われたデータ)で保存された写真は、実際の画像というよりは、一連の情報の羅列です。機械学習は、各ピクセルのデータから最終的な画像がどのように見えるかを推測し、ファイルの品質を劇的に向上させます。

機械学習の一種である深層学習は画像補正に応用できます。従来は、低解像度の画像を高解像度にしたければ、新しく写真を撮りなおすか、既存の画像の再スキャンが必要でした。しかし、深層学習を利用するニューラルフィルターのような処理では、低解像度の画像データからピクセルを作成し、それらを既存のピクセルと組み合わせることで、高解像度の画像へと変換することが可能です。

ライティングと色付け

人工知能は、ライティングや色付けの分野でも重要な役割を果たしています。手作業で色付けするのは時間がかかる作業ですが、AI を使用するクリエイターは数回のクリックで写真を色付けできます。画像編集アプリは、機械学習を通じてさまざまな物体に固有の予測可能な色を特定するように訓練されているため、モノクロ写真をカラー写真に変換できます。

トリミングと塗りつぶし

画像を見るとき、多くの人はまず画像の特徴的な部分に注目します。ニューラルネットワークを訓練すると、こうした主要な要素を検出できるようになるため、クリエイターが画像をトリミングする際、切り取るべき個所の特定と、選択する作業を支援できます。複数の画像からコラージュを作成する場合、最初にするべきことはオブジェクトの選択と切り出しですが、数百の画像を適切なフォーマットで切り出すために長い時間を費やしたい人はいないでしょう。Photoshop では、AI を活用した選択ツールが、画像内の識別可能なオブジェクトをハイライト表示します。クリエイターはそのオブジェクトをそのままシームレスに操作できます。また、写真のコンテンツを適切に判断して塗りつぶすことも可能です。

コンピュータが生成する画像

機械学習により画像を生成するために使われるのが、敵対的生成ネットワーク(Generative Adversarial Network - GANS)です。GANS は複数のアルゴリズムの組み合わせで、何千枚もの実物の写真を学習することにより、本物のように見える人工画像を生成する能力を獲得します。深層学習の分野における進歩のおかげで、クリエイターは GANS を画像処理に利用して、テキストで書かれた説明文から写真を生成したり、実物の画像を拡大することが容易にできるようになりました。また、GANS は、写真の中の無表情な被写体を笑わせるといった単純なレタッチ作業にも応用できます。

機械学習を応用した画像の作成は一般的になってきていますが、同時に、実際の画像と AI が生成した画像を見分けることはますます難しくなっています。ディープフェイクとして知られる偽画像(たとえば、既存の画像や動画に写っている人物を他人に置き換えたもの)は AI で作成が可能で、ニュースのなりすましや中傷に使われたり、人々の誤解を招くことで悪名を得ています。この分野での偽情報を抑制するために、アドビは Content Authenticity Initiative(CAI)を主導しています。CAI は、350 社以上のメディア企業、ハイテク企業、NGO、学者などから構成されるコミュニティで、コンテンツの真贋や来歴(所有権の記録)に関するオープンな業界標準の採用を推進しています。

保存と管理

スマートフォンの普及に伴い、人々が撮影する写真の枚数は日々増加しています。そして、それらを整理し、必要な時に目的の写真を見つけることはますます難しくなっています。どこに保管するにせよ、数千枚の画像を整理するのは困難です。

Adobe Lightroom のユーザーは、すべての写真をカタログ化して、画像検索のキーワードとなるタグを追加できますが、機械学習との組み合わせはこの面倒なプロセスを排除します。保存された画像の特徴に基づいて個々の画像が自動的に識別されるため、検索バーに「結婚式」のようなキーワードを入力すれば、Lightroom は結婚式の写真をすべて探し出しますし、青い背景と合成したいときは、「青」と入力すれば、青色が主体の画像をすべて探し出します。

AI、ML とクリエイティブ

AI は画像の編集や操作を支援します。フォトグラファーやクリエイターは、よりインテリジェントなオブジェクト選択ツールや、写真の特徴を指定した画像検索を利用できます。機械学習は、写真を解析し、最も適した最適化のための方法を判断します。AI と写真の関係は常に進化を続けて前進しており、画像、コラージュ、その他のアートワークなど、これまで想像もしなかったような作品の制作を可能にしています。

この記事は How is machine learning transforming modern photography?(著者: Adobe Communications Team)の抄訳です