Adobe Firefly を適切に活用するための著作権との付き合い方 第5回 安心して生成 AI を使うために求められる透明性

今回は、著作権に関わるトピックではありますが、法律からは少し離れて技術的な側面を取り上げます。というのは、技術の側が追い付かないと、法律を整備する意義が失われかねないからです。まず、例として以下のようなケースを考えてみましょう。

いわゆる僭称問題の一種です。少なくとも、すべての AI 生成物の著作権が認められることは無いとわかっている以上、著作権が当然発生しているかのように宣伝したのであれば、優良誤認表示などが疑われるところです。これがまかり通ると、「著作物だと思って購入したのに著作権を行使できない」といった事態が起こりかねません。

次のケースはどうでしょうか?

AI の学習データが公開されていなければ、責任を曖昧にしようとして、こういった人が現れるようになるかもしれません。2023 年 10 月にスタンフォード大 Center for Research on Foundation Models が発表した主要な基盤モデルの評価によれば、学習データの透明性は平均 20% に留まります。中には 0% の基盤モデルもあります。

主要な基盤モデルの 13 の分野における透明性の評価 出典: The Foundation Model Transparency Index

コンテンツの真正性を確保するオープンな技術標準 C2PA

上記の 2 つの例が示しているのは、AI 関連の法律が整備されたとしても、人による創作物と AI 生成物の区別を、誰もが簡単かつ確実に行えなければ、その適切な運用が難しい場面があることです。そして現在のところ、あらゆるコンテンツに対し、AI 生成物かどうかを 100% 判別できる技術的なフレームワークは確立されていません。

こうした状況に対する有力な取り組みの一つと目されているのが、アドビが 2021 年 2 月に ARM、Intel、Microsoft、Truepic の 4 社と共同で立ち上げた技術標準化団体 C2PAです。現在、約 100 社が C2PA に参加しており、2024 年 2 月には Google が運営委員会のメンバーに加わりました。

C2PA の特徴は、デジタルコンテンツの透明性を確保するために、コンテンツに対する主要な行為の履歴の記述(来歴)を用いる点です。来歴には、コンテンツの作成、編集、公開等のタイミングで、誰がいつどのように何を行ったのかを、署名付きで追加できます。項目の省略は自由で、匿名化も可能です。コンテンツの消費者は、来歴に含まれる情報と、来歴に誰が署名したのかを確認して、コンテンツの出自や信憑性を判断することになります。

C2PA の来歴には画像編集の履歴が記録できる 出典: C2PA

C2PA の仕様では、コンテンツと来歴が、改ざんできないように暗号化技術により関連付けられます。どちらかだけを変更すると関連性が失われるため、来歴を詐称することはできません。また、サイトの認証にも使われている認証局(CA)の仕組みを利用して、来歴に署名した主体の身元を証明し、第三者によるなりすましを防ぎます。C2PA は、この組み合わせにより、コンテンツの身元情報を確実に提供できる技術標準を確立しようとしています。

コンテンツ認証イニシアチブ(CAI)と、コンテンツ認証情報(Content Credentials)

C2PA は、技術標準を開発する組織という点において、W3C に似た存在だと言えるでしょう。W3C が策定した HTML や CSS を利用する人々の手元にブラウザが欠かせないように、C2PA に対応した技術が実社会の必要な場所に実装されていなければ、人々が C2PA を利用できるようにはなりません。アドビが 2019 年に立ち上げたコミュニティ「コンテンツ認証イニシアチブ(Content Authenticity Initiative - CAI)は、C2PA の社会への導入を推進する中心的な存在です。同団体は、C2PA に準拠したツール「コンテンツ認証情報(Content Credentials)」を開発し、オープンソースとして公開しています。また、自社製品やサービスにコンテンツ認証情報を組み込みたいメンバーへの技術サポートも行っています。

コンテンツ認証情報の存在が一目でわかるように、コンテンツの上に重ねて表示するためのピンもデザインされています。クリックすると、来歴が表示される仕様です。コンテンツ認証情報に対応したプラットフォームが登場すれば、下図のような体験が提供されることになるようです。

コンテンツ認証情報ピンをクリックすると来歴が表示される 出典: Content Credentials

コンテンツ認証情報をコンテンツと関連付ける方法は、以下の 2 種類があります。仕様上は、両方を選ぶことも可能です。

  1. ファイルに直接添付

    メタデータとしてファイルに追加する方法です。ファイルサイズは増加しますが、コンテンツ認証情報を外部に公開する必要がありません。メタデータを削除すると、コンテンツ認証情報も失われます。

  2. コンテンツ認証情報クラウドに公開

    専用クラウドにアップロードする方法です。ファイルサイズの増加は無いものの、外部から確認できる場所にコンテンツ認証情報を公開することになります。100% ではありませんが、コンテンツ認証情報が削除されていた場合の復元や、関連している可能性のあるコンテンツ認証情報の検索ができます。

アドビ製品に関しては、今のところ Adobe PhotoshopLightroomFirefly などで、コンテンツ認証情報(ベータ版)が利用できます。Firefly から書き出した画像には、自動的にコンテンツ認証情報が付加されるため、CAI が提供している検証サービスにアップロードすると、「この画像は AI ツールで生成されました」とアドビが署名したメッセージが表示されるはずです。

コンテンツ認証情報の検証サービスで Firefly 生成画像の来歴を確認したところ 出典: Content Credentials

デジタルコンテンツの来歴は役に立つか

上記の説明を読んでお判りのように、コンテンツ認証情報は、全てのデジタルコンテンツに自動的に付加されたりはしませんし、たとえ付加されていたとしても削除可能です。また、コンテンツの流通に関わるありとあらゆるツールやプラットフォームが、一つの例外もなく C2PA に対応するとは思えません。言い換えるなら、C2PA は「あらゆる AI 生成物を確実に判別する必要がある件」の解決策にはなりません。

むしろ、C2PA は、食品表示ラベルに近い存在だと考えられます。食品表示ラベルは、食品の品質に関わる問題をすべて防ぐようなものではありません。しかしながら、手に取った食品に食品表示ラベルが無いと気づけば、その品質を怪しむ人は少なくないでしょう。

来歴の不明なデジタルコンテンツは、食品表示ラベルの無い食品のようなもの Adobe Firefly で生成

同様に、もし「来歴の不明なデジタルコンテンツは疑わしい」という認識が世間でごく一般的なものになれば、匿名のフェイクで人々を騙すことは困難になるはずです。クリエイターからの納品には、「コンテンツの保証に」と来歴を要求するクライアントがごく普通になるかもしれません。このように、来歴情報の存在は、客観的な判断を社会として共有できる基盤となり、秩序あるコンテンツの流通を支える大きな力になる可能性があります。

EU 議会が承認した世界初の包括的な AI 規制法案では、AI が生成したコンテンツへのラベル付けが義務化されることになるようです。2023 年 10 月に署名された米国大統領令にも、商務省が AI 生成物へのラベル付けのガイドラインを策定すると記されています。日本では、経済産業省と総務省が取りまとめた AI 事業者ガイドライン(第 1.0 版)に、高度な AI システムに関係する事業者には、ラベリングや免責事項の表示等の仕組みの導入が奨励されると明記されました。国際的にこうした法的或いは政治的な後押しを得ることで、電子透かし等の他の技術と共に、来歴情報が幅広く使われるようになるのか、今後の展開が楽しみです。

次回は、生成 AI の業務利用は(どこまで)可能か?をお送りします!