Adobe Fireflyベストプラクティスと企業が実践する “生成AI活用ガイドライン策定” | Adobe Firefly Meetup #2
2024年6月4日、アドビ東京オフィスにて第2回目のAdobe Firefly Meetupが開催されました。企業内のユーザーが抱える生成AIに関する問題や悩みなどをカジュアルに意見交換できるエンタープライズ向けのイベントです。Fireflyユーザーのための小規模なミートアップイベントとして企画され、生成AIへの取り組みや課題、ノウハウ、知見などを共有し、交流を深める場となっています。
今回は、Adobe Firefly最新アップデート情報、生成AI最新動向とFireflyベストプラクティス[ 2024年6月版 ]、そして、「生成AI活用ガイドライン策定」をいち早く企業として実践されている株式会社ベネッセコーポレーションさま、株式会社サイバーエージェントさま、富士通株式会社さま、株式会社TBWA HAKUHODOさまから実践者の方々をお招きし、パネルディスカッション形式で、企業の最前線の取り組みを紹介していただきました。ファシリテーターは前回ご登壇いただいたトヨタコネクティッド株式会社 川村将太 (しょーてぃー) 氏です。巧みなファシリテートによりテンポよく進行し、オープンなメディアでは公開しにくい生々しい体験談なども共有することができました。
イベント後半では株式会社TBWA HAKUHODO Innovation Hubのプランナーである横山真之介氏による「生成AIを広告クリエイティブ業務に導入する前に知っておくべきこと」を発表していただきました。画像生成AIは、ChatGPTなどのLLM(大規模言語モデル)とは異なり、ビジネス活用において具体的な事例が少なく、リスクについてもあまり語られていません。
意図せず権利侵害を起こしてしまう問題などは、画像生成AIを扱うクリエイティブの現場で最も危惧されていることですが、業界内での情報交換はまだ活発ではなく、生成AI導入の障害になっています。
横山氏には、広告クリエイティブ業務に画像生成AIを導入した場合の注意点について、クリエーターの視点で対応策を紹介していただきましたが、大変具体的かつ説得力のある解説でした。
前半では、生成AI技術が一般ユーザーに解放されてから2年、Adobe Fireflyが登場してから1年以上経過しましたので、今回はクリエイティブ領域の視点でAIモデルの推移、生成画像のハルシネーション問題、画像生成AIのメリットを最大限に活かせる作業、Adobe Fireflyのプロンプトエンジニアリングについてまとめてみたいと思います。
もくじ
- AIモデルとプロンプトエンジニアリング
- 生成画像のハルシネーション
- 画像生成AIのメリットを最大限に活かせる創造的な作業
- Adobe Fireflyのプロンプトエンジニアリング
- 企業が取り組む「生成AI活用ガイドライン」策定
- 生成AIを広告クリエイティブ業務に導入する前に知っておくべきこと
AIモデルとプロンプトエンジニアリング
生成AIサービスを提供している企業は定期的に新しいAIモデルを公開し、高機能化・高性能化を積極的に進めています。今まで不可能だったことが可能になり、ユーザーにとっては大きなメリットになっていますが、過去の試行錯誤の多くが継承されないため、学習コストは上昇しています。
Firefly Image 2とImage 3を同じプロンプトで比較すると、新モデルの方が表現力に長けていることがわかります。ただ、Image 2でもプロンプトを修正すれば、もっと品質を高めることができます。つまり、AIモデルごとにプロンプトを最適化しなければいけないということです。
それまで蓄積してきたプロンプト資産の多くが無価値化され、有効だったプロンプトテクニックも効かなくなってしまいます。新しいAIモデルが登場する度にプロンプトエンジニアリングもアップデートしなければいけません。
AIモデルは上書きされていくため、Firefly Image 1はすでに利用不可になっていますが、新モデルへの切り替えがデザイン業務に与える影響についても考えていく必要があるでしょう。
Firefly Image 2 と3の生成結果
生成画像のハルシネーション
生成AIで発生するハルシネーション(もっともらしい誤情報を生成する現象)についても理解しておく必要があります。ChatGPTやGeminiなどの大規模言語モデルではよく知られていますが、画像生成でも同様です。わかりやすい例としては、人間の関節や手、指、歯などの表現でハルシネーションを確認することができます。人間は発見しやすいのですが、動物や植物などは専門家に指摘されないとわからないかもしれません。
大量のデータから傾向を学んで「それっぽいもの」を生成する仕組みですから、カメラで撮影した写真とは別物だと捉えておくべきでしょう。
ハルシネーションが発生した生成画像
商業デザインで生成AIを活用する場合、このハルシネーションに対する方針を決定し、案件の内容と照らし合わせながら、どこまで許容可能か判断しなければいけません。この判断は現場のデザイナーに委ねるのではなく、検査を担当する専門のチームがハルシネーションチェックや修正のレベルを検討した方がスムーズに進みます。生成物の検証は想像以上に時間を要するため、デザイナーにとって大きな負荷になるからです。
生成AI利活用に関わるチーム構成
画像生成AIのメリットを最大限に活かせる創造的な作業
現時点で最も生成AIが有効活用できているのは「創造的なプロセス」だと言えるでしょう。イマジネーションを膨らませたり、新規性の高いアイデアを創出する場合、むしろ生成AIのハルシネーションがプラスに働きます。抽象的かつインパクトのあるビジュアルのアイデアなどは、そう簡単に出せるものではありませんが、あり得ない事象をプロンプトにすることで様々なインスピレーションを与えてくれます。10案でも20案でも出せるのが生成AIの大きなメリットです。
創造的なクリエイティブワークではハルシネーションがプラスに働く
クライアントワークではハルシネーションの修正コストを考慮しておく必要があります。例えば、ポスターやカタログなどのグラフィックデザインに生成した人物を使用する場合は、美術解剖学の視点で検証しなければいけません。特に関節や手、指、光や陰影などの嘘を洗い出し、どこまで許容できるか判断することになります。正確性を求めるほど、修正する手間が増えていきますので、結果的にストックフォトを利用した方が低コストということもあり得るでしょう。
前述したとおり、新規性の高いビジュアルのアイデアが要求される案件などはハルシネーションが問題化しにくいため、活用しやすい領域だといえます。
生成画像のハルシネーションを修正するコスト
Adobe Fireflyのプロンプトエンジニアリング
Fireflyはクリエイターの道具になるように開発されており、プロンプト入力だけではなくスタイル効果やスタイル参照、そして構成参照などの直感的に操作できるリファレンス機能を搭載しています。デザイン作業とプロンプト入力の相性の悪さは以前から指摘されていましたが、Fireflyはいち早く「画像で指示できる」参照機能を実装したことで、他社よりユーザーフレンドリーな画像生成AIとして先行しています。
画像生成AIはプロンプトに含まれるトークンや参照する画像の「強度」に影響を受けます。強度の高いトークンに引っ張られると、それ以外を無視しますので、具体的かつ詳細なプロンプトを書いても効きません。
生成画像はプロンプトに含まれる強度の高いトークンに影響を受ける
例えば、ネクタイをしていないスーツ姿の会社員のイメージを生成したいとき、「ノーネクタイの〜」や「ネクタイを着用していない〜」などと記述しても、AIはネクタイを表現しようとします。「ネクタイ」という言葉が「強い」からです。
このような場合、「カジュアルなスーツ姿の会社員」のように、プロンプト内のトークンの力関係を調整しなければいけません。
特定のワードに引っ張られる場合はプロンプトの表現を変更する
参照する画像も同様です。もし、参照した画像が「強い」場合、プロンプトが弱くなりますので期待した結果にはならないでしょう。
また、プロンプトが効かなくなると、バリエーションの差異がなくなりますので誰がやっても「同じような画像」しか生成されなくなります。
参照する画像の強度で生成されるイメージが決定する
下図は、絵の具が飛び散った画像をスタイル参照で使用していますが、この参照画像の強度が高いため、AIは「絵の具が飛び散った」イメージを生成しようとします。つまり、真上から撮ったような画像が高確率で生成されます。
絵の具が飛び散った参照画像が「強い」ため構図が固定されている
この場合は、参照画像の「強度」パラメータを下げることで解決します。ただし、下げ過ぎるとプロンプトに忠実になり、予期せぬ生成結果になる可能性があります。参照画像の「強度」パラメータとプロンプトの「視覚的な適用量」パラメータのバランスがとても重要になってきます。
プロンプトのワードや参照画像の「力のバランス」で生成結果が異なる
プロンプトエンジニアリングは「指示の出し方」を工夫するスキルであり、意図したイメージを取得するために必要なものですが、AIモデルによって特性が異なるため体系的なマニュアル化が難しく、教育についても大きな課題になっています。
今後、優れたインターフェイスが実装され、今のようなプロンプトエンジニアリングは不要になると思いますが、それまでは組織内でガイドラインを策定し、生成AIに対する共通認識を形成していく必要があります。
今回のAdobe Firefly Meetupのテーマである「ガイドライン」は、あくまで指針(もしくは指標)であり、厳格なルールやポリシーではありませんので、企業間で共有しやすいことが利点かもしれません。また、このような黎明期だからこそ、生成AIの利活用を担う仲間として、よい関係が築ける時期なのだと思います。
企業が取り組む「生成AI活用ガイドライン」策定
「生成AI活用ガイドライン策定」パネルディスカッションでは、富士通株式会社 AI倫理ガバナンス室のマネージャーである勝畑陽子氏から「生成AI利活用ガイドライン」を社外公開した経緯や策定時に重視したポイントなど、株式会社サイバーエージェント CA Creative Center / FANTECH本部 チーフクリエイティブマネージャーである及川和之氏からは社内のクリエイターに向けて策定された「画像生成AIガイドライン」の目的と運用後の反応などを語っていただきました。
生成AI活用のためのガイドライン策定に携わっている有識者による活発なディスカッション(撮影:トヨタコネクティッド)
また、株式会社ベネッセコーポレーション データソリューション部の部長である國吉啓介氏は一般社団法人Generative AI Japanの理事でもあり、法的問題と倫理的問題の線引きの難しさなど教育分野の視点で話していただきました。株式会社TBWA HAKUHODO Innovation Hubのプランナーである横山真之介氏は、ガイドラインを遵守していても技術進化や生成AIサービスの規約変更などによって注意すべきことも変化していくと指摘、法整備についても発展途上であることを強調されていました。
ガイドライン策定に関する各社の取り組み紹介と現場目線のリアルな課題感が共有された(撮影:トヨタコネクティッド)
ガイドラインを厳格にするほど、利用者は萎縮し利活用が進まないため、さじ加減の難しさが共通の悩みだといえるでしょう。また、生成AI技術の進化のスピードが速いため、ガイドラインの迅速な更新作業についても今後の課題になっていくと考えられます。
実践者だからこそ話せる説得力のある体験談を共有できた大変有意義なパネルディスカッションでした。
生成AIを広告クリエイティブ業務に導入する前に知っておくべきこと
イベント後半は、パネルディスカッションに登壇いただいた横山真之介氏による「生成AIを広告クリエイティブ業務に導入する前に知っておくべきこと」を発表していただきました。画像生成AIは、ChatGPTなどのLLM(大規模言語モデル)とは異なり、ビジネス活用において具体的な事例が少なく、リスクについてもあまり語られていません。
大前提、大原則、そして直面する可能性のあるインシデントを把握する
横山氏は、オリジナリティ・チェックの徹底や入力時に権利侵害の可能性のある情報を入力しないなど、注意すべき点をロゴデザインの生成を例に解説。企業のロゴと酷似したものを意図せず生成してしまった具体的な事例、ダミーデータを使った画像検索によるチェック方法などを紹介していただきました。
オリジナリティ・チェックの徹底は欠かせない
意図せず権利侵害を起こしてしまう問題などは、画像生成AIを扱うクリエイティブの現場で最も危惧されていることですが、業界内での情報交換はまだ活発ではなく、生成AI導入の障害になっています。横山氏には、広告クリエイティブ業務に画像生成AIを導入した場合の注意点について、クリエイターの視点で対応策を紹介していただきましたが、大変具体的かつ説得力のある解説でした。