Notre engagement pour adresser les biais de l’IA générative
Les algorithmes déterministes forment, de loin, la famille d'algorithme la plus utilisée par les ingénieurs ces dernières années. Basé sur les conditions Si [...], Alors [...], cet algorithme produira toujours le même résultat.
Un procédé bouleversé par l’arrivée de l’IA, et de l’IA générative, qui ne sont, eux, pas déterministes. Il est alors possible d’obtenir des résultats uniques qui n’ont pas été préalablement inscrits dans les conditions de l’algorithme. C'est là que la magie opère, mais non sans danger.
Après une année d'expérimentation et d'engouement autour du potentiel apporté par l'IA générative, le débat public s'oriente davantage sur les données qui composent les modèles d'IA et sur la qualité des résultats générés. Au fond, l'IA ne vaut que ce que valent les données sur lesquelles elle est entraînée. Cet ensemble de données constitue ainsi la base des concepts fondamentaux que l'IA générative peut comprendre, et s'il y a de la nudité, de la violence ou d'autres contenus préjudiciables, l'IA apprendra également ces concepts. Qu'il s'agisse de texte ou d'image, les résultats de l'IA générative sont basés sur des centaines de millions ou milliards de données d'entraînement.
Et si ces données sont biaisées, les résultats de l'IA le seront également. Par exemple, si vous cherchez le mot clé "avocat" dans un générateur d'images et que vous n'obtenez que des images d'avocats masculins, cela reflète le biais de l'ensemble de données, ou les étiquettes placées sur l'ensemble de données par les humains. En revanche, les résultats ne reflètent pas la réalité. Par exemple aux États-Unis, il y a aujourd'hui plus de femmes que d'hommes diplômés des facultés de droit. C'est pourquoi il est nécessaire d’actionner des leviers pour supprimer ces biais existants, à l’aide de l’IA générative notamment.
Notre premier modèle d’IA générative Adobe Firefly a été développé suivant nos principes éthiques en matière d’IA, de responsabilité et de transparence. Nous avons pour ambition de fournir des résultats conformes à la loi, qui soient utilisables dans le cadre commercial et qui réduisent les préjugés. Firefly est conçu pour être utilisé dans le cadre d'un environnement créatif et n'a pas été développé pour générer des images qui soient représentatives de l’Histoire ou pour représenter des caractéristiques démographiques précises. Concernant le fait de supprimer les biais de l’IA générative, notre objectif est donc d'essayer de refléter la réalité du monde dans lequel nous vivons. Dans ce cadre, nous entraînons notre IA sur des ensembles de données qui permettent un usage commercial par la suite, puis nous testons les résultats à l'aide de milliers de prompts tests pour identifier les éventuels biais. Si nous en constatons, nous pouvons ajouter des données supplémentaires afin d'élargir la base d’entrainement à partir de laquelle l'IA apprend, ou nous pouvons ajouter des filtres ou d'autres outils pour aider l'IA à refléter une version plus précise de la réalité. Nous n'avons aucunement l’ambition d’imposer des valeurs, des jugements ou des normes aux résultats.
Plus important encore, les créateurs utilisent notre technologie d'IA pour atteindre des objectifs spécifiques et notre rôle est de les aider à obtenir rapidement le contenu souhaité. C’est à cette étape que notre technologie nous permettant de réduire les biais prend tout son sens. Si les premières propositions offertes par le modèle ne conviennent pas, il est toujours possible d’ajouter des détails aux prompts qui permettront d’affiner le résultat. Enfin, nous continuerons de développer cette technologie afin de réduire les biais et améliorer les résultats recherchés par nos utilisateurs pour que ces derniers reflètent la réalité du monde qui nous entoure.
L’IA continuera de générer des choses inattendues. Du fait de sa conception l’IA générative peut créer, et créera, des contenus nouveaux, même si cette dernière est entrainée sur un ensemble de données maitrisé. Si nous utilisons un ensemble de données qui permet de générer des contenus qui sont utilisables dans un cadre commercial, nous testons toutes nos fonctionnalités d’IA, avant leur mise à disposition, suivant une série de paramètres de biais et de sécurité afin de pouvoir identifier ces résultats inattendus. Les utilisateurs peuvent également nous partager facilement leurs retours et appréciations afin de pouvoir identifier les biais dès qu’ils surviennent. Les principaux biais identifiés par nos utilisateurs sont généralement liés à des termes qu’ils n’utilisent pas souvent.
L'IA est une technologie qui a le potentiel de changer notre façon de vivre, de travailler et d'apprendre. Sa nature même rend essentielle une réflexion approfondie sur les tests, la gouvernance et la responsabilité que nous devons avoir en tant qu’entreprise. C’est pourquoi il est essentiel de développer les bons processus et de mettre en place les politiques qui vont nous permettre de développer notre IA afin de la rendre meilleure et plus performante.