Adobe x NIVIDIA: LLMs der nächsten Generation nutzen PDF-Intelligenz

Ein Bild, das Wolkenkratzer, Himmel, Nacht, draußen enthält. Automatisch generierte Beschreibung

Adobe hat heute eine Erweiterung seiner langjährigen Partnerschaft mit NVIDIA bekannt gegeben. Die Zusammenarbeit verfolgt das Ziel, Unternehmen neue Möglichkeiten zu eröffnen, die in PDF-Dokumenten gespeicherten Geschäftsinformationen aktiv zu nutzen. Dazu werden Adobes jahrzehntelanges Know-how und die Leistungsfähigkeit der firmeneigene KI für PDF-Inhalte und -Strukturen mit NVIDIAs generativer KI und beschleunigter Rechentechnologie kombiniert. Gemeinsam bieten sie die Potenziale von großen Sprachmodellen (LLMs) und PDFs an drei Fronten zu erweitern:

Adobes kürzlich eingeführter KI Assistent in Acrobat Beta nutzt die Daten in PDFs auf intelligente Weise, um die Produktivität von Anwender*innen zu steigern. Jetzt soll dieser Wert auch für Unternehmen skaliert werden. NVIDIAs Innovation mit LLMs und Retrieval Augmented Generation (RAG) in Kombination mit Adobe PDF-Extraktionstechnologien ist ein Schritt in Richtung einer neuen Ära der Dokumentenintelligenz.

„PDF-Dokumente speichern immense Mengen an wertvollen Informationen, die genutzt werden können, um die Intelligenz der generativen KI-Anwendungen eines jeden Unternehmens individuell anzupassen. Dieses neue Kapitel der Partnerschaft von NVIDIA und Adobe wird Unternehmen dabei helfen, den Wert ihrer PDF-Daten mithilfe von NVIDIA Microservices zu erschließen, um ihre generativen KI-Agenten und Copiloten zu leistungsstarken Produktivitätswerkzeugen zu machen.“

– Manuvir Das, Vice President of Enterprise Computing bei NVIDIA

Training und Optimierung von LLMs der nächsten Generation

Adobe und NVIDIA arbeiten gemeinsam am Training neuer NVIDIA LLMs. Durch die Verknüpfung der NVIDIA AI Foundry Services mit der NVIDIA AI Enterprise Software und Adobes PDF Extract Service können Datensätze erstellt werden, um die nächste Generation von NVIDIA AI Foundation-Modellen zu trainieren und zu verbessern, einschließlich NVIDIA Nemotron LLMs. Diese Modelle sowie Open-Source- und kommerzielle LLMs laufen auf NVIDIA NIM Inferenz-Microservices in der NVIDIA AI Enterprise Software Suite.

PDF-Dokumente enthalten einige der wertvollsten Informationen der Welt. Die Umwandlung der Inhalte in verwertbare Informationen ist jedoch in der Regel schwierig oder unmöglich, da die Daten unstrukturiert sind. Als Erfinder und Innovator des PDF ist Adobe die weltweite Autorität in Sachen PDF-Struktur und -Inhalt. Adobe PDF Extract ermöglicht eine hochpräzise Datenextraktion aus verschiedenen Dokumenttypen – sowohl aus nativen als auch aus gescannten PDFs – ohne jegliche Anpassung oder Einrichtung. Diese Technologie nutzt dasselbe Modell für künstliche Intelligenz und maschinelles Lernen, das auch dem preisgekrönten Acrobat Liquid Mode zugrunde liegt, um unstrukturierte Daten in PDFs in reichhaltige, strukturierte Informationen für effiziente Analysen umzuwandeln.

Skalierung generativer KI für globale Unternehmen

Darüber hinaus wird nach neuen Wegen gesucht, leistungsstarke generative KI-Funktionen auch für globale Unternehmen zu skalieren. RAG-Funktionen können den Nutzen von LLMs für Unternehmen erhöhen, indem sie generierte Antworten mit eigenen Daten und externen Wissensdatenbanken kombinieren, um aktuellere und zuverlässigere Antworten zu liefern.

Ziel ist es, die PDF-Dienste von Adobe zu integrieren, um firmeneigene Informationen aus den PDF-Dateien von Unternehmen in spezielle Wissensdatenbanken mit vortrainierten NVIDIA LLMs zu extrahieren, damit Unternehmen mit ihren Daten in natürlicher Sprache kommunizieren können. Wir untersuchen auch, wie Unternehmen Adobe Document Cloud-Produkte und -Dienste mit NVIDIA NIM-Inferenz und NVIDIA NeMo Retriever-Microservices nutzen können, um die synchrone Verwendung von PDFs in Produktionsanwendungen zu ermöglichen.

Die Verwendung von NVIDIA Accelerated Computing und KI-Software wie NVIDIA NIM in Verbindung mit KI-fähigen Produkten von Adobe wie Adobe Firefly soll für Unternehmen die Markteinführung beschleunigen und leistungsstarke, interaktive Kundenerlebnisse ermöglichen.

Aufbau offener Datensätze für die Forschung

Adobe und NVIDIA bringen ihr gemeinsames Fachwissen ein, um die Forschung zu LLMs und der Relevanz  digitaler Dokumente zu beschleunigen. Die beiden Unternehmen arbeiten gemeinsam an einem kuratierten Datensatz, um die Forschung und Entwicklung von LLMs mit PDFs als Pre-Trainings-Daten zu verbessern. Zusmmen wollen sie die offene Forschung zu Nachbearbeitungstechniken ermöglichen, um PDF-Daten für das Training von LLMs und VLMs (Very Large Models) so verwertbar wie möglich zu machen. Geplant ist, die Ergebnisse, Methoden und Auswirkungen zu publizieren und den Datensatz für Forschungszwecke zur Verfügung zu stellen, um einen einfachen Zugang und eine weite Verbreitung unter Forscher*innen, Entwickler*innen und Enthusiast*innen im Bereich der künstlichen Intelligenz und des maschinellen Lernens zu gewährleisten.