PDFの可能性を広げるAdobe Document Serviceの新しい API

クラウドベースのAPI/SDKであるAdobe Document Serviceで「Adobe PDF Extract API」と「Adobe Document Generation API」が発表されました。

New Adobe Document Services APIs unlock the possibilities of PDF

多くの企業が「ハイブリッド型オフィス」という新しい働き方を推進するなか、テレワーク下での生産性向上は最優先課題のひとつです。新たな働き方が普及しても、顧客向けのスターターキットから複雑な法的契約に至るまで、ドキュメントは仕事の中核をなすものであり続けると考えられます。いつでもどこでも使えるPDFであれば、このようなドキュメントエクスペリエンスを統一することができます。クラウドベースのAPIの活用がソリューション開発を加速させることは証明されており、デジタルビジネスへの対応に追われるデベロッパーやIT企業にも大きな安心感を与えます。

アドビは、30年近くにわたり培ってきたPDFの専門知識とリーダーシップを発揮し、デベロッパーが革新的なドキュメントソリューションをシームレスに構築するためのクラウドベースのAPI/SDKであるAdobe Document Serviceを構築し、成長させてきました。この度、アドビは新しいAPIである「Adobe PDF Extract API」と「Adobe Document Generation API」を発表しました。これにより、PDF内に存在するあらゆる情報を引き出し、動的なデータを備えたドキュメントをプログラムによって生成することができます。

これまでに多くのデベロッパーに採用され、前四半期以降のデベロッパーの登録者数は80%以上増加、またAdobe Document Serviceとの統合も50% 以上増加しています。今回は、この新しいAPIについての詳細と、お客様やパートナー企業の新たな動きを紹介します。

PDF Extract API ‐PDFの中からコンテンツやデータを解き放つ

ここ数十年で、PDFは数えきれないほど作成されてきました。年間に作成されるPDFファイル数は2.5兆個と言われています。それらのPDFファイルの中にどれほどの重要なデータが入っているか想像してみてください。

昨年、アドビはAIと機械学習プラットフォームであるAdobe Senseiを活用してPDFの構造を理解するLiquid Modeを発表しました。新しいAdobe PDF Extract API は、このLiquid Modeをベースにしています。PDF Extract APIは、スキャンしたPDFとネイティブPDFの両方の構造を分析することができるクラウドAPIです。段組みや改ページをまたぐ相対的な位置関係や読む順序を理解し、テキスト、表データ、画像など、PDFのあらゆる要素を抽出します。

PDF Extract API の特徴は、PDFのあらゆる要素を抽出できることです。また、多くのプロバイダが特定のプラットフォームにのみ対応しているのに対し、PDF Extract APIを始めとして、アドビのAPIはどれもプラットフォームに依存せず、あらゆる最新のプログラミング言語やプラットフォームに対応する柔軟性を備えています。

PDF Extract APIなら、データを迅速かつ正確に抽出して機械学習モデル、分析、インデックス作成、使用するデータをストレージに迅速かつ正確に抽出したり、RPA(ロボティック・プロセス・オートメーション)やNLP(自然言語処理)などの技術を使用することで下流工程を自動化したり、さまざまなメディアでPDFコンテンツを再発行したりすることができます。

世界有数の国際試験団体、Cambridge Assessmentは、PDF Extract APIを使用して100年分以上の試験資料をデジタル化し、将来の授業用コンテンツやテストパフォーマンス分析のためにコンテンツバンクを作成しています。PDF Extract APIは、PDFのフォーマットと構造を抽出する際に90%の精度を維持しつつ、50,000問を抽出するごとに2,000日分の労働力削減を実現しています。契約管理および分析のプラットフォームを提供するEvisort社 は、PDF Extract APIを使って、契約書を読み、理解する能力の強化を図っています。同社のリーダーからは、PDF Extract APIで処理した後もPDFのテキスト、書式、表、画像、インデントが保持されたままであることを高く評価いただいています。

Document Generation API ‐動的データを備えたドキュメントをプログラムで簡単に素早く生成

販売契約書、SOW、法律文書など、動的で重要な文書を紙媒体からデジタルへ自動化することは、ビジネスにおいて非常に重要です。このような文書には通常、ERPシステムやCRMシステムなど、さまざまなデータベースからデータが入力されています。従来、このようなデータの入力は手作業で行われてきましたが、作業が複雑で時間やコストもかかり、ドキュメントエクスペリエンスの質は低いものでした。

Adobe Document Generation APIを利用することで、デベロッパーはMicrosoft Wordのカスタムテンプレート作成や、動的データからWordやPDFドキュメントをあっという間に生成することができます。Document Generation APIはAdobe Signとの統合機能を備えており、電子署名に対応したドキュメント作成も可能です。

Document Generation APIはMicrosoft Power AutomateのAdobe PDF Servicesコネクタでも利用でき、Power Platformユーザーは請求書や契約書などのドキュメント作成を簡単に自動化することができます。また、Power Automateのドキュメントワークフローのための15種類のテンプレートも新たに用意しています。Document Generation APIデモはこちらからお試しいただけます。

デベロッパーの現場に新しいPDFエクスペリエンスを

Adobe Document Serviceのビジョンは、デベロッパーやIT企業に選択性と柔軟性に富んだプラットフォームを提供し、幅広いAPIの選択肢を持っていただくことです。このミッションの一環として、業務に適したクラウドソフトウェアやクラウドサービスを見つけて管理することで、どこでも、アドビのAPIを利用できるようにしていきます。

そのため、アドビはソフトウェアとサービスのグローバルオンラインマーケットであるAWS MarketplaceでAdobe PDF Service APIを提供しており、お客様に評価から購入までスムーズなエクスペリエンスを届けています。AWSアカウントをお持ちの方はすぐにAPIをお試しいただくことができ、利用に応じた価格にてサービスを購入することができます。

PDFの可能性を拡げる

ウェブアプリでもモバイルでも、シームレスで楽しく一貫したPDFエクスペリエンスを提供し、デベロッパーにすばらしいサービスを届けるというアドビの取り組みは、まだ始まったばかりです。PDFが持つ可能性の限界に挑戦するということは、アドビのDNAに刻まれた使命です。なぜなら、何十年も前にPDFのスタンダードを作ったのはアドビだからです。例えば、Adobe Senseiは機械学習やAIを使ってPDFの可能性をさらに広げていくことでしょう。アドビのResources ページでブログ、チュートリアル、使用例をご覧いただき、アドビのAPIを通してどのようなPDFエクスペリエンスを構築できるのか、インスピレーションを広げてみてください。皆さんがどのようなものを作り上げるのか、私たちも楽しみにしています。

Document Service APIは、今回ご紹介したPDF Extract APIDocument Generation APIのほかに、PDFファイルをコントロール可能なビュワーつきでウェブサイトに埋め込むとともにAdobe Analyticsと連携しPDF内の行動分析を可能にするPDF Embed API、PDFの作成や圧縮、保護などの操作と自動化を実現するPDF Service APIも提供しております。ぜひお試しください。

このブログは、2021年7月22日、米国のアドビブログで公開された記事の抄訳(一部内容を補足)です。