Document Transformation

Document Transformation ステップでは、画像およびテキスト ドキュメントから情報を抽出して使用することができます。Kofax RPA Document Transformation Service は、.png.jpeg.jpg.tiftiff.pdf、および .txt ファイルを処理できます。複数のドキュメントは、.zip アーカイブまたはファイルを含むフォルダへのパスのいずれかの形で送信することができます。Kofax Transformation でドキュメント分離機能を使用すると、Kofax RPA は、DT ブラウザで移動できる複数のドキュメントを受信します。

Kofax RPA Document Transformation Service は、Sentiment プロジェクトを使用して自然言語処理 (NLP) リクエストを処理し、テキストのムード (ポジティブまたはネガティブなど) を検出し、会社名、個人名などのエンティティを抽出することもできます。Sentiment プロジェクトを使用して顧客レビューを処理し、顧客がサービスに満足しているかどうかを理解できます。また、記事内の会社に関するすべての言及を検索するためにも使用できます。Sentiment プロジェクトは、KTT バージョン 6.3.1 以降で使用できます。詳細については、事前定義済みのプロジェクトの Sentiment プロジェクトを参照してください。

Document Transformation ワークフロー

Document Transformation アクションでは、選択したプロジェクトを使用してグラフィカル ドキュメントまたは PDF ドキュメントを処理します。プロジェクトは、OCR やその他の指定された操作を実行してドキュメントを処理および変換するモジュールです。

処理結果は Desktop Automation ロボットに戻され、レコーダー ビューの Document Transformation Browser で開かれます。サービスは、抽出されたすべての情報を含む要素ツリーを形成します。複数ページのドキュメントでは、DT ブラウザのツールバーの [前へ] および [次へ] ボタンを使用してページを移動できます。詳細については、「DT ブラウザ」を参照してください。

ツリーの要素には、プロジェクトで定義された OCR 結果やその他の抽出結果の信頼度が含まれています。confidence 属性には、0 から 1 までの値を含めることができます。一番高い信頼度は 1 です。

変換されたドキュメントの要素プロパティ

der_x などの派生属性を使用して要素を見つけることができます。これはファインダーで使用できます。

変換されたドキュメントをエディターで開くと、変換結果の検証を実行するかどうかを決定できます。検証なしで変換結果に満足できた場合は、ドキュメントのデータを抽出して使用することができます。

検証は Document Transformation Thin Client によって実行されます。指定された Thin Client にドキュメントを送信するには、Document Transformation Browser の [プロキシ設定の構成] をクリックします。一意の URL が生成され、ロボットに返されます。ロボットは URL を抽出し、それを使用して電子メールなどを介して検証ユーザーにドキュメントを送信します。検証ユーザーは URL をクリックし、資格情報を入力します。その後、抽出されたデータを含むドキュメントが開きます。検証ユーザーは、変換されたドキュメントを調べ、必要であれば、ドキュメント内の抽出された情報を修正します。

ドキュメントの検証時に、ユーザーはオンライン ラーニングを有効にして、同じようなドキュメントでのフィールド認識の確率を上げることができます。この機能は、請求書などのサンプル ドキュメントのレイアウトの記憶に基づいています。自動フィールド入力を使用、ドキュメントに正しい値を手動で入力または選択することにより、ユーザーはナレッジ ベースに貢献します。これによってユーザーが次回同様のドキュメントを表示する際に、抽出結果が改善されます。

検証が終了すると、検証ユーザーはそのドキュメントを有効であるとマークします。有効であるとマークされたドキュメントは、Document Transformation アクションのコールバック URL で指定されたロボットの引数として使用されます。

ステップ プロパティ

アクション

Kofax RPA Document Transformation Service を使用して、実行するアクションを選択します。

サービス URL

必要に応じて、Document Transformation Service を実行しているコンピュータの URL とポートを指定します。サービスがローカルにインストールされている場合は、このフィールドに localhost と入力します。URL には、http:// または https:// プレフィックスが含まれている必要があります。https を使用する場合、Web ホスティング サービスにはよく知られている認証機関によって受け入れられた証明書が必要です。

プロジェクトのタイプ
  • デフォルトのプロジェクト: このオプションは、事前定義済みのプロジェクトのセットを提供します。事前定義済みのプロジェクトを参照してください。

  • カスタム プロジェクト: このオプションを選択する場合、[カスタム プロジェクト パス] でドキュメントを処理するプロジェクトへのパスを指定します。

ドキュメント ソース

ロボットが処理するドキュメントを検索する方法を選択します。

  • ローカル ファイル: [ファイル名] で処理するドキュメントのパスを入力します。ロボットを実行しているコンピュータからアクセス可能なイメージ ファイル、.zip アーカイブ、ファイルを含むフォルダ、またはその他のサポートされている形式のファイルのいずれかのフル パスを指定します。

  • ロボット ファイル システム: 構成済みのファイル システムへのパスとファイル名 (Myshare/doctotransform.pdf など) を入力します。ファイル システム名は、Management Console 内の[ロボット ファイル システム] セクションでの指定に対応している必要があります。

  • バイナリ変数: ドキュメントを含むバイナリ変数を指定します。

複数のドキュメントのパスを指定すると、DT ブラウザのツールバー ボタンを使用して複数のドキュメント間を移動することができます。
メタ データ

追加のデータを Document Transformation Service に渡すには、このオプションを選択します。

このデータは XValues として入力ドキュメントに追加されるため、Document Transformation Service プロジェクトで使用することができます。プロジェクトは通常、このデータを使用して分析を調整または制御します。このオプションの一般的な使用例としては、言語設定または顧客 ID などが挙げられます。XValues は、処理されたドキュメントが Document Transformation Service から返された後に、デバイス ツリーで使用することができます。

特定のプロジェクトでサポートされている値を確認する場合は、Document Transformation Service プロジェクトの開発者に問い合わせてください。

複数のキーと値のペアを [メタデータ] プロパティに追加できます。

いずれかの [キー] がリストに複数回表示されている場合は、最後の [] が使用されます。

検証 URL
シン クライアント サービスの URL を指定するには、このオプションを選択します。このプロパティは、処理されたドキュメントを検証の目的で送信するために必要です。URL は、Document Transformation Service の ValidationService プロパティで指定します。URL は次のようになります。

http://localhost:8082

コールバック URL
ドキュメントの検証後に呼び出すシン クライアント サービスの REST ロボット URL を指定するには、このオプションを選択します。検証が完了すると、この URL は Management Console でロボットを起動するために使用されます。URL には、実行するロボットのパスとともに、Management Console アドレスが含まれている必要があります。URL は次のようになります。

http://localhost:8080/ManagementConsole/rest/run/Default project/binaryInputAndWait.robot

指定のロボットに対して [REST] ボタンをクリックすると、Management Console で有効なコールバック URL を見つけることができます。このようなロボットには、バイナリ タイプの doc という属性を持つ document と呼ばれる入力変数があります。ロボットが呼び出されると、ドキュメントの doc 属性には、変換されて検証された文書が含まれます。Management Console でログインのためのクレデンシャルが必要な場合は、URL に次のように指定します。

http://user:password@localhost:8080/ManagementConsole/rest/run/Default project/binaryInputAndWait.robot

詳細については、RESTを参照してください。