Excel のコンテンツの抽出

Design Studio には、スプレッドシートからコンテンツを抽出するためのステップが 3 つあります。

  • セル値抽出ステップは、見つかった範囲からテキスト コンテンツを抽出するときに使用します。
  • シート名抽出ステップは、見つかった範囲のシートのシート名を抽出するときに使用します。
  • HTML として抽出ステップは、スプレッドシートの見つかった範囲を、その範囲のセルを持つテーブルが含まれる HTML ページとして変数に抽出するときに使用します。

セル値抽出ステップと HTML として抽出ステップの場合、セルから何を抽出するかを指定できます。これは、[次を抽出] オプションの値によって制御されます。ここでの選択は、スプレッドシート ビューのビュー モードの場合と同じです。可能なオプションについては、このトピックで説明しています。

書式設定された値

抽出した値は Excel に表示される値であり、日付と数値の値は書式設定されて抽出されます。つまり、数値は、セルの実際の値よりも桁数が少なくなる場合があります。

プレーン値

セルの値が書式設定されていなかった場合、抽出した値は、Excel に表示される実際の値です。たとえば、数値の小数は丸められません。

数式

セルに数式が含まれる場合、抽出されたものかどうかにかかわらず、プレーン値オプションで抽出される値と同じです。

スプレッドシート ビューを右クリックして、ステップを作成する場合、[次を抽出] の値は選択した [ビュー モード] の値に設定されます。[ビュー モード] を [数式] に設定してから、ページ ビューで右クリックして、コンテキスト メニューから [抽出] > [テキスト抽出] (テキスト変数に) を選択すると、セル値抽出アクション ステップの [次を抽出] オプションが [数式] に設定されます。

抽出したコンテンツを再度書式設定 (または正規化) することが必要な場合があります。セル値抽出アクションでは、データ コンバータのリストを設定して、コンテンツの書式を再度設定できます。

このためには、スプレッドシート ビューで右クリックして、ステップを作成します。目的の抽出ステップを選択し、必要なパラメータを指定します。

Excel ファイルの共有数式

組み込み Excel ドライバーはドキュメントの共有数式をサポートしません。共有数式は 1 つのセルから別のセルに自動的にコピーされる数式があるセルのことです。共有数式が含まれる Excel ドキュメントの構造を変更する操作 (列の追加や削除など) で、ドキュメントのエラーが発生することがあります。

この制限が確認されているのは、Design Studio の外部で作成された Excel ドキュメントのみです。ロボットで作成された Excel ファイルに共有数式を含めることはできません。

回避策: Excel ドキュメントに共有数式が含まれていないことを確認します。1 つの数式セルを複数のセルにコピーする場合、同時に複数をコピーするのではなく、同時にコピーするのは 1 つのセルのみにします。

または、使用中の Kofax RPA インストールの Snippets フォルダに含まれる convertSharedFormulas.snippet ファイルを使用すると、Excel ドキュメントの共有数式を変換できます。このスニペットは次の手順を実行します:

  1. 共有セルが含まれる Excel ドキュメントを特定します。
  2. すべての数式セルをループします。
  3. これらの各セルで数式を抽出し、再度セルに入力します。