Excel のコンテンツの抽出

Design Studio には、スプレッドシートからコンテンツを抽出するためのステップが 3 つあります。

  • セル値抽出ステップは、見つかった範囲からテキスト コンテンツを抽出するときに使用します。
  • シート名抽出ステップは、見つかった範囲のシートのシート名を抽出するときに使用します。
  • HTML として抽出ステップは、スプレッドシートの見つかった範囲を、その範囲のセルを持つテーブルが含まれる HTML ページとして変数に抽出するときに使用します。

セル値抽出ステップと HTML として抽出ステップの場合、セルから何を抽出するかを指定できます。これは、[次を抽出] オプションの値によって制御されます。ここでの選択は、スプレッドシート ビューのビュー モードの場合と同じです。可能なオプションについては、このトピックで説明しています。

書式設定された値

抽出した値は Excel に表示される値であり、日付と数値の値は書式設定されて抽出されます。つまり、数値は、セルの実際の値よりも桁数が少なくなる場合があります。

プレーン値

セルの値が書式設定されていなかった場合、抽出した値は、Excel に表示される実際の値です。たとえば、数値の小数は丸められません。

数式

セルに数式が含まれる場合、抽出されたものかどうかにかかわらず、プレーン値オプションで抽出される値と同じです。

スプレッドシート ビューを右クリックして、ステップを作成する場合、[次を抽出] の値は選択した [ビュー モード] の値に設定されます。[ビュー モード] を [数式] に設定してから、ページ ビューで右クリックして、コンテキスト メニューから [抽出] > [テキスト抽出] (テキスト変数に) を選択すると、セル値抽出アクション ステップの [次を抽出] オプションが [数式] に設定されます。

抽出したコンテンツを再度書式設定 (または正規化) することが必要な場合があります。セル値抽出アクションでは、データ コンバータのリストを設定して、コンテンツの書式を再度設定できます。

  1. スプレッドシート ビューで右クリックして、ステップを作成します。

    目的の抽出ステップを選択し、必要なパラメータを指定します。