テキスト抽出

  1. [アクション] タブで、[抽出] を選択します。
  2. 製品名や価格などの短いテキストを抽出するには、[テキストのみ] として抽出します。

    これにより、タグの間にあるテキストが抽出されます。

  3. セクションや見出しなどがある長いテキストを抽出するときは、プレーン テキストとして選択できます。ブラウザに表示される状態に近い状態でテキストを表示する場合は、テキストを [構造化テキスト] として抽出します。
  4. 見出しに付いているかっこなど、特別なマークアップとともに抽出するには、[構造化テキスト] を選択します。

    構造化テキストは、特別なマークアップの基本的なサポートを備えています。

  5. [構造化テキスト] オプションでマークアップの要件を満たすことができない場合は、[高度な構造化テキスト] を選択します。

    このオプションを使用すると、HTML タグのマッピングを専用のマークアップに設定できます。