タグ ファインダーのプロパティ

このトピックでは、タグ ファインダーの設定に使用するプロパティについて説明します。

検索範囲

名前付きタグに関連するタグの検索場所を指定します。デフォルト値は「ページ内の任意の場所」であり、名前付きタグはタグの検索に使われません。

タグ パス

タグ パスについては、タグ パスを参照してください。

属性名

タグには、"align" などの特定の属性が必要です。

属性値

タグには、特定の値がある属性が必要です。[属性名] プロパティが設定されている場合、属性値はその属性名に関連付けられます。

これらの値は大文字と小文字が区別されます。

  • 「テキストと等しくする」は、属性値が指定したテキストと完全に一致することを指定します。テキストは属性値の全体と一致する必要があることに注意してください。
  • 「テキストを含む」は、属性値に指定されたテキストが含まれることを指定します。
  • 「テキストで始まる」は、属性値が指定したテキストで始まることを指定します。
  • 「以下のテキストで終了」は、属性値が指定したテキストで終わることを指定します。
  • 「次のパターンに一致」は、属性値が指定したパターンと一致することを指定します。パターンは属性値全体と一致する必要があることに注意してください。
  • 「テキストと等しくない」は、属性値が指定したテキストと等しくないことを指定します。
  • 「テキストを含まない」は、属性値に指定されたテキストが含まれないことを指定します。
  • 「テキストで開始しない」は、属性値が指定したテキストで始まらないことを指定します。
  • 「テキストで終了しない」は、属性値が指定したテキストで終わらないことを指定します。
  • 「パターンと一致しない」は、属性値が指定したパターンと一致しないとを指定します。
タグ パターン

".*<b>.*Stock Quotes.*</b>.*" など、内部のタグもすべて含めてタグが一致する必要があるパターン。ロボットのパフォーマンスに大きな影響を及ぼす可能性があるため、このプロパティを使用する場合は注意が必要です。タグ パターンは、1 つの一致するタグを検索するためにページ全体に何度も適用されることがあるためです。これを回避するには、照合対象プロパティに「テキストのみ」を選択する方法があります。

照合対象

タグパターンは、テキストまたはタグの HTML 全体と照合する必要があります。デフォルトでは、パフォーマンスの高速化のため、テキストのみと照合します。

タグ深度

一致するタグが互いに入れ子になっている場合、どのタグを使用するかを判断します。デフォルト値は [範囲内の深度] です。この値は、一致するタグをすべて受け入れます。[最も外側のタグ] を選択した場合、最も外側のタグのみが受け入れられ、同様に、[最も内側のタグ] を選択すると、最も内側のタグのみが受け入れられます。

タグ番号

複数のタグがタグ パスなどの基準と一致する場合、どのタグを使うかを決定します。使用するタグの数を、一致する最初のタグから順方向、または一致する最後のタグから逆方向のいずれかで数えて指定します。例えば、タグ パスを "table" に、タグ属性プロパティを "align = center" に、 タグ パターン プロパティを ".*Business News.*" に設定すると、タグ ファインダーは、<table> タグで、中央揃えされ、"Business News" というテキストが含まれる最初のものを見つけます。