タグ ファインダーのプロパティ
このトピックでは、タグ ファインダーの設定に使用するプロパティについて説明します。
- 検索範囲
-
名前付きタグに関連するタグの検索場所を指定します。デフォルト値は「ページ内の任意の場所」であり、名前付きタグはタグの検索に使われません。
- タグ パス
-
タグ パスについては、タグ パスを参照してください。
- 属性名
-
タグには、"align" などの特定の属性が必要です。
- 属性値
-
タグには、特定の値がある属性が必要です。[属性名] プロパティが設定されている場合、属性値はその属性名に関連付けられます。
- テキストに一致: 属性値は特定のテキストに一致する必要があります。テキストは属性値の全体と一致する必要があることに注意してください。
- テキストを含む: 属性値は特定のテキストを含む必要があります。
- パターン: 属性値はパターンに一致する必要があります。パターンは属性値全体と一致する必要があることに注意してください。
- タグ パターン
-
".*<b>.*Stock Quotes.*</b>.*" など、内部のタグもすべて含めてタグが一致する必要があるパターン。ロボットのパフォーマンスに大きな影響を与える可能性があるため、このプロパティの使用には注意が必要です。タグ パターンは、1 つの一致するタグを検索するためにページ全体に何度も適用されることがあるためです。これを回避するには、照合対象プロパティに「テキストのみ」を選択する方法があります。
- 照合対象
-
タグパターンは、テキストまたはタグの HTML 全体と照合する必要があります。デフォルトでは、パフォーマンスの高速化のため、テキストのみと照合します。
- タグ深度
-
一致するタグが互いに入れ子になっている場合、どのタグを使用するかを判断します。デフォルト値は [範囲内の深度] です。この値は、一致するタグをすべて受け入れます。[最も外側のタグ] を選択した場合、最も外側のタグのみが受け入れられ、同様に、[最も内側のタグ] を選択すると、最も内側のタグのみが受け入れられます。
- タグ番号
-
複数のタグがタグ パスなどの基準と一致する場合、どのタグを使うかを決定します。使用するタグの数を、一致する最初のタグから順方向、または一致する最後のタグから逆方向のいずれかで数えて指定します。
例えば、タグ パスを "table" に、タグ属性プロパティを "align = center" に、 タグ パターン プロパティを ".*Business News.*" に設定すると、タグ ファインダーは、<table> タグで、中央揃えされ、"Business News" というテキストが含まれる最初のものを見つけます。