検索の手引き
最終更新 2001.07.04
[検索のノウハウ|高度な検索1(クエリーのルール)|高度な検索2(ファイル属性による検索)]
自由文語検索
この検索システムは、自由文検索(フリーテキストクエリー)です。この方式は、検索したい語句や文章そのものを入れると、その中の単語を自動的に切り分け、それらの単語や類似の意味の単語が含まれるHTMLページを検索するものです。
このため、該当するページのヒット率は高くなりますが、単語を自動的に切り分けるため、本来必要でないページが検索される場合もあります。
例えば、印鑑登録は、印鑑 と 登録 に単語が自動切り分けされて検索されます。このため、もし印鑑登録という単語で検索したい場合は、引用符(")を単語の前後に付けて、1つの語句として検索して下さい。
- 例
- 秋田市の人口 → 秋田 秋田市 市 人口 というどれかの単語が入っているページを検索
- 印鑑登録 → 印鑑 か 登録 というどれかの単語が入っているページを検索
- "印鑑登録" → 印鑑登録という単語が入っているページを検索
語句検索
語句単位で検索するには、語句を引用符(")で囲んでください。複数の語句がある場合は、間に空白を入れて下さい。語句検索文内の語句は、入力した語順でページに含まれ、かつ間にそれ以外の単語(語句でないものは除く。)が入っていないものが検索されます。
2つ以上の単語が単に含まれているページを検索する場合は、下記のand演算子を使って下さい。
- 例
- "印鑑 登録" で検索 → 印鑑という単語の次に登録という単語が出てくるファイルを検索
- "登録 印鑑" で検索 → 登録という単語の次に印鑑という単語が出てくるファイルを検索
- ※"印鑑 登録" で検索した場合と"登録 印鑑"
で検索した場合の検索数は、同じではない。
注意事項
- 日本語と英語のみ検索可能です。
- Microsoft インターネットエクスプローラー
3.01 より前のバージョンでは、正しく検索できない場合があります。3.02以降をお使いください。
- 検索文字の入力時に、 論理演算子を使用することができますが、必ず半角スペースで区切ってお使いください。
- 論理演算子、特殊符合は、半角で入力してください。
- 引用符( " )を含む単語や句を検索するには、検索語句の全体を引用符で囲んだうえで、引用符を含む単語をさらに引用符で囲みます。
たとえば、きらめく北の"人間都市" を検索するには、 "きらめく北の""人間都市""" と指定します。
- *はワイルドカード文字として扱われます。
esc* は "ESC" や "escape" などの単語とマッチします。
英単語の場合
- 大文字・小文字は区別されません。
- ピリオド( . )、コロン( : )、セミコロン( ;
)、カンマ( , ) などの句読点文字は無視されます。
- 検索語において特殊な意味を持つ & 、|
、 ^ 、 # 、 @ 、 $ 、 ( 、 ) などの文字を検索するには、それらを引用符
( " ) で囲みます。
論理演算子の使用
論理演算子を使うと、より適切な検索が可能になります。
- 両方の語句が出てくるページを検索する場合はAND演算子を使用します。
| 論理演算子 |
検索例 |
検索結果 |
| and または & |
きらめく and 人間
きらめく & 人間 |
"きらめく" と "人間"
の両方の単語が存在するページ |
注:andまたは&検索は、語句検索と違い、語句の順序は関係ありません。
- どちらかの語句が出てくるページを検索する場合はOR演算子を使用します。
| 論理演算子 |
検索例 |
検索結果 |
| or または | |
きらめく or 人間
きらめく | 人間 |
"きらめく" または "人間"
のどちらか単語が存在するページ |
- ある語句が出てこないページを検索する場合NOT演算子を使用します。
| 論理演算子 |
検索例 |
検索結果 |
| not または ! |
きらめく and not人間
きらめく & ! 人間 |
"きらめく" は存在するが、 "人間"
が存在しないページ
※NOT演算子を使用した場合、ヒット文書が多くなり過ぎますので、必ずAND演算子と併用してください。 |
- AND演算子はOR演算子よりも高い優先順位を持っています。
- 論理演算子の優先順を変更するため、検索語句をかっこ
( ) で囲むことができます。かっこ内の検索語区はのほかの部分よりも先に評価されます。
| 検索例 |
検索結果 |
きらめく or 北 and 人間
きらめく or (北 and 人間) |
"きらめく" が存在するか、 "北"
と "人間" の両方が存在しているページ
- きらめく、北、人間 → ○
- 北、人間 → ○
- きらめく → ○
- きらめく、北 → ×
|
(きらめく or 北) and 人間 |
"きらめく" か "北" のいずれかと、"人間"
が存在しているページ
- きらめく、北、人間 → ○
- 北、人間 → ○
- きらめく → ×
- きらめく、北 → ×
|
ファイル属性(プロパティ値)検索は、HTMLファイルの記述内容だけではなく、更新日やファイル名といったファイルの属性を条件として検索します。
ファイル属性検索の例
- ファイルの名前で検索する時には、#Filenameプロパティを使います。検索指定には正規表現を使うことができます。
| 検索例 |
検索の内容 |
#Filename guide*.htm |
guideXXXXX.htmというファイル名のファイル |
#Filename map.|(gif|,jpg|,png|) |
map.gif、map.jpg、map.pngのいずれかのファイル名のファイル |
- ファイルの大きさで検索する時には、@Sizeプロパティを使います。大きさの指定はバイト単位になります。検索指定には条件式を使うことができます。
| 検索例 |
検索の内容 |
@size < 100 |
100バイト未満の大きさのファイル |
@size = 1000 |
1000バイトの大きさのファイル |
@size >= 10000 |
10000バイト以上の大きさのファイル |
- 数値には 10 進数または 16 進数 (0x で始まる値)
のどちらでも指定できます。
- ファイルの更新日時で検索するときには、@Writeプロパティを使います。実際の日付や時間でも、現在からの相対的な日付や時間でも指定できます。指定には条件式を使うことができます。
| 検索例 |
検索の内容 |
@write > 96/2/14 10:00:00 |
1996 年 2 月 14 日午前 10:00 (GMT) 以降に変更されたファイル |
@write > -2d2h |
過去50時間以内に変更されたファイル |
@write > -1w |
過去1週間以内に変更されたファイル |
- 日付と時刻の値は yyyy/mm/dd hh:mm:ss または yyyy-mm-dd hh:mm:ss の形式で指定します。年の部分の最初の 2 文字と時刻の部分は省略できます。年の部分の最初の
2 文字を省略した場合、29 以下は 2000 年代と解釈され、30
以上は 1900 年代と解釈されます。日付および時刻の値は、すべてグリニッジ標準時
(GMT) です。
- 現在からの相対日時はマイナス記号 (-) を付けて表し、その後に
0、または整数と文字のペアを 1 つまたは複数指定します。文字には時間の単位を示す
y (年)、m (月)、w (週)、d (日)、h (時)、n
(分)、または s (秒) を指定します。1997/12/8
10:10:03:452 のように、日付式の秒の部分の後に
3 桁のミリ秒値を指定することも可能です。
正規表現
ファイル属性検索では、正規表現が次のように定義されています。
- アスタリスク (*)、ピリオド (.)、疑問符 (?)、および縦棒
(|) 以外の文字は、その文字自身と一致します。
- 正規表現は、引用符 (") で囲んでもかまいません。空白文字
( ) や右かっこ ()) を含む場合は引用符で囲む必要があります。
- *、.、および ? の各文字は、Windows の場合と同じ働きをします。それぞれ、任意数の文字、ピリオド
(.) または文字列の終端、および任意の 1 文字と一致します。
- 文字 | はエスケープ文字です。| の直後に次の文字を指定すると、それぞれ特殊な意味を持つようになります。
- ( は、グループの始まりを示します。( の後に対応する
) が必要です。
- ) は、グループの終わりを示します。) の前に対応する
( が必要です。
- [ は、文字クラスの始まりを示します。[ の後に対応する
(エスケープされていない) ] が必要です。
- { は、繰り返し一致検索の始まりを示します。{
の後に対応する } が必要です。
- } は、繰り返し一致検索の終わりを示します。}
の前に対応する { が必要です。
- , は、OR 節を区切ります。
- * は、直前の式が 0 個以上出現する箇所と一致します。
- ? は、直前の式が 0 個または 1 個出現する箇所と一致します。
- + は、直前の式が 1 個以上出現する箇所と一致します。
- 上記以外の文字を | の直後に指定した場合は、その文字自身と一致します。
- 角かっこ ([]) で囲まれた部分では、次の文字が特殊な意味を持ちます。
- ^ は、この直後のクラス以外のすべてのクラスと一致します。指定する場合は角かっこ内で必ず先頭に指定します。
- ] は、^ の直後に指定した場合のみ、文字 ]
と一致します。それ以外ではクラスの終わりを示します。
- - は、範囲指定演算子です。両側に通常の文字を記述し、文字の範囲を指定します。
- 上記以外の文字はすべて、その文字自身と一致します
(または範囲指定の最初または最後を示します)。
- 中かっこ ({}) で囲まれた部分では、次の構文が有効です。
- |{m|} は、直前の式が m 個 (0 < m < 256) 出現する箇所と一致します。
- |{m,|} は、直前の式が少なくとも m 個 (1 < m < 256) 出現する箇所と一致します。
- |{m,n|} は、直前の式が m 個以上 n 個以下出現する箇所と一致します (0 < m
< 256、0 < n < 256)。
- 文字 *、.、および ? と一致させるには、その文字を角かっこで囲みます。たとえば、[*]sample
は *sample と一致します。
|トップ|検索|