検索のコツ
検索がうまくいかないときは,次の点を確認してください.
- キーワードの綴りを確かめる
キーワードの綴りが間違っていると検索できません.
- キーワードを増やしてみる
検索結果が何もない,あるいは少ないときは,関連するキーワードを
orを挿んで羅列してみましょう.ヒットしやすくなります.- 例:
-
tex or ptex or latex or latex2e
検索結果が多すぎるときは,関連するキーワードを
andを挿んで羅列してみましょう.検索結果を絞り込めます.- 例:
-
latex and dvi2ps and eps
- 部分一致検索を試してみる.
-
検索結果が何もない,あるいは少ないときは,部分一致検索を試し てみましょう.
tex*を入力するとtexから始まる単語 (tex,texi2html,texindex,textなど) を検索できます.*texを入力するとtexで終わる単語 (bibtex,jlatex,latex,platex,ptex,vertexなど) を検索できます.*tex*を入力するとtexを含む単語 (たくさん) を検索できます.
- 日本語がでたらめにわかち書きされてしまう.
-
{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 }のように,でたらめにわかち書きされることがあります.これは,そもそも最新情報という言葉が検索対象に含まれないことを意味します.検索はあきらめましょう. - 長いカタカナ語の検索がうまくいかない.
マルチパートで検索できないときは"マルチパート"と分割してみてください.検索時にはカタカナ語の分割は行われないため,インデックス (本の索引のようなもの - 検索を高速に行うために使います) 作成時にカタカナ語が分割されていると,正しく検索できません.- フレーズ検索をしたが,そのフレーズを含まない文章までヒットしてしまった.
これは仕様です. Namazu のフレーズ検索は精度が 100 % ではないため,ときどき失敗します.
and,or,notを単語として検索したい.それぞれ,
"..."とダブルクォーテーションマークで,あるいは{...}と中括弧で囲みます.
検索式
単一単語検索
調べたい単語を一つ指定するだけのもっとも基本的な検索手法です.
- 例:
-
namazu
AND検索
ある単語とある単語の両方を含む文書を検索します.検索結果を絞り込むのに有効です.3つ以上の単語を指定することも可能です.単語と単語の間に and を挿みます.
- 例:
-
Linux and Netscape
and は省略できます.単語を空白で区切って羅列するとそれらの語すべてを含む文書をAND検索します.
OR検索
ある単語とある単語のどちらかを含む文書を検索します.3つ以上の単語を指定することも可能です.単語と単語の間に or を挿みます.
- 例:
-
Linux or FreeBSD
NOT検索
ある単語を含み,ある単語を含まない文書を検索します.3つ以上の単語を指定することも可能です.単語と単語の間に not を挿みます.
- 例:
-
Linux not UNIX
グループ化
AND検索,OR検索,NOT検索を括弧でグループ化できます.括弧の両隣には空白を入れる必要があります.
- 例:
-
( Linux or FreeBSD ) and Netscape not Windows
フレーズ検索
2語以上からなる複合語を検索します. "..." と2重引用符で,あるいは {...} と中括弧で囲みます.Namazuのフレーズ検索は精度が 100 % ではないため,ときどき誤ることがあります.
- 例:
-
{GNU Emacs}
部分一致検索
部分一致検索には前方一致,中間一致,後方一致の 3種類があります.
- 前方一致検索
inter*(interから始まる単語を含む文書を検索)- 中間一致検索
*text*(textを内包する単語を含む文書を検索)- 後方一致検索
*net(netで終わる単語を含む文書を検索)
正規表現検索
検索するキーワードを正規表現で指定します.正規表現は /.../ のようにスラッシュ記号で囲みます.正規表現のエンジンにはRubyのコードを利用しています.正規表現の書式はPerlとほぼ同じです.
- 例:
-
/インター?フェ[イー]ス/
フィールド指定の検索
Subject:, From:,Message-Id: といったフィールドを指定して検索する手法です.特にMail/News のファイルを扱う際に効果を発揮します.
- 例:
-
+subject:Linux
(Subject: にLinuxが含まれる文書)+subject:"GNU Emacs"
(Subject: にGNU Emacsが含まれる文書)+from:foo@bar.jp
(From: にfoo@bar.jpが含まれる文書)+message-id:<199801240555.OAA18737@foo.bar.jp>
(Message-Id を指定)
特記事項
- いずれの検索方法でもアルファベットの大文字・小文字の区別はしません.
- 日本語の複合語は形態素単位に分割し,それらを フレーズ検索します.分割は不適切に行なわれることがあります.
- JIS X 0208 (いわゆる全角文字) の英数字と記号の一部 (ASCIIと重複しているもの) は ASCII (いわゆる半角文字) として処理されます.
- 記号を含む語の検索ができます.例:
TCP/IP.ただし,記号の処理は完全ではないのでTCP and IPのように分割してAND検索をかけた方が取りこぼしがありません (その代わり余計なファイルまでヒットしてしまう可能性があります). - 中間一致・後方一致,正規表現,フィールド指定の検索には少し時間がかかります.
and,or,notを単語として検索したいときはそれぞれ,"..."と2重引用符で,あるいは{...}と中括弧で囲みます.