デスクトップ検索

Google, Yahoo, Microsoftとデスクトップ検索ツールをリリースするのが流行っている.ただ,リリースされているものは,いずれも英語版なので,日本語を対象とした検索には不安が残る.これを検証してみた.

検索対象として,最近購入したLinux Magazineのムックに付いてきた過去の記事pdfを利用した.また,検索語として,「Linus」, 「カーネル」を試してみて,検索結果の数を計測した.

  • Google Desktop Search
    • Linus 0, カーネル 0
    • 検索対象は,おおざっぱにしか設定できない.
    • pdfには対応していない様子.
  • Copernic Desktop Search
    • Linus 12, カーネル 4
    • 検索対象のきめ細かい設定が可能.
    • ただし,対象が日本語pdfであるためか,本来の検索結果の一部しか取得できていない.
  • サーチクロス
    • Linus 0, カーネル 0
    • 日本製のデスクトップ検索ツール.Beckyなどの日本製メーラーへの対応が手厚い.ただ,Linux Magazineのpdfは,セキュリティでコピーができないようになっているためか,サーチクロスでは検索がまったく機能しなかった.
    • インデックスの作成を,キー入力などによって中断する機能がなく,インデックス作成中は負荷が高い状態が継続される.
  • MSN Desktop Search
    • Linus 0, カーネル 0
    • pdfには対応していない様子
    • 検索対象のきめ細かい設定が可能
    • 検索キーワードに日本語を指定した場合,なにも検索されない.
  • Ask Jeeves
    • Linus 0, カーネル 0
    • pdfには対応していない様子
    • 日本語は,ファイル名レベルで文字化け.
  • Yahoo Desktop Search
    • Linus 62, カーネル 406
    • 英語の場合,もっともヒット数が多く,正しい結果が取得できている様子.日本語の場合,検索語が含まれていない文書までヒットし,実用的ではない.

あまりうまい方法はない,というのが結論となりそうだ.頑張って,namazu全文検索システムを構築するのが,現時点では確実ということか.