サーチエンジン


サーチエンジンの種類と活用方法

ディレクトリー型とロボット型

 現在、サーチエンジン(検索サイト)は、大きく2つに分類される。 Yahooのように、人間が手作業でサイトを収集して分類する「ディレクトリー型」と、gooのようにプログラムが自動的にサイトを検索する「ロボット型」である。

 ディレクトリー型は専属スタッフがウェブサイトを実際に見て有益な情報があると判断したものだけをディレクトリーに収める。この ため、ゴミ情報は少ない。ただし、増え続けるウェブサイトをすべて網羅するのは不可能だ。さらに、ラインアップに選ぶ人間の「主観」が入るのは避けられない。これに対して、ロボット型はプログラムによる情報収集によって網羅性はあるものの、その内容までは判断できないため、ゴミ情報ばかり集めてくる確率も高い。

 

ディレクトリー型サーチエンジンで探す場合

 ディレクトリー型は、ジャンル別に登録サイトを細かく分類し、各サイトに短い紹介文が付いているのが特徴。あるジャンルやテーマについてざっと知るための、イントロダクション的な検索に向いている。専門用語を細かく検索するのには向いていない。

ポイント

紹介文の的確さを活用する。

大きなジャンルへの入り口として利用する(代表的なサイトやリンク集を発見する)。

 

ロボット型サーチエンジンで探す場合

 ロボット型は、WWWの全文検索を行うプログラムを用いた検索サービス。入力されたキーワードのあるページをすべてピックアップ してくるので、キーワードによっては膨大な量の結果になることも ある。
検索結果をいかに絞り込むかがポイント。最近はディレクトリー型と併用するサーチエンジン(検索サイト)もある。

ポイント

検索結果を上手に絞り込む(ヒットスコアや追加検索を活用する)。

不要な情報は検索しない。

サーチエンジン(検索サイト)ごとの特徴をつかんで、無駄をなくす。

 

ジャンル限定検索サイトで探す場合

ジャンル限定検索サイトは、あらかじめ限定されたジャンルの情報 のみを集めて提供する検索サービス。書籍全体の目録といった大き なものから寄生虫に関するものまで、さまざまなジャンルの情報が それぞれまとめられて検索できる

ようになっている。ロボット型サ ーチエンジンが拾ってこれない情報も多くまれている。

ポイント

テーマや条件が決まっていればスムーズ。

検索結果から直接物品などを取引できるところも多いので活用度大。

一部有料データベースもある。

 

基本的な検索方法

1、キーワードについて

サーチエンジンの使い方でもっとも重要なのは、適切なキーワード を選ぶことにある。
なかなか探しているページにたどりつけないときには、キーワードの再検討が必要。
いきなり目的のページにたどりつけることは少ないので、最初は大きな範囲のキーワードから始 めて、その検索結果をもとに次のキーワードを探して再度検索する といった手順を繰り返していくだけでも、かなりの確率で目的のページにたどりつける。また、検索する単語の類義語や同義語と組み合わせるのも良い方法 である。

 

2、検索式について

 より効率的な検索方法は、複数のキーワードを指定する方法である。 多くのサーチエンジンでは単語をスペースで区切って入力すればよ く、その扱い方は「すべての語を含む」、「いずれかの語を含む」 といったオプションを指定すればよい。しかし、より正確に検索を する場合には検索式を使いたい。
 検索式とは、複数のキーワードに対して条件付けを行うための記述方法である。
検索式の記述方法はサーチエンジンによって異なるが、大きく分けると、単語と単語の間に「AND(すべてを含む)」、「OR(い ずれかを含む)」、「NOT(含まない)」を入れる方法と、単語 の前に「+(すべてを含む)」、「−(含まない)」を付ける方法 の2通りがある。この2つの方法と、カッコで囲むグループ化の方法を覚えておけば、検索式の記述は難しくはない。

 

AND、+ すべてを含む入力したキーワードのすべてを含む指定。ヒット数が多すぎる場合 に、キーワードを加えて絞り込んでいくと効果的。

(記述例)

「宇宙AND旅行AND料金」

「+宇宙+旅行+料金」

 

OR いずれかを含む

入力したキーワードのいずれかを含む指定。類義語や表記の揺れを 記述して、より多くのサイトを検索対象にしたい場合に使用するこ とが多い。「+」や「−」で指定するサイトの場合には、ORに相 当する記述方法はないので、単にスペースで区切って書けばよい。

(記述例)

「ウオツカORウオッカORウォッカ」

「ウオツカ ウオッカ ウォッカ」

 

NOT、− 含まない

入力したキーワードを含めない指定。
ヒット数が多すぎる場合など、 関係ないページを検索対象からはずす場合に用いると効果的。NO Tで指定した単語が含まれているページはすべて検索対象からはず れてしまうので、あまり一般的な単語はNOTで指定しないように 注意が必要。

(記述例)

「サッカーNOTワールドカップ」

「+サッカー−ワールドカップ」

 

( ) グループ化

ANDやOR、NOTを組み合わせた指定を行う場合には、カッコ でグループ化することが必要となる。特にORとANDを組み合わ せて使う場合には、ANDとORの優先順位が問題になる。
 検索式 ではANDのほうがORよりも優先されるため、「コーヒーOR珈 琲AND豆」という検索式では「コーヒー」または「珈琲AND豆」 が含まれるページが検索対象になってしまう。
 正しく意図したとお りの検索を行うには、「(コーヒーOR珈琲)AND豆」とORで 指定した文字列をカッコでくくらなくてはならない。また、検索対象からはずしたい単語をNOTとORでまとめて指定する方法も有効である。

 

3、無駄な情報はかたづける

検索結果がある特定のサイトに偏ってしまうことがある。
特に掲示 板やメーリングリストのログを保存しているサイトが問題となる。 こうしたサイトはページ数も多く、「Re:」といった形で同じキ ーワードが含まれている場合がある。
こうしたページが延々と検索 結果として出てきてしまうと、ほかのサイトのページが埋もれてし まい、重要なページを見逃してしまいかねない。こうしたときには、 逆に各ページに共通する単語をキーワードとして「NOT」を使って検索対象から排除すればよい。「Message−ID:」のよ うなメールヘッダーや、掲示板なら管理者のメールアドレスなどを 「NOT」で指定することにより、こうしたページを検索対象から はずすことができる。

 

4、リンク集をみつける

あまり詳しくない分野について検索する場合は、まずはリンク集を 探してみる。

 サーチエンジンである程度は候補を絞れたとしても、どのページがより有益な情報を含んでいるかは、専門家の意見を参 考にしたほうがよい。
 インターネットの世界では、かなりマイナー なジャンルであっても、その分野の専門家が情報を提供している場 合が多い。そうしたページには、必ずといっていいほどよくできた リンク集があるので、それを参考にしてさらに他のページをまわっ ていけば、その分野についてはひととおりの知識が得られるはずである。
 リンク集を見つけるには、Yahoo!のようなディレクトリー型 のサーチエンジンから始めるのが効果的である。

 

サーチエンジンの種類と活用方法

ディレクトリー型とロボット型

現在、サーチエンジン(検索サイト)は、大きく2つに分類される。 Yahooのように、人間が手作業でサイトを収集して分類する「 ディレクトリー型」と、gooのようにプログラムが自動的にサイ トを検索する「ロボット型」である。

 ディレクトリー型は専属スタッフがウェブサイトを実際に見て有益 な情報があると判断したものだけをディレクトリーに収める。
このため、ゴミ情報は少ない。ただし、増え続けるウェブサイトをすべ て網羅するのは不可能だ。さらに、ラインアップに選ぶ人間の「主観」が入るのは避けられない。
 これに対して、ロボット型はプログラムによる情報収集によって網 羅性はあるものの、その内容までは判断できないため、ゴミ情報ば かり集めてくる確率も高い。

 

ディレクトリー型サーチエンジンで探す場合

ディレクトリー型は、ジャンル別に登録サイトを細かく分類し、各サイトに短い紹介文が付いているのが特徴。
あるジャンルやテーマ についてざっと知るための、イントロダクション的な検索に向いている。
専門用語を細かく検索するのには向いていない。

ポイント

紹介文の的確さを活用する。

大きなジャンルへの入り口として利用する(代表的なサイトやリンク集を発見す

る)。

 

ロボット型サーチエンジンで探す場合

 ロボット型は、WWWの全文検索を行うプログラムを用いた検索サ ービス。入力されたキーワードのあるページをすべてピックアップ してくるので、キーワードによっては膨大な量の結果になることもある。
検索結果をいかに絞り込むかがポイント。最近はディレクトリー型と併用するサーチエンジン(検索サイト)もある。

ポイント

検索結果を上手に絞り込む(ヒットスコアや追加検索を活用する)。

不要な情報は検索しない。

サーチエンジン(検索サイト)ごとの特徴をつかんで、無駄をなくす。

 

ジャンル限定検索サイトで探す場合

 ジャンル限定検索サイトは、あらかじめ限定されたジャンルの情報 のみを集めて提供する検索サービス。
書籍全体の目録といった大き なものから寄生虫に関するものまで、さまざまなジャンルの情報が それぞれまとめられて検索できるようになっている。ロボット型サーチエンジンが拾ってこれない情報も多く含まれている。

ポイント

テーマや条件が決まっていればスムーズ。

検索結果から直接物品などを取引できるところも多いので活用度大。

一部有料データベースもある。

 

基本的な検索方法

1、キーワードについて

 サーチエンジンの使い方でもっとも重要なのは、適切なキーワードを選ぶことにある。
なかなか探しているページにたどりつけないときには、キーワードの再検討が必要。
 いきなり目的のページにたどりつけることは少ないので、最初は大きな範囲のキーワードから始めて、その検索結果をもとに次のキーワードを探して再度検索するといった手順を繰り返していくだけでも、かなりの確率で目的のページにたどりつける。また、検索する単語の類義語や同義語と組み合わせるのも良い方法である。

2、検索式について

 より効率的な検索方法は、複数のキーワードを指定する方法である。 多くのサーチエンジンでは単語をスペースで区切って入力すればよく、その扱い方は「すべての語を含む」、「いずれかの語を含む」といったオプションを指定すればよい。
しかし、より正確に検索をする場合には検索式を使いたい。

 検索式とは、複数のキーワードに対して条件付けを行うための記述方法である。
検索式の記述方法はサーチエンジンによって異なるが、大きく分けると、単語と単語の間に「AND(すべてを含む)」、「OR(い ずれかを含む)」、「NOT(含まない)」を入れる方法と、単語 の前に「+(すべてを含む)」、「−(含まない)」を付ける方法 の2通りがある。この2つの方法と、カッコで囲むグループ化の方 法を覚えておけば、検索式の記述は難しくはない。

 

AND、+ すべてを含む

入力したキーワードのすべてを含む指定。ヒット数が多すぎる場合 に、キーワードを加えて絞り込んでいくと効果的。

(記述例)

「宇宙AND旅行AND料金」

「+宇宙+旅行+料金」

 

OR いずれかを含む

 入力したキーワードのいずれかを含む指定。類義語や表記の揺れを 記述して、より多くのサイトを検索対象にしたい場合に使用するこ とが多い。
 「+」や「−」で指定するサイトの場合には、ORに相 当する記述方法はないので、単にスペースで区切って書けばよい。

(記述例)

「ウオツカORウオッカORウォッカ」

「ウオツカ ウオッカ ウォッカ」

 

NOT、− 含まない

 入力したキーワードを含めない指定。ヒット数が多すぎる場合など、 関係ないページを検索対象からはずす場合に用いると効果的。
 NO Tで指定した単語が含まれているページはすべて検索対象からはず れてしまうので、あまり一般的な単語はNOTで指定しないように 注意が必要。

(記述例)

「サッカーNOTワールドカップ」

「+サッカー−ワールドカップ」

 

( ) グループ化

ANDやOR、NOTを組み合わせた指定を行う場合には、カッコでグループ化することが必要となる。
特にORとANDを組み合わせて使う場合には、ANDとORの優先順位が問題になる。
検索式 ではANDのほうがORよりも優先されるため、「コーヒーOR珈琲AND豆」という検索式では「コーヒー」または「珈琲AND豆」 が含まれるページが検索対象になってしまう。
正しく意図したとお りの検索を行うには、「(コーヒーOR珈琲)AND豆」とORで 指定した文字列をカッコでくくらなくてはならない。
また、検索対 象からはずしたい単語をNOTとORでまとめて指定する方法も有効である。

 

3、無駄な情報はかたづける

 検索結果がある特定のサイトに偏ってしまうことがある。
特に掲示 板やメーリングリストのログを保存しているサイトが問題となる。
こうしたサイトはページ数も多く、「Re:」といった形で同じキ ーワードが含まれている場合がある。こうしたページが延々と検索 結果として出てきてしまうと、ほかのサイトのページが埋もれてし まい、重要なページを見逃してしまいかねない。こうしたときには、 逆に各ページに共通する単語をキーワードとして「NOT」を使って検索対象から排除すればよい。
「Message−ID:」のようなメールヘッダーや、掲示板なら管理者のメールアドレスなどを 「NOT」で指定することにより、こうしたページを検索対象からはずすことができる。

 

4、リンク集をみつける

 あまり詳しくない分野について検索する場合は、まずはリンク集を探してみる。
サーチエンジンである程度は候補を絞れたとしても、 どのページがより有益な情報を含んでいるかは、専門家の意見を参 考にしたほうがよい。
インターネットの世界では、かなりマイナーなジャンルであっても、その分野の専門家が情報を提供している場合が多い。
そうしたページには、必ずといっていいほどよくできた リンク集があるので、それを参考にしてさらに他のページをまわっていけば、その分野についてはひととおりの知識が得られるはずである。
リンク集を見つけるには、Yahoo!のようなディレクトリー型のサーチエンジンから始めるのが効果的である。

 

お勧めサイト

(独断と偏見で、初心者からより詳しい人向けに並べています。)

- 超初心者のためのホームページ検索術

サーチのテクニックが基本編・日本編・海外編別に細かく説明されています。

- 検索デスク

SearchDesk.com TOPページから直接いろいろな検索ができるサイト専門、生活

などに分かれている 

 

担当
3期生 柏原正寛
3期生 田中宏樹

法情報学 トップページへ