|
|
| |
ロボット型検索エンジンの検索メカニズム |
| |
ロボット型検索エンジンがどのようなメカニズムで、ホームページから収集した言葉を、キーワードとして登録し表示しているかが分ると、ホームページの書き方や検索方法の手助けになります。ロボット型検索エンジン
はホームページから収集した文章を単語で区切る「形態素解析」という手法を用います。形態素とは意味的に分割できる最小単位の文字列を指します。この方法により、文章から各単語を取り出し、索引を作ります。
検索キーワードもこの「形態素解析」にかけられ、言葉が分割されます。こうして検索キーワードとホームページ文章が隣りあった形態素の形であるかどうかを判定し表示されます。例えば「検索エンジン」と言う検索語は「検索」と「エンジン」のふたつに分割されて検索にかけられます。
|
| |
キーワード検索の予備知識
|
| |
1 表記のゆれ |
| |
日本語の欠点である表記の曖昧さに起因して起こる現象です。送り仮名にもいろいろあり、どれが正しいのか我々日本人にですら難解です。コンピュータは曖昧な表現を受け付けません。従って表記のゆれに関する正しい知識がないと、正確な検索は難しいといえます。
1-1 送り仮名
取扱商品 取り扱い商品 取扱い商品
これらを音で聞いても皆、同じになります。しかし実際には送り仮名が少しずつ違います。
1-2 外来語
フィルム フイルム バイオリン ヴァイオリン
クアルテット カルテット クヮルテット クァルテット
1-3 略語
メールマガジン メルマガ 北海道銀行 道銀(どうぎん) 北海道産 道産
1-4 漢字とカナとひらがな
すいか スイカ 西瓜 さけ サケ 鮭
1-5 異字同訓漢字
出会い 出逢い
1-6 同義語
検索エンジン サーチエンジン ブラウザ ホームページ閲覧ソフト
1-7 英字とカタカナ
ホームページとHP ワードとWord
***表記が異なる物は全く別物として考えた方が良いです。***
|
| |
2 アルファベットの大文字と小文字、全角と半角の違い |
| |
基本的に大文字と小文字、全角と半角の違いを意識する必要はありません。
|
| |
3 AND検索 |
| |
複数のキーワードを入れて検索する場合があります。例えば「セキュリティ」と「フリーソフト」のキーワードが入ったページを探したいとします。この場合、「セキュリティ」と「フリーソフト」の間にスペースを入れて検索します。これがAND検索です。この手法は大抵の検索エンジンで有効な方法です。
|
| |
4 フレーズ検索 |
| |
人名など検索する時は形態素に分解させないほうが良いのです。つまり通常の方法で検索は避けた方が良い
です。半角のダブルクオートでキーワードを囲むと、フレーズ検索となって正確な検索が可能です。
(例)
EVESERVERカスタマーサービス…307件
"EVESERVERカスタマーサービス"…22件
|
|
| |
ホームページの存在を知ってもらう方法 |
| |
ホームページを作ったら、それで終わりと言う訳ではありません。ホームページの存在を多くのユーザーに告知しなければ、永遠に見てもらえません。住民票のように該当する役所に行って住民届を出せばそれで済むと言うことでもありません。どのようにしたら、ホームページの存在をユーザーにお知らせできるのか、どうすれば見てもらえる可能性が高くなるのかを知っておく必要があります。
|
| |
検索エンジン登録 |
| |
最もポピュラーなのは検索エンジンに登録することです。最低限、ロボット型と呼ばれる検索エンジンに登録します。必要なのはホームページアドレスと、電子メールアドレスですが、登録できるサイトは10箇所位です。
一方、ヤフーに代表されるカテゴリ型検索エンジンサイトは日本国内だけで1,000箇所以上もあります。 カテゴリの種類も一般的なものから、趣味系、ショップ系、出会い系、地域系、女性系など様々な分野があり、
登録には登録者名、登録ホームページアドレス、登録者メールアドレス、紹介文、検索キーワードなどが必要になるので、あらかじめ準備が必要です。ただし、100%登録されるとは限りません。あくまで、登録申請先の判断によります。 |