Googleの検索結果に自分のサイトを表示させるには、まず「インデックス」されていることが大前提です。どれだけ丁寧にサイトを作り込んでも、インデックスされていなければ検索結果には一切表示されません。
「うちのサイト、なぜか検索に出てこない」「新しいページを公開したのに見つからない」という状況は、インデックスの問題が原因であることが多いです。
この記事では、インデックスとは何か・なぜ重要なのか・きちんと登録されているか確認する方法・うまく登録されないときの対処法まで、発注担当者の方にもわかりやすくお伝えします。
インデックスとは何か
「索引」から来た言葉
インデックス(Index)はもともと「索引」という意味の英語です。本の巻末についている索引ページを思い浮かべてください。「このキーワードについては〇ページを見てください」という案内が並んでいるあれです。
検索エンジンにおけるインデックスも同じ発想です。Google は世界中のウェブページを巡回し、ページの内容を解析して「どのキーワードに関係するページか」をデータベースに登録しておきます。誰かが検索したとき、そのデータベースを参照して瞬時に回答を返すわけです。
つまり インデックスとは、Google がウェブページの情報をデータベースに登録すること です。このデータベースへの登録が完了していないページは、どんなキーワードで検索しても表示されません。
データベースとは何かのイメージ
難しく考える必要はありません。巨大な図書館をイメージしてください。
図書館に新しい本が届いても、受付で登録してもらい棚に並べてもらわないと、来館者はその本を見つけられません。ウェブサイトも同じで、ページを公開しただけでは「存在は知らせた」だけです。Google のデータベースに登録されてはじめて「棚に並んだ状態」になり、検索で見つけてもらえるようになります。
クロールとインデックスの違い
2段階のプロセスを理解しよう
インデックスの話をするときに必ずセットで出てくるのが「クロール」です。この2つの違いを整理しておきましょう。
クロールとは、Google の自動プログラム(クローラー)がウェブサイトを巡回して情報を収集する作業です。リンクをたどりながら次々とページを訪問し、ページの内容・タイトル・構造などのデータを集めてきます。
インデックスとは、クローラーが収集したデータを Google のデータベースに登録・保存する作業です。
流れを整理するとこうなります。
- クローラーがサイトを訪問してページの内容を読み取る(クロール)
- 読み取ったデータをデータベースに格納する(インデックス)
- ユーザーが検索したとき、データベースから関連ページを取り出して表示する(検索結果表示)
クロールされただけではまだ検索結果には出ません。インデックスまで完了してはじめて表示対象になります。
クロールされてもインデックスされないことがある
「クロールされた=インデックスされた」ではないという点は重要です。Google はクロールしたすべてのページをインデックスするわけではありません。
内容が薄いと判断されたページ、他のページと内容が重複しているページ、質が低いと評価されたページはインデックスから除外されることがあります。Google が「検索ユーザーにとって価値がない」と判断したページは、たとえクロールしていても登録しないのです。
なぜインデックスはSEOに重要なのか
検索結果表示の絶対条件
インデックスされていないページは、SEO 対策をどれだけがんばっても検索結果に一切表示されません。インデックスは SEO のスタートラインです。
どれだけ質の高い記事を書いても、競合他社より詳しい情報を掲載していても、インデックスされていなければ存在しないも同然です。
新しいページはすぐには表示されない
ページを公開してもすぐに検索結果に出てこないのはよくある話です。クローラーがそのページを見つけてインデックスが完了するまでには、早ければ数日・長ければ数週間かかることもあります。
「ページを作ったのに全然検索に出てこない」というのは、多くの場合このインデックス待ちの状態です。放置していれば徐々に登録されていきますが、早く登録させたい場合は後述する方法で促進できます。
インデックスされているか確認する方法
方法1:「site:」コマンドで検索する
もっとも手軽な確認方法です。Google の検索窓に以下のように入力します。
site:(確認したいURL)
例えば site:sinciate.co.jp と検索すると、そのドメインでインデックスされているページの一覧が表示されます。特定のページを確認したい場合は site:sinciate.co.jp/glossary/index/ のように完全なURLを入れることもできます。
結果が表示されればインデックスされています。「0件」または「一致する情報は見つかりませんでした」と出た場合はインデックスされていません。
ただし site: コマンドはあくまで簡易確認です。正確な状況を把握したい場合は次の方法をお使いください。
方法2:Google Search Console の URL 検査ツール
Google Search Console(通称 GSC)は、Google が無料で提供している SEO 管理ツールです。URL 検査ツールを使うと、特定のページがインデックスされているかどうかを正確に確認できます。
確認手順
- Google Search Console にログインする
- 左メニューの「URL 検査」をクリックする
- 確認したいページの URL を入力して Enter を押す
- 「URL は Google に登録されています」と表示されればインデックス済み
- 「URL が Google に登録されていません」と表示されれば未登録
このツールでは「いつクロールされたか」「どんな状態でインデックスされているか」といった詳細情報も確認できます。
方法3:Google Search Console のページ インデックス登録レポート
サイト全体のインデックス状況を把握したい場合は、「ページ インデックス登録」レポートが便利です。
- インデックスされているページ数
- インデックスされていないページとその理由
- noindex タグが設定されているページ
- クロールエラーが発生しているページ
などが一覧で確認できます。サイトをリニューアルした後や新しいページを大量に追加した後は、このレポートで全体状況を確認できるとベストです。
インデックスを促進させる方法
XMLサイトマップを送信する
XMLサイトマップとは、サイト内のページ一覧を記したファイルです。このファイルを Google に送信することで、クローラーにサイトの構成を伝え、すべてのページを効率的に発見してもらいやすくなります。
Google Search Console の「サイトマップ」メニューから送信できます。WordPress サイトであれば、SEO プラグイン(Yoast SEO や All in One SEO など)が自動でサイトマップを生成してくれます。
内部リンクを整備する
内部リンクとは、自社サイト内のページ同士をつなぐリンクです。クローラーはリンクをたどってページを発見するため、内部リンクがしっかり設定されているとクローラーが各ページに到達しやすくなります。
特に新しく作ったページは、既存のページから内部リンクを張っておくことで、クローラーに早く発見してもらいやすくなります。トップページやよく更新されるページからリンクを張ると効果的です。
URL 検査ツールからインデックス登録をリクエストする
「このページを早くインデックスしてほしい」というときは、Google Search Console の URL 検査ツールから直接リクエストできます。
- URL 検査ツールで対象ページを確認する
- 「インデックス登録をリクエスト」ボタンをクリックする
- 数日以内にクロール・インデックスが行われる
新しいページを公開したとき、ページの内容を大きく更新したときなどに活用できます。ただし、リクエストしたからといって必ずすぐにインデックスされるわけではなく、Google 側の判断でタイミングは変わります。
質の高いコンテンツを作る
Google は「ユーザーにとって価値があるページ」を優先的にインデックスします。内容が薄い、他のページと似たような内容、読者の役に立たないと判断されたページはインデックスされにくくなります。
「インデックスされない=コンテンツの質が問題」というケースも珍しくありません。技術的な設定が問題ないのにインデックスされない場合は、ページの内容そのものを見直すことが大切です。
インデックスされない主な原因と対処法
原因1:noindex タグが設定されている
noindex タグとは、「このページをインデックスしないでください」という指示を Google に伝えるコードです。意図せずこのタグが設定されていると、ページが検索結果に表示されません。
WordPress サイトでは、SEO プラグインの設定画面でページごとに noindex を設定できます。「検索エンジンに表示しない」「インデックスしない」などのチェックボックスが誤ってオンになっていないか確認してみてください。
また、サイト全体の設定で「検索エンジンにインデックスさせない」というオプションがオンになっているケースもあります。WordPress の場合は「設定 → 表示設定」で「検索エンジンがサイトをインデックスしないようにする」にチェックが入っていないか確認できます。
確認のポイント
- Google Search Console の URL 検査で「noindex タグにより除外」と表示される場合は、ページの HTML に noindex が設定されている
- WordPress の表示設定を確認する
- SEO プラグインの各ページ設定を確認する
原因2:robots.txt でブロックされている
robots.txt とは、クローラーの巡回を制御するためのファイルです。特定のページやフォルダをクロール禁止にする設定ができますが、意図せず重要なページをブロックしていることがあります。
https://(ドメイン)/robots.txt にアクセスすると内容を確認できます。Disallow: / のような記述があるとサイト全体がブロックされているので要注意です。
ただし、robots.txt でブロックしてもインデックスが完全に防げるとは限りません。確実にインデックスさせたくないページには noindex タグを使うのが確実です。
原因3:コンテンツの品質が低い
前述の通り、Google は価値が低いと判断したページをインデックスしません。以下のようなページは注意が必要です。
- 文字数が極端に少ないページ(内容がほとんどない)
- 他のページと同じような内容が書かれているページ(重複コンテンツ)
- 読者の疑問に答えていない、薄い内容のページ
対処法としては、ページの内容を充実させること、重複しているページは canonical タグ(正規ページの指定)を使って統合することが有効です。
原因4:サイト構造が複雑でクローラーが到達しにくい
サイトの階層が深すぎたり、内部リンクが少なかったりすると、クローラーが特定のページにたどり着けないことがあります。
トップページから3クリック以内に到達できないページは、インデックスされにくい傾向があります。重要なページほど内部リンクを充実させて、クローラーが発見しやすい構造にできるとベストです。
原因5:ページの表示速度が極端に遅い
ページの読み込みに時間がかかりすぎると、クローラーがページの内容を正しく読み取れないことがあります。また、Google はユーザー体験(表示速度)を評価基準のひとつにしているため、遅いページはインデックスの優先度が下がることもあります。
Google の PageSpeed Insights というツールで自社サイトの表示速度を確認できます。スコアが低い場合は、画像ファイルの最適化やキャッシュ設定の見直しを検討してみてください。
インデックスに関してよくある質問
インデックスされれば検索上位に表示されますか
インデックスされることは「検索結果に表示される資格を得た」状態です。上位に表示されるかどうかは、コンテンツの質・被リンク・E-E-A-T(経験・専門性・権威性・信頼性)などの要素によって決まります。インデックスは SEO の土台ですが、それだけで上位表示されるわけではありません。
全ページをインデックスさせる必要がありますか
必ずしもそうではありません。プライバシーポリシー・スタッフ用の管理ページ・テスト中のページなど、検索結果に出てほしくないページには noindex を設定して問題ありません。インデックスさせるべきページを適切に管理することも大切です。
ページを削除したらインデックスからも消えますか
ページを削除してもすぐにインデックスから消えるわけではありません。クローラーが再訪問してページが存在しないことを確認したあと、徐々にインデックスから除外されます。急いで削除したい場合は Google Search Console の「URL の削除」ツールを利用できます。
まとめ
インデックスとは、Google がウェブページをデータベースに登録することです。インデックスされていないページは検索結果に表示されないため、SEO 対策の第一歩はインデックスの確認から始まります。
確認には Google Search Console の URL 検査ツールと site: コマンドが使えます。インデックスされていない場合は、noindex タグ・robots.txt・コンテンツの質・サイト構造・表示速度の5つの観点から原因を探ってみてください。
サイトのリニューアル後や新しいページを大量に追加した後は、インデックス登録レポートで全体状況を確認する習慣をつけられると、問題の早期発見につながります。SEO は小さな積み重ねです。まずは自分のサイトがきちんとインデックスされているか、確認することからはじめてみてください。