
ブログの Google 検索インデックス状況は Search Console で調べられますが、URL 検査や カバレッジ除外項目のチェックに時間がかかるのが難点です。
「Search Console URL Inspection API」を使えば、指定した URL のインデックス状況を一括取得できます。わざわざ Search Console を開かなくても済みますし、CSV 形式など一覧表示で現状を把握できるのはかなり便利です。
本記事では、専門知識がなくても API 経由で情報を取得できる「Google Bulk Inspect URLs」 というツールの使い方を解説しています。ぜひ一度お試しください。
Headline
Search Console でインデックス状況を確認するのは面倒
特定のページが Google からどのように認識されているかは、Search Console の URL 検査で確認できます。

1 件ずつの入力しかできず、検査に数秒かかるため、ブログ全記事の状態をチェックするのには向きません。
全体の状況を把握したいなら、「カバレッジ」を参照する形になります。「除外」にチェックを入れると、Google 検索にインデックス登録されていないページや、削除されているページを確認できます。

ただし、Google が認識しているページの情報が出てくるため、ブログの状況によっては現状を把握しづらいかもしれません。
Search Console URL Inspection API を使えば、以下のように「指定したページの状況」を一括取得できます。どのページ(記事)に問題があるかすぐわかるので、使わない手はありませんね。

以前はインデックス登録されていたのに、実は最近になってインデックスから削除されていた、というページも見つかるかもしれません。
インデックス登録状況一覧を取得する手順
それでは、API を使ってインデックス登録状況一覧表を作成する手順を解説していきます。Search Console を開く必要はありませんが、登録自体は必要です。未登録の場合は、事前に済ませておいてください。
以下、Betz という WordPress で作成したブログで試していきます。
WordPress 以外のブログをご利用されている場合、ブログから記事一覧(URL)を取得する方法が異なりますのでご了承ください。
全記事の URL を CSV で取得する
インデックス状況を確認するために、ブログ記事の URL 一覧が必要です。プラグイン「Simple CSV/XLS Exporter」を使って CSV 形式で取得するのが簡単だと思います。
プラグイン新規追加画面で、「Simple CSV/XLS Exporter」を検索してインストール&有効化してください。

有効化後、「ツール」-「CSV/XLS Export」から設定画面に入れます。

必要なのは記事の URL のみなので、「投稿」「公開済み」「permalink」の 3 つを選択します。

変更を保存し、「Export to CSV」をクリックしてファイルをダウンロードしましょう。Excel を使い慣れている場合は XLS 形式でも問題ありません。

ファイルを任意の場所に保存したら、Excel やメモ帳などで開きます。
以下は「Notepad++」で開いた例です。2 行目以降に URL リストが表示されているのを確認できると思います。

WordPress の作業はここまでです。
Google Bulk Inspect URLs でレポートを取得する
続いて、Google Bulk Inspect URLs にアクセスしてレポートを作成・取得します。
最初に「1. authorize」をクリック。

アカウント選択ウィンドウが表示されるので、Search Console を使用しているアカウントを選択してください。

「確認済みサイトの Search Console データの表示 です」にチェックを入れて続行します。
取得するデータはブラウザ上で処理されるだけで、本ツールがデータを保存・共有することはありません。

アカウント接続が完了したら、「2. select property」で検査したいプロパティ(ブログ)を選択します。

「3. enter one url per line and at least one url to check」に、先ほど取得した記事 URL を貼り付けましょう。

最後に「4. inspect URLs」をクリックすると、データの取得が始まります。

テストブログ 83 記事で約 1 分かかりました。記事数が増えればそれだけ時間がかかるので、完了するまで放置しておきましょう。
API の上限は 1 日 2,000 クエリですが、個人ブログならほぼ問題ないと思います。2,000 記事以上ある場合は、分割して翌日以降に取得すれば大丈夫です。
データ取得が完了したら、「Export data」から CSV または Excel ファイルをダウンロードしてください。

Google スプレッドシートでデータを読み込む
ここでは、CSV ファイルを Google スプレッドシート で読み込む方法をご紹介しておきます。
空白のスプレッドシートを作成後、「インポート」を選択。

インポートウィンドウが表示されるので、「アップロード」を選択。Google Bulk Inspect URLs からダウンロードした CSV ファイルを指定します。

そのまま「データをインポート」をクリック。

以下のようにデータが表示されていれば成功です。

Google Bulk Inspect URLs で取得したデータの見方
各項目の内容

各項目は英語表記となっています。それぞれの内容は以下のとおりです。
項目 | 内容 |
---|---|
inspectedUrl | 検査した URL |
googleCanonical | Google が選択した正規 URL |
userCanonical | ユーザーが指定した正規 URL |
pageFetchState | ページの取得 |
lastCrawlTime | 前回のクロール |
indexingState | インデックス登録を許可? |
robotsTxtState | クロールを許可? |
coverageState | カバレッジ |
verdict | カバレッジ ステータス |
referringUrls | 参照元ページ |
sitemap | サイトマップ |
URL 検査とほぼ同じ項目ですね。

NEUTRAL になっている URL をチェック
作成した一覧表から、問題になっている(インデックスされていない)ページを見つけましょう。
「verdict」欄が「NEUTRAL」になっている URL は何かしらの問題があるので、その列を基準に並び替えておくとわかりやすいと思います。
「NEUTRAL」は、Search Console カバレッジの「除外」とほぼ同じ意味です。
以下は、「NEUTRAL」になっている URL を強調したものです。

verdict の左列にある「coverageState」で、インデックスされていない理由がわかります。
coverageState | 内容 |
---|---|
Crawled – currently not indexed | 「クロール済み – インデックス未登録」と同じ |
Discovered – currently not indexed | 「検出 – インデックス未登録」と同じ |
URL is unknown to Google | URL が Google に認識(≒発見)されていない |
それぞれの対策は以下のとおりです。
coverageState | 対策 |
---|---|
Crawled – currently not indexed | ページの品質が低い可能性があるため、検索意図に合わせてリライト・統合する必要があります。 |
Discovered – currently not indexed | クロール待ちの状態なので、そのまま様子を見てください。 |
URL is unknown to Google | ページが孤立している(内部リンクでつながれていない)か、ページの品質が低い可能性があります。関連記事の強化やリライトで改善していきましょう。 |
WordPress は、特別なことをしていないかぎり技術的な問題が発生することはありません。
クロールされない・インデックスされないのは、ブログ全体または記事の内容が不十分で質が低いから、と考えてよいと思います。または、作成したばかりのブログで、Google が内容を十分に評価できていない可能性もあります。
新しいサイトまたはページの場合、Google が新しいサイトまたはページを見つけてクロールするまで時間がかかることがあります。
クロール リクエストを直接送信した場合でも、インデックス登録がすぐに行われるわけではありません。
あらゆる場所のすべてのページが Google インデックスに登録されるという保証はありません。
インデックス カバレッジ レポート – Search Console ヘルプ
いずれにしても、記事を定期的に更新し、記事の品質を上げていきましょう。質の高いコンテンツの定義・作成方法は、Google 検索セントラルブログに明記されています。
まとめ
「Search Console URL Inspection API」を使えば、ブログのインデックス登録状況を一目で確認できます。今まで一記事ずつ URL 検査していたのなら、作業時間短縮にかなり貢献してくれるのではないでしょうか。
インデックス登録のリクエストは Search Console から行わなければなりませんが、インデックスされないからと何度もリクエストするのはおすすめしません(意味がない)。
個人ブログがインデックスされないのは技術的な問題が原因ではなく、ほとんどがページ品質の問題です。高品質な記事作成に集中しましょう。
それでは、また。