|
SEOのプロフェッショナルとして、私たちはウェブサイトの何ページが検索結果として表示されるか、つまりウェブサイトのインデックスボリュームを研究することがよくあります。インデックスボリュームとは、検索エンジンがウェブサイト上でクロールするページ数であり、ウェブサイトのインクルード率に影響を与えるため、SEOにおいて非常に重要な要素です。 インデックスボリュームはトラフィックの基盤であり、インデックスボリュームデータのあらゆる変化はウェブサイト運営者にとって神経を逆なでするものです。ウェブサイトのコンテンツページは、検索エンジンによってクロールされ、フィルタリングされて初めて、検索結果としてユーザーに表示されます。ページがシステムによってフィルタリングされ、検索候補として使用されるプロセスは、インデックス作成と呼ばれます。では、Baiduのインデックスボリュームが低下している理由は何でしょうか?そして、その解決策は何でしょうか? I. 百度の公式チャンネルからの理由百度のインデックスボリュームの減少の理由を理解するには、まず百度自体に原因があるかどうかを確認する必要があります。つまり、馬海翔氏は、次の2つの側面から始めることを提案しています。 1. 割当の再配分 類似データの量がインデックスの合計割り当てに近づくと、割り当てが再分配され、一部は増加し、一部は減少します。 解決策: このような状況では、競合他社を追い越して、より高い割り当てを目指す方法を見つけることが唯一の選択肢です。 2. データ異常エラー A. エラーペナルティ 特定の種類の悪意のある行為に対処するために新しいアルゴリズムが導入されましたが、バタフライ効果により、一部のサイトが誤ってペナルティを受け、多数のインデックスが削除されました。 解決策: Baidu にフィードバックし、ペナルティの削除をリクエストします。 B. 地域データの異常 一部の地域でのデータのクロールやクエリの異常により、サイト状況の誤判断につながり、Baidu の DNS システム アップグレード インシデントで見られたように、対応するインデックス データが削除されたり、誤ったインデックス値が出力されたりする可能性があります。 解決策: Baidu にこれを報告して、さまざまな地域の Web クローラーの実行ステータスを確認できるようにします。 C. インターフェイス呼び出しデータ エラー、データ損失、およびデータ バックアップ関連の例外。 解決策: Baidu に報告し、関連データを確認してもらいます。 II. ウェブサイト自体に関連する理由百度自体に固有の理由に加え、百度のインデックスボリュームの減少は、ウェブサイト自体の問題によっても引き起こされる可能性があります。具体的には、以下の6点が挙げられます。 1. コンテンツデータを含む URL が標準化されていません。 一般的に言えば、これを 2 つの側面から分析する必要があります。 (1)自社ウェブサイトのURLを標準化・統一する。 通常、ステータス コード 200 を使用すると複数のドメインにアクセスできます。大文字と小文字の URL、URL ルールの変更など、1 つのドメイン内の複数の URL 形式で同じコンテンツにアクセスできます。 解決策: メイン ドメイン (またはメイン URL) を選択し、301 リダイレクトを使用して他のドメインのすべての URL をメイン ドメインまたはメイン URL にリダイレクトします (詳細については、Ma Haixiang のブログ「301 永続リダイレクトを設定するための完全ガイド」を参照してください)。次に、ウェブマスター ツールを使用してドメインの再設計 (またはディレクトリ URL の再設計) を送信します。 (2)外部プラットフォームは当サイトのデータを利用する A. 市場協力(サイトデータが他のプラットフォームでアクセスされる)や、コンテンツの積極的な外部配信(プロモーターが独自のコンテンツを高品質のプラットフォームに転送する)など、どちらの理由でも、検索エンジンが外部プラットフォームのコンテンツをインデックス化し、元のウェブサイトのコンテンツを拒否する可能性があります。 解決策: ウェブマスター プラットフォームのリンク送信ツールのプロアクティブ プッシュ機能を使用して、ウェブサイトに新しく出現したリンクをタイムリーに送信し、コンテンツが他のプラットフォームに呼び出される時間を遅らせます。 B. ミラーリング: ユーザーは、別の組織のドメイン名または URL を通じて、ホスト組織のコンテンツに直接アクセスできます。 解決策: ドメイン名解決のセキュリティとサーバーのセキュリティに注意し、一意の解決可能なドメイン名または一意のアクセス可能な URL をバインドします (詳細については、Ma Haixiang のブログ記事「SEO の観点から Web サイトの URL を最適化する方法」を参照してください)。ページ コンテンツ内のリンクには絶対アドレスを使用します。 2. サイトの人気が低下しました。 百度の好感度低下によるウェブサイトのインデックスボリュームの減少については、4つの方法で分析することができ、馬海翔氏が詳しく説明しています。 (1)ウェブページコンテンツ関連 A. コンテンツ品質スコアの低下 解決策:コンテンツの質を向上させる。詳細については、Ma Haixiangのブログ記事「ウェブサイトのコンテンツ質を向上させる7つの戦略」をご覧ください。簡単に言えば、単純なコピーを避け、より多くの情報を統合することです。 B. 更新量と頻度の減少 解決策: 安定した更新頻度を維持し、コンテンツの発展に合わせて編集チームを拡大し、より多くの新しいコンテンツを制作して、ウェブサイトのインデックスの低下を防ぎ、継続的に増加させます (更新量と頻度が大幅に減少すると、クォータが減少し、まずクロール頻度の低下として現れ、インデックス量の減少につながります)。 C. 時間的制約のある情報の消失 解決策: 時間的制約のある情報は通常、データベースに長期間保存されないため、時間的制約のある新しい情報ポイントを継続的に探索し、関連するコンテンツを統合する必要があります。 D. 一部のエリアで不適切な情報が表示されました。 解決策: 過剰な外部リンク、悪意のあるポップアップ広告、違法で機密性の高い情報、検索エンジンを欺くために特別に設計されたコンテンツを排除します。 (2)違反ペナルティアルゴリズム 解決策: ウェブマスター ツールのメッセージと Baidu ウェブ検索の動向に注意し、公式発表に従ってサイトを修正し、フィードバックを提供して、アルゴリズムの更新を待ちます。 (3)特別なURLは信頼できない 解決策: さまざまな URL のインデックス クエリ ルールをカスタマイズし、インデックス ボリュームが減少している特定の URL を見つけ、これらの URL の当日、前日、今週、および過去のインデックス作成ステータスを調査し、データベースにまだ入力されていないデータの潜在的な問題を特定し、処理後に、これらの URL と Baidu データ間の通信を強化します (サイトマップ、一括 URL 送信、データ プッシュなどの方法を使用)。 (4)検索エンジンにおけるサイトの信頼性が低下した。 A. 不正投票の疑い(不正投票サイトへのリンク等) 解決策: 自分のページの投票権を大切にし、質の低いページへの投票を断固として拒否し、サイト上の外部リンクの数を最小限に抑えます (詳細については、Ma Haixiang のブログ「Web サイトに高品質のリンクを作成する方法」を参照してください)。 B. テーマの転換(例:教育から医療へ) 解決策:古いコンテンツページからデッドリンクを削除した後、Baiduに変更を送信して、関連する古いURLへのアクセスをブロックします。その後、新しいトピックで新しいコンテンツを公開し、Baiduへのデータ送信を強化します。 C. 関与 同一IPアドレスによる違法ウェブサイトも多数存在し、同一ドメイン名で運営されているウェブサイトも処罰対象となっているケースが多く、深刻な状況となっています。 解決策: 問題となっている検索エンジンを検索結果から削除し、検索エンジンの関連製品からフィードバックを取得し、ブロック解除をリクエストして、インデックスが正常に戻るまで待ちます。 D. 政策上の理由 たとえば、香港や海外でホストされている Web サイトは、さまざまな理由により安定性が低下する可能性があります。 解決策: 中国で Web ホスティング サービスを登録し、関連するポリシーに準拠して合法的に運営します。 3. ウェブサイトテンプレート関連 SEO の観点から見ると、Web サイトの Web ページも Baidu のインデックスに影響を与えます。具体的には、次の 3 つの点が挙げられます。 (1)メインコンテンツエリアにおけるスパイダーの制限 解決策: 情報を表示するためのログインなどの制限を削除し、スパイダーがサイトからデータを簡単かつスムーズに「収集」できるようにします (詳細については、Ma Haixiang のブログ「検索エンジン スパイダーの基本原則とワークフロー」を参照してください)。 (2)スパイダーフレンドリーではない技術が有効化されました。 解決策: 検索エンジン スパイダーによって識別される必要があるコンテンツの場合、スパイダーに適していないテクノロジを使用しないでください (詳細については、Ma Haixiang のブログ記事「Web サイトをクロールする検索エンジン スパイダーの数が多いほど良いのでしょうか?」を参照してください)。 (3)レスポンシブテンプレートは、スパイダーによるページの種類(PC、モバイル)の識別を妨げます。 解決策: 特定の URL マッピング (できれば解析レベル) を送信し、モバイル バージョンの URL と適切な閲覧デバイスをメタ タグでタグ付けし、個別に適応し、PC 版とモバイル バージョンのソース コード タグの区別を強化して、Baidu がページの種類を識別できるようにします。 4. ソースコード関連 ソースコードに重大なエラー(エンコードエラーやタグの誤用など)が含まれている場合、ソースコードが大幅に変更され、スパイダーがデータを「収集」した後に再観測・分析する場合、特定の種類のURLのTD(タイトルと説明)が変更された場合(変更率が大きい、ページ数が多いなど)、ページが変更された後、インデックス構築プロセスが再開されます。ページの品質がインデックス構築基準を満たさない場合、オンラインデータベースから削除されます。 解決策: ソース コードを検証します。正確なソース コードは、スパイダーがデータを「収集」して分析するための基礎となるためです。ページのさまざまな領域の内部リンク構造、URL アドレス形式、ページ テーマ、HTML タグを可能な限り元の状態に保ちます。タイトルと説明 (TD) を段階的に変更し、ページのテーマと実際のユーザーのニーズに基づいて適切な TD を策定して、ユーザーを欺いたり誤解させたりしないようにします。 5. すでにデータベース内にある URL は、スパイダーのステータスに影響を与える可能性があります。 この問題に関しては、分析する必要がある主なポイントが 4 つあります。 (1)クモの這い上がりを防ぐロボット宣言 解決策: Baidu Webmaster Tools で robots.txt ファイルとクロール ステータスを確認します (詳細については、Ma Haixiang のブログ記事「robots.txt プロトコル ファイルの構文属性の記述と説明の方法」を参照してください)。 (2)URLのルールが変更され、元のURLにアクセスできなくなりました。 解決策:特にLinuxサーバーとWindowsサーバー間でデータを移行する場合、URLの大文字と小文字のサポートが変更される可能性があります。すべてのURLルールが変更されていないことを確認してください。URLをリファクタリングする必要がある場合は、古いURLと新しいURLの両方に301リダイレクトを実装し、ウェブマスターツールから再設計リクエストを送信してください。 (3)エラーページのプロンプト 解決策:削除が偶発的なものであれば、データを復元し、URLに対応するウェブページのコンテンツを最新の状態に保つことでクロール頻度を高めることができます。削除が確実に必要な場合は、デッドリンクを送信し、デッドリンクを削除した上で、robots.txtでブロックしてください。馬海翔氏は、この場合のインデックスの低下は心配する必要はないと考えています。 (4)侵入 解決策: URL が検索エンジン スパイダーを違法にリダイレクトするのを防ぎ、URL に対応する Web ページのコンテンツ、特に違法または無秩序なコンテンツへの大幅な変更を防ぎます。 6. DNSとサーバーの問題 最後に、Baidu のインデックスボリュームが減少する一般的な理由には、DNS とサーバーの問題も含まれます。具体的には、次のとおりです。 (1)DNSの問題 DNS の主な問題は、DNS の不安定性と DNS の安全性の欠如です。 解決策: 信頼できる DNS サービスを選択する、DNS クローラーの安定性を重視する、DNS が異常な IP に解決されないようにする、解決対象の Web サイトの IP アドレスが頻繁に変更されないようにする、悪意のある解決につながる可能性のある DNS 管理の脆弱性を防ぐ、小さなプロキシなどの技術的機能、管理標準、倫理的および法的制約のないプラットフォームで DNS 解決がホストされないようにする。 (2)サーバーの問題 A. アクセスが悪い 解決策: 対象エリア内のすべてのキャリアのユーザーが 3 秒以内、理想的には 1 秒以内に Web サイトを開けることを確認します。Web サイトの動作状況を監視し、対象エリア内のすべてのキャリアの監視ノード、監視項目、監視頻度を適切に構成します。 B. Baidu UA または IP をブロックします。 解決策: Baidu ウェブマスター ツールを活用して、Baidu のウェブページのクロール状態を確認します。 C. ブラッシング防止圧力設定 解決策: スパイダーを専用のスペースにリダイレクトします。IP からのアクセスが急増した場合は、アクセスをブロックするかどうかを決定する前に、それがスパイダーであるかどうかを確認します。 要約馬海翔氏は、新しいウェブサイトの場合、定期的に更新する必要があると提言しています。これにより、検索エンジンはウェブサイトをアクティブなサイトと認識し、より重視するようになります。ホームページの更新は、コンテンツの更新や追加、コラムの変更、ページレイアウトの軽微な変更など、さまざまな側面に反映されます。ウェブサイトのコンテンツ、例えばニュースなどは、多くの情報を必要とします。ウェブサイトが適切なタイミングで更新されず、情報が古すぎると、ウェブサイトのイメージが損なわれるだけでなく、百度(Baidu)に対する親和性も低下します。長期的には、ウェブサイトの権威性やトラフィックの向上、そしてその後のウェブサイトの発展にも直接的な影響を与えます。 さらに、静的ページは検索エンジンにとってクロールしやすいのに対し、データベース テクノロジを使用して取得されたページ コンテンツは検索エンジンにとってクロールしにくいため、Web サイトではできるだけ静的ページを使用する必要があります。 -終わり- |