検索エンジンにおけるSEO対策不正行為研究の公開
現在の場所:
ホーム >
記事 >
検索エンジンにおけるSEO対策不正行為研究の公開
検索エンジンにおけるSEO対策不正行為研究の公開
SEO (検索エンジン最適化)は、主に、様々な検索エンジンがインターネットページをクロールし、インデックス化し、特定のキーワードに対する検索結果の順位を決定する仕組みを理解することを言います。SEOの目的は、ウェブページを最適化して検索エンジンのランキングを向上させ、ウェブサイトのトラフィックを増加させ、最終的にはウェブサイトの販売促進やプロモーション効果を高めることです。
SEOは海外で先行して発展しており、GoogleではSEOを専門とする人を検索エンジン最適化(SEO)担当者と呼んでいます。Googleは現在、最大の検索エンジンプロバイダーであるため、世界中のSEO専門家にとってSEOは主要な研究対象となっています。Googleの公式サイトには、SEOを紹介し、GoogleのSEOに対する姿勢を述べた専用ページがあります。
SEOは、検索技術の発展と脆弱性を見つけるためのハッキング技術から生まれました。このメカニズムが検索ランキングに影響を与える可能性があることに気づいた人もいます。世界最大の検索エンジンであるGoogleの急速な発展と、そのランキングアルゴリズムの継続的なアップデートにより、SEO技術とSEOチームも近年急速に発展・成長し、人々の認識と注目は日々高まっています。
I. SEO不正行為
1. SEO 不正行為とは何ですか?
検索エンジン不正行為は、SEO 不正行為、SEO スパム、または検索エンジン スパムとも呼ばれ、検索エンジンでの可視性とランキングを高めるために検索エンジンを欺く行為を指します。
2. 不正行為の方法
技術的な検索エンジンは、ウェブサイトのランキングを人間の介入なしに完全に自動化されたウェブクローラーに依存しているため、ランキングメカニズムを悪用してクローラーを欺く機会が生まれます。SEOの発展を通じて、不正行為に関する議論は常に行われ、業界の主要な焦点となってきました。SEOのプロフェッショナルを目指す人にとって、意図せず不正行為を行ってペナルティを受けることを避けるために、基本的な不正行為のテクニックを理解することは不可欠です。以下は、不正行為とみなされる一般的な手法です。
a) キーワードスタッフィング。これは、METAタグ、タイトル、コメント、画像のALTテキスト、URLなど、ウェブページのコード内でキーワードを意図的に繰り返し使用することで、キーワードの出現頻度を高める行為を指します。
b) 虚偽のキーワード。これは、ウェブサイトのコンテンツとは無関係なキーワードをMETAタグに設定することを指します。例えば、タイトルに人気のキーワードを使用することで、ユーザーを誤解させ、サイトを訪問させる行為です。キーワードが実際のコンテンツと一致していないリンクも同様です。
c) 隠しテキスト/リンク。キーワードの出現頻度を高めるため、キーワードを多く含むテキストを意図的にウェブページに配置し、背景色とマッチさせます。訪問者には見えませんが、検索エンジンには見えます。同様の手法として、極端に小さなテキストサイズや隠しテキストレイヤーの使用などがあります。隠しリンクは、隠しテキストの使用を基盤として、他のページから最適化されたターゲットページへのリンクとして追加されます。
d) リダイレクト。メタリフレッシュタグ、CGIプログラム、Java、JavaScriptなどの技術を使用することで、ユーザーがページにアクセスした際に、迅速かつ自動的に別のウェブページにリダイレクトされます。リダイレクトにより、検索エンジンとユーザーは異なるウェブページにアクセスできるようになります。
e) ウェブページスワッピング。これは、おとり商法とも呼ばれ、ウェブページが登録され、高いランキングを獲得した後に、無関係なコンテンツを含む別のウェブページに置き換える行為です。
f) サイトまたはコンテンツの複製。これは、ウェブサイト全体またはそのコンテンツの一部をコピーし、異なるドメインやサーバーに分散させることで、検索エンジンを欺き、同じサイトまたはページを複数回インデックスさせることを指します。ミラーサイトは、この典型的な例です。
g) ブリッジページ/ドアウェイページ/ポータルページ/エントリーページ。これらは特定のキーワードに特化して最適化されたページで、訪問者をターゲットページにリンクまたはリダイレクトします。同様の手法は、動的なページの静的URLを作成したり、キーワードごとに異なる内部ページを作成したりする際にも使用されることがあります。ただし、ウェブサイトの実際のコンテンツと訪問者のニーズに合わせて作成されるブリッジページとは異なり、ブリッジページには実際のコンテンツはなく、検索エンジン向けのキーワードが詰め込まれたリンクの集まりにすぎません。
h) クローキングページ。これは、同じURLから異なる訪問者に選択的に返されるページを指します。検索エンジンは高度に最適化されたウェブページのコンテンツを受け取りますが、ユーザーには異なるコンテンツが表示されます。
i) 重複登録。これは、ウェブサイトの登録規則や登録間隔の制限に違反し、短期間のうちに同じ検索エンジンにウェブページを繰り返し登録してインデックスを取得する行為を指します。
j) スパムリンク。「リンクファーム」(マスリンクメカニズムとも呼ばれる)に参加することは、多数の相互リンクされたウェブページで構成されるネットワークシステムです。サイトが「リンクファーム」に参加すると、システム内のすべてのページからリンクを受け取ります。その代わりに、サイトは自らリンクを「提供」する必要があり、それによってリンクスコアが向上します。
II. 検索エンジンの不正行為対策 1. なぜでしょうか?ソニーのエンジンにはチート対策が必要だからです。 ほぼすべての検索エンジンは、前述のような検索エンジン不正行為に反対しています。SEOスパムは非常に破壊的な行為であり、検索エンジンウェブサイトの存続基盤である、日々数億人のユーザーの検索体験を直接的に損なうだけでなく、有料検索ランキングや関連広告といった検索エンジンの主要な収益源も破壊します。
検索エンジンの不正行為対策は、インターネットにおけるウイルスやアンチウイルスソフトとの戦いに似ています。そのため、検索エンジンはスパムや不正行為を行うウェブサイトに対して、一般的に一貫したアプローチ、つまり罰則または削除を採用しています。ほぼすべての公式検索エンジンウェブサイトでは、不正行為を特定するための原則と、それに応じたペナルティの概要を公開しています。例えば、2005年3月26日午前4時、Googleは我慢の限界に達し、突如として大量のスパムサイトを摘発しました。(最近では、Baiduが6月25日と28日に低品質サイトを対象とした不正行為対策の調整を行い、多くの低品質サイトや不正行為サイトが削除されました。興味のある方は、「2012年8月25日のBaiduによる大規模サイト削除に関する概要」および「Baidu公式発表:アルゴリズムが再びアップグレードされ、不正行為サイトの掲載と低品質サイトのランキングに影響」をご覧ください。)
2. 不正行為防止
検索エンジンの不正行為は、検索エンジン所有者の利益を損なうだけではありません。長期的には、ウェブサイトの品質が向上しず、検索エンジンの不正行為によって訪問者を惹きつけ続けると、ウェブサイトは最終的にユーザーの支持を得られず、訪問者を維持できず、最終的にはウェブサイト自体に悪影響を及ぼします。
技術的な手段で検索エンジンの不正行為を完全に排除することは不可能ですが、効果的に削減することは可能です。解決策は以下のとおりです。
a) ページコンテンツに関するインテリジェントな判断を強化する。キーワードスタッフィングと偽キーワード(2種類の不正行為)については、インテリジェントな判断を強化する必要があります。例えば、ページの<body>から…
部分抽出、<title></title> または これは、キーワードが特定の段落内でのみ繰り返されているかどうかを判断して、悪意のある重複を排除することを意味します。リダイレクトの場合は、ページにリダイレクト分析を追加する必要があります。リダイレクトにリフレッシュタグを使用する場合は、ページコンテンツ内でマークアップして判断することでこれを実現できます。リダイレクトにJavaScriptを使用する場合は、ページ内のJavaScriptコードを分析できます。
b) ウェブクローラーの匿名性。ページの非表示、ページスワップ、リダイレクトなど、これらの手法はすべてウェブサイトへの現在の訪問者を評価し、ウェブクローラーと一般ユーザーに対して異なる対応をとります。検索エンジンは、一部のウェブクローラーが匿名化され、一般ユーザーを装ってウェブサイトをテストすることを許可すべきです。そうすることで、この種の不正行為を効果的に防止できます。
c) ウェブサイト履歴。これはウェブサイト上のページ変更履歴を記録します。一般的に、ウェブサイト上のコンテンツ以外のページはほとんど変更されません。例えば、ウェブサイトのディレクトリ構造、ページ構造、そして多くの特別なリンクは頻繁に変更されません。ウェブサイトに大きな変更があった場合は、追加のレビューを実施する必要があります。これは、ウェブページの入れ替えなどの不正行為を防ぎ、手動レビューの効率を向上させるのに役立ちます。
d) ウェブサイトの評価。一般的に、良質なウェブサイトは質の高いリンクを張っていますが、スパムウェブサイトは類似のサイトにリンクしていることが多いです。つまり、ウェブサイトは密集しているということです。そのため、ウェブサイトを評価し、分類することで、スパムリンクによる不正行為を効果的に防ぐことができます。
上記の4つの方法は、検索エンジンのSEO不正行為対策能力を効果的に向上させることができますが、完全に排除できるわけではありません。検索エンジンの不正行為対策能力を真に強化するには、人間による介入が不可欠であり、様々な手法を包括的に活用し、階層化されたレビュープロセスを構築する必要があります。
第一層は技術的な手法の改善です。これには、インテリジェントなページ分析とウェブクローラーの機能強化、そしてクローラーのステルス性向上が含まれます。目標は、膨大な量の反復的なコンピュータ操作を伴う、ページ自体で実行される最も基本的な不正行為対策チェックを実行することです。
2つ目のレイヤーはウェブサイト分析です。これは、ウェブサイトの履歴とウェブサイト評価システムに基づいて分析・評価するプロセスです。正当なウェブサイトを除外し、SEO不正行為の疑いのあるウェブサイトを特定することが目的です。評価は、コンピューターと人間の両方の手法を用いてウェブサイトを比較・フィルタリングすることで行われます。
3番目の層は最終レビューです。これは、選定された疑わしいウェブサイトを人間がレビューし、評価するプロセスです。評価はすべて人間によって行われ、最終的な結論が下されます。
コンピュータと人間の努力を組み合わせることで、検索エンジン最適化における不正行為を大幅に排除でき、検索エンジンの結果をユーザーのニーズにより関連したものにすることができます。
III. Googleページランキングシステム Google検索エンジンのコアソフトウェアであるPageRankは、Googleの創設者によって開発された、ウェブページのランキング付けシステムです。PageRankはGoogleの検索ランキングアルゴリズムの構成要素であり、1から10までのレベルがあり、10が最高です。PR値が高いほど、検索ランキングにおいてウェブページの重要度が高いことを示します。つまり、他の条件が同じであれば、PR値の高いウェブサイトはGoogle検索結果で優先されます。PageRankは、Googleのすべてのウェブ検索ツールの基礎となっています。
1. Googleのウェブページレベルの説明
ページランキングは、組織管理ツールとして、インターネット特有の民主的な性質と大規模なリンク構造を活用しています。基本的に、ページAからページBへのリンクが確立されると、GoogleはページAがページBに投票したとみなします。Googleは、ページの重要性を、そのページが受け取った投票数に基づいて評価します。しかし、単に投票数(つまりリンク数)だけを考慮するのではなく、Googleは投票したページを分析します。重要なページからの投票はより大きな重みを持ち、他のページの重要度を高めることに貢献します。
重要で質の高いウェブページは、ページランキングが高くなります。Googleは検索結果のランキング付けにおいて、各ウェブページのランキングを考慮します。もちろん、ページランキングが高くても、ユーザーの検索クエリに合致していなければ意味がありません。そのため、Googleはページランキングと高度なテキストマッチング技術を組み合わせることで、ユーザーにとって最も重要で有用なウェブページを見つけ出します。
Googleは、ウェブページにおけるキーワードの出現回数だけに注目しているわけではありません。ウェブページのコンテンツ(およびリンク先のコンテンツ)を包括的に評価し、そのウェブページがユーザーの検索クエリの要件を満たしているかどうかを判断します。
2. PR値アルゴリズムの原理
PR 値アルゴリズムは、一般的に次の 2 つの前提に基づいています。
a) 複数回引用されているウェブページは重要である可能性が高い。複数回引用されていないウェブページであっても、重要なウェブページから引用されている場合は重要である可能性がある。ウェブページの重要性は、引用先のウェブページ間で均等に分散される。このような重要なウェブページは、権威あるウェブページと呼ばれる。
b) ユーザーが最初に Web ページ セットからランダムに 1 つの Web ページにアクセスし、その後 Web ページ上のリンクをたどって戻ることなく前方に閲覧すると仮定すると、次の Web ページを閲覧する確率は、閲覧中の Web ページの PageRank 値になります。
PR 値に影響を与える要因は次のとおりです。
PageRank(PR)は0から10までの11段階の数値で表され、Googleツールバーに緑色の水平バーとして表示されます。レベル0は白色で表示されます。これはウェブサイト全体ではなく、個々のウェブページに適用されます。そのため、ウェブサイトのホームページと内部ページでは、PR値が大きく異なることがよくあります。PRアルゴリズムに基づくと、ウェブサイト(ホームページ)のPR値に影響を与える主な要因は以下のとおりです。
1. ウェブサイトへのインバウンドリンクの品質。(a) 上記の高品質なインバウンドリンクの分析に基づくと、高い PR 値を得るためには、他のウェブサイトからリンクを獲得すること、(b) 検索エンジンのディレクトリに追加されること、(c) すでにディレクトリに追加されているウェブサイトとリンクを交換すること、(d) ユーザーのトピックに関連または補完する PR 値が 4 以上のウェブサイトからリンクを獲得すること、(e) ユーザーのリンクが、トラフィック量が多く、視認性が高く、頻繁に更新される重要なウェブサイト (ニュースソースなど) に表示されること、(f) ユーザーとリンクを交換するウェブサイトのアウトバウンドリンクが少ないこと、(g) 高品質のコンテンツを持つウェブサイトとリンクすること (PR 値の増加の可能性が大きい) が必要です。
2. 発信リンクの数。PageRank(PR)の計算原理によれば、「ウェブページの重要性は、参照先のウェブページに均等に分配される」ため、逆に、ページ上の発信リンクが多すぎるとPRの価値が損なわれる可能性があります。しかし、コンテンツの観点から見ると、トピックに関連する適切な数の発信リンクは、検索エンジンに良い印象を与えます。したがって、ページ、特にホームページへの発信リンクの数は、PRの価値とキーワードの内容のバランスをとる必要があり、理想的には10を超えないようにする必要があります。
3. 検索エンジンにインデックスされているウェブサイトのページ数。SEOについて議論する際、コアキーワードのランキングやホームページのパフォーマンスに重点が置かれすぎて、重要な要素である検索エンジンにインデックスされているページ数を見落としがちです。この後者の側面はSEOにおいて非常に重要です。コアキーワードで低いランキングのウェブサイトでも、ユーザーが他のキーワードで検索した際に、内部ページが上位3位以内にランクインすることがあります。これは、そのウェブサイトのページが大量にクロールされているというだけの理由です。ユーザーは検索に様々なキーワードを使用するため、これはウェブサイトのトラフィックの大幅な増加につながることがよくあります。
インデックス登録されたページ数はトラフィックに直接影響するため、PageRank(PR)にも大きな影響を与えます。インデックス登録されたページ数が多いほど、ホームページのPR値は高くなります。ただし、ここで言及されている数値は、ウェブサイト全体のページ数に対するインデックス登録されたページ数の割合であり、インデックス登録されたページの絶対数ではないことを強調しておくことが重要です。現在、各検索エンジンにとって最適な割合に関するデータは存在しません。
4. ホームページのPageRank(PR)。PRはウェブサイト全体ではなく個々のウェブページに対して定義されますが、各ウェブページは特定のウェブサイトに依存しており、ホームページはプロモーションの中核となるページであるため、そのPRは他の内部ページのPRに直接影響を及ぼします。一般的に、ウェブサイト内のページのPR値は、ホームページ > 第1階層ページ > 第2階層ページ > 第3階層ページ…という傾向を示します。階層が深くなるにつれて、PRは1~2段階ずつ低下します。より深い階層では、PRの範囲内に収まらない場合もあります。もちろん、深い内部ページに多くの外部リンクや内部リンクがある場合は、状況は異なります。
5. ファイル形式。Googleは、pdf、asp、jsp、html、shtml、xml、cfin、doc、xls、ppt、rtf、wks、lwp、wri、swfなどのウェブページとファイル形式をインデックスできます。PDFファイルは、ウェブサイト上で最も重要なコンテンツや記事であることが多いため、GoogleはPDFファイルにデフォルトでPageRank3を割り当てています。これは、通常のHTMLファイルよりも高い値です。同様に、XML、PSP、Woid、PowerPoint、Excelファイルには、通常のウェブページファイルよりも高いPageRankが割り当てられています。そのため、価値の高いウェブサイトコンテンツにはPDFファイルを作成することが推奨されます。
6. PageRankの更新。Googleは毎月、完全なデータ更新(Google Dance)を実施しています。更新後、ウェブサイトのランキングと被リンクは変化しますが、PageRankの更新時期は通常、Google Danceの約3か月後まで延期されます。また、ウェブサイトのPageRankは比較的安定しており、1ランク上がったり下がったりすることは非常に困難です。
7. PageRank(PR)の役割。ウェブページのランキングはリンクに直接影響され、リンクはSEOの一側面に過ぎないため、高いPR値はSEOの影響の一部しか反映しません。ウェブページのPR値が高いということは、次のことを示しているに過ぎません。a) そのウェブページは比較的重要であり、ランキングの優先順位は高いものの、高いランキングに直接結びつくわけではありません。b) 高品質なインバウンドリンクを獲得する上で交渉上の優位性があります。c) 検索エンジンがウェブページのデータをより迅速に更新します。d) 見た目が良いということです。
PR値の高いウェブサイトは、ランキングや交渉力において優位性があるため、実際に高いランキングを獲得することがよくあります。業界関係者の多くは、PRとSEOを単純に同一視していますが、これは誤りであるだけでなく、SEOの実施にも悪影響を及ぼします。PR値の低いウェブサイトでも良好なランキングを獲得できる一方で、PR値の高いウェブサイトが必ずしも理想的なランキングを保証するわけではありません。さらに、このような考え方にとらわれ、リンク効果のみを追求する傾向があり、コンテンツ、構造、キーワードの分析と改善が軽視されています。後者は、ユーザーと検索エンジンが長期的に重視するべきものです。デジタルマーケターは、PR価値はSEOを含む検索エンジンマーケティングの自然な結果であるべきであり、目標として追求すべきではないと考えています。
主要検索エンジンは、検索エンジン最適化(SEO)に対して様々な姿勢を示しており、沈黙を守っているものもあれば、公然と支持しているものもあります。正当なSEO対策は、検索エンジンにより正確なウェブサイトインデックスを提供するため、推奨されるべきです。SEOにおける不正行為は、すべての主要検索エンジンで一律に拒否され、様々なペナルティが課せられます。検索エンジンのランキングにおける不正行為を完全に排除することは不可能であり、成功する検索エンジンはスパムページのインデックスを避けるよう努めなければなりません。そのためには、ドメイン分析やページコンテンツの抽出から、ウェブサイトの過去の行動やページの最新のステータスまで、あらゆる点を精査する必要があります。主要検索エンジンの不正行為対策は、まだ始まったばかりであることは間違いありません。
-終わり-
前の記事 変革の重要性について
次の記事 SEOチュートリアル:ディスクリプションタグの書き方基準の徹底解説