WOPAN

検索エンジンの秘密を10分で解き明かす:SEOの4つのポイント


検索エンジン最適化(SEO)という言葉は、多くの人にとって馴染みのある言葉であると同時に、馴染みのない言葉でもあるでしょう。SEOは、私たちが初めて耳にしたデジタルマーケティングの概念の一つです。ホテルのマーケティング部門やデジタルマーケティングマネージャーは、本社から毎月または四半期ごとにSEOレポートを受け取ることがよくあります。では、なぜ「馴染みのない」言葉なのでしょうか?


業界に入ってから、ホテルマーケティングやデジタルマーケティングのマネージャーの多くはSEOの概念や用語をある程度理解しているものの、検索エンジンの仕組み、日々目にするSEOレポートの解釈方法、問題点の特定方法、最適化の方法などについては多くの盲点を抱えていることに気づきました。彼らは、自社のホテルの状況に合わせたSEO戦略の策定方法については、さらに無知です。


本日より、SEOに関する知識ポイントを整理するためのシリーズ記事を執筆いたします。このシリーズをお読みいただくことで、皆様がインスピレーションを得て、勤務先のホテルにより良いサービスを提供できるようになることを願っています。


最初の記事として、まずは基本的な概念を理解することから始めましょう。次のような疑問について考えたことはありますか?


  • SEOとは何でしょうか?どのように定義するのでしょうか?

  • なぜ SEO を行うのですか?

  • モバイルインターネット時代でも SEO は必要ですか?

  • 検索エンジンはどのように機能するのでしょうか?「入力して検索」というシンプルな手順の後、検索エンジンはどのようにして膨大なデータの中から必要なコンテンツを見つけ出し、私たちに提示するのでしょうか?

 

これらの質問を念頭に置いて、今日の知識を一緒に学んでいきましょう。



知識ポイント1:SEOとは何か?どのように定義するのでしょうか?


SEO は「Search Engine Optimization(検索エンジン最適化)」の略です。


  • 簡単に言えば、SEO とはオーガニック検索結果からウェブサイトのトラフィックを獲得する手段とプロセスです。

  • より正確に定義すると、SEO とは「検索エンジンの自然なランキングメカニズムを理解した上で、ウェブサイトの内部および外部の調整と最適化を行い、検索エンジンにおけるウェブサイトの自然なキーワードランキングを向上させ、トラフィックの獲得に努め、ウェブサイトの売上やブランドの露出を促進するプロセス」です。



知識ポイント 2: なぜ SEO を行うのか?


ウェブサイトの所有者は皆、ウェブサイトへのトラフィックを最大化したいと考えています。ウェブサイトの収益モデルや目標に関わらず、訪問者の存在は必須条件です。SEOはウェブサイトへの訪問者を増やすための最良の方法です。SEOの「メリット」を見ていきましょう。


  • 低コスト: 経費はかかる場合もありますが、全体的なコストは比較的低くなります。

  • 高いリターン: SEO からのユーザーのほとんどはホテルを「積極的に検索」しているため、ターゲティングが非常に正確になります。

  • ポータブル:検索エンジンは、ユーザーが商品を検索、比較、購入するための重要なチャネルです。モバイルインターネットが急速に発展した今でも、SEOの中核は変わりません。ただ、媒体が変わっただけです。

  • 持続的なパフォーマンス:ターゲティング広告や有料検索といったプロモーション手法は、キャンペーンが終了するとトラフィックが急激に減少します。オンラインイベントなどのイベントマーケティングキャンペーンは大きな成果を上げますが、盛り上がりが冷めるとすぐにトラフィックが減少します。一方、検索順位は一度高い順位に上がれば、比較的長期間安定して維持できるため、継続的なトラフィックの流れを確保できます。

  • スケーラビリティ: キーワード調査とコンテンツ拡張手法を習得することで、ターゲットキーワードとウェブサイトへのトラフィックを継続的に増やすことができます。



知識ポイント 3: モバイル インターネット時代でも SEO は必要ですか?


SEO がまだ効果的かどうかを確認するために、業界調査データを見てみましょう。


  • 2017 年上半期には、インスタント メッセージング、検索エンジン、オンライン ニュースなどの基本的なインターネット アプリケーションのユーザー ベースは安定傾向にあり、検索エンジン アプリケーションはモバイル採用の傾向を維持し続けました。

  • インスタント メッセージングは​​、モバイル インターネット トラフィックの中心的なエントリ ポイントとしての地位を確立しており、さまざまなアプリケーションで新規インターネット ユーザーの間での普及率で第 1 位にランクされ、第 2 位の検索エンジンを 16.9 パーセント ポイント上回っていますが、検索エンジンは現在もしっかりと第 2 位を維持しています。

  • 2017年6月現在、中国の検索エンジン利用者数は6億900万人に達し、利用率は81.1%です。これは2016年末と比較して707万人増加し、成長率は1.2%です。

 

データは「2017年中国インターネット発展統計報告書」より引用しています。

    

知識ポイント 4: 検索エンジンはどのように機能するのか?


数兆もの情報に直面しながら、検索エンジンはどのようにして1秒、あるいはそれ以下で私たちが求めるコンテンツを返すのでしょうか?この疑問に答えるには、検索エンジンの動作原理を分解する必要があります。それは大きく分けて3つの段階に分けられます。


  • クロールとフェッチ: 検索エンジン プログラムは Web ページにアクセスし、ページの HTML コードを取得して、データベースに保存します。

  • 前処理: プログラムは、データベース Web ページに対して一連のプロセスを実行し、ランキング プログラムで使用できるように準備します。

  • ランキング: ユーザーがキーワードを入力すると、プログラムは前処理済みのデータを呼び出し、関連性を計算し、結果を生成します。


まずは最初の段階である「這ってつかまる」について見てみましょう。


検索エンジンの主な役割は、インターネット上のウェブページからデータを収集することです。このデータ収集に使用されるツールは、よく「スパイダー」と呼ばれるものです。これは、検索エンジンがウェブページをクロールしてアクセスするために使用するプログラムです。スパイダーがページへのアクセスリクエストを送信すると、サーバーはHTMLコードを返し、スパイダーはそれをデータベースに保存します。スパイダーはリンクをたどり、ページ上のリンクから次のリンクへとクロール(読み取り)するため、「スパイダー」と呼ばれます。

 


データ収集プロセスにおいて、効率性を向上させ、ウェブページデータの重複読み取りを回避するため、インテリジェントスパイダーは検索エンジンを使用してアドレスデータベースを構築し、「既読」ページと「発見したが未読」ページを記録します。また、読み取ったページデータを保存するために、生のページデータベースを構築します。


読み取りが完了し、元のデータベースが構築されると、検索エンジンは第2段階である「前処理」に進みます。「前処理」とは何でしょうか?元のデータベースには数兆ものウェブページデータが含まれています。ランキングプログラムは、これほど膨大な量のデータを常に分析することは不可能であり、1~2秒以内に検索結果を返すことはできません。そのため、最終的なランキングプログラムに反映させるには、このデータを処理する必要があります。


前処理の最初のステップは、データをフィルタリングし、不要な情報を削除してテキストを抽出することです。現在、検索エンジンは依然としてテキストコンテンツに基づいてデータを取得しています。Webページに表示されるテキストに加えて、データベース内のページデータには、HTMLタグ、JavaScript、その他ランキングに使用できないコンテンツも含まれています。プログラムはこれらの不要な情報を削除し、ランキングに使用できるコンテンツを抽出する必要があります。テキストに加えて、メタタグ内のテキスト、画像の代替テキスト、Flashファイルの代替テキスト、リンクのアンカーテキストなど、テキスト情報を含む特殊なコードも抽出します。

 


次に、あまり知られていない事実をご紹介しましょう。中国語検索エンジン特有のステップ、「中国語単語分割」です。「単語」は、データ処理とユーザークエリの単位であり、基盤となります。英語とは異なり、検索エンジンは次のステップに進む前に、ユーザーが検索している中国語コンテンツ内のどの文字が単語を構成しているかを区別する必要があります。


単語分割の後、プログラムは「ストップワード」の削除という別のステップを実行する必要があります。どの言語にも、頻繁に出現するもののコンテンツへの影響が小さい単語が存在します。例えば、中国語では「的」(de)、「啊」(a)、「却」(que)、英語では「the」、「a」、「and」、「to」、「of」などが挙げられます。これらは「ストップワード」と呼ばれ、プログラムは検索結果をより目立たせ、計算オーバーヘッドを削減するためにこれらの単語を削除します。


さらに、プログラムは著作権表示やナビゲーション バーのテキストなどの無関係なコンテンツを削除してノイズを除去します。


次に、プログラムはウェブページのデータの重複を排除します。同じコンテンツが複数のウェブサイトに繰り返し公開されている場合があります。ユーザーに複数の重複コンテンツが返されることを避けるため、事前に重複コンテンツを削除する必要があります。


上記の処理が完了すると、プログラムは「ユニークで、トピックを反映した、単語ベース」のコンテンツを取得し、それを前方インデックスでインデックスします。キーワードを抽出することで、コンテンツは「キーワード別」のコレクションに変換され、キーワードの出現頻度、フォーマット(太字、太字アンカーテキスト)、位置(見出し、段落開始、段落終了)などの属性が記録されます。そして、以下の構造に変換され、データベースに保存されます。



順方向インデックスでインデックス付けされたデータは、同じキーワードが複数のファイルに出現する可能性があるため、直接ランキング付けすることはできません。そこで、賢明なプログラマーたちは、ファイルを転置インデックスに再構築する転置インデックスを発明しました。



検索エンジンはいつでもユーザーの検索リクエストを処理できる状態になったので、次のステップは検索エンジンのタスクの 3 番目の段階であるランキングです。


検索エンジンは、ユーザーの検索クエリを受け取ると、次のように処理します。


  • 単語の分割(前処理に似ており、検索コンテンツを「単語」に基づいて組み合わせに分割します)。

  • ストップワードを削除します(前処理と同様に、無関係な単語を削除します)。

  • コマンド処理 (デフォルトでは、検索エンジンはキーワード間で「AND」ロジックを使用します)。

  • スペル修正 (プログラムが誤りであると検出した内容を修正します)。


上記の処理とマッチングの後、プログラムは転置インデックスデータベース内で検索キーワードに一致するファイルセットを検索します。例えば、検索コンテンツに「keyword1」と「keyword2」が含まれている場合、ランキングプログラムはこれらの2つのキーワードを含むファイル、つまり「file2」と「file3」のみを検索すれば済みます。



数千万ものファイルが一致したら、検索エンジンはそれらをすべてランク付けするのだろうか?と疑問に思うかもしれません。答えはノーです。膨大なデータ量のため、検索エンジンプログラムは膨大な量のデータを処理しません。最も重要なページのみをランク付けします。さらに、ユーザーは通常、検索結果の最初の2ページしか閲覧しないため、検索エンジンはすべてのデータをランク付けする手間をかける必要はありません。では、検索エンジンはどのようにして「最も重要なページ」をランク付けするのでしょうか?ここで登場するのが、関連性計算というアルゴリズムです。このアルゴリズムは、ページのデータとユーザーの検索クエリの関連性を計算し、ランク付けを決定します。


この時点で、検索エンジンはユーザーの「検索リクエスト」を実質的に完了しています。しかし、80/20ルールによれば、検索結果の約20%が全体の検索の約80%を占めています。検索エンジンは、頻繁に使用されるキーワードのランキングとデータをキャッシュしています。ユーザーが検索を行う際、検索エンジンはキャッシュされたデータに直接アクセスすることで、大規模でエネルギーを消費する一連の処理を削減し、応答時間を短縮し、ユーザーエクスペリエンスを向上させます。



著者: ケビン

出典: ホテルマーケティング (ID: ホテルマーケティング6)

この記事は、Bird Brother Notesの著者の許可を得て掲載されています。転載をご希望の場合は、著者にご連絡の上、出典を明記してください。



おすすめの関連記事:


企業はSEMとSEOのどちらを選択すべきでしょうか?この記事を読めばきっと分かります!

SEO最適化:ロングテールキーワードを見つけるには?8つの方法

SEOランキングに影響を与える17の主要要素を独占公開