|
検索エンジン最適化(SEO)という言葉は、多くの人にとって馴染みのある言葉であると同時に、馴染みのない言葉でもあるでしょう。SEOは、私たちが初めて耳にしたデジタルマーケティングの概念の一つです。ホテルのマーケティング部門やデジタルマーケティングマネージャーは、本社から毎月または四半期ごとにSEOレポートを受け取ることがよくあります。では、なぜ「馴染みのない」言葉なのでしょうか? 業界に入ってから、ホテルマーケティングやデジタルマーケティングのマネージャーの多くはSEOの概念や用語をある程度理解しているものの、検索エンジンの仕組み、日々目にするSEOレポートの解釈方法、問題点の特定方法、最適化の方法などについては多くの盲点を抱えていることに気づきました。彼らは、自社のホテルの状況に合わせたSEO戦略の策定方法については、さらに無知です。 本日より、SEOに関する知識ポイントを整理するためのシリーズ記事を執筆いたします。このシリーズをお読みいただくことで、皆様がインスピレーションを得て、勤務先のホテルにより良いサービスを提供できるようになることを願っています。 最初の記事として、まずは基本的な概念を理解することから始めましょう。次のような疑問について考えたことはありますか?
これらの質問を念頭に置いて、今日の知識を一緒に学んでいきましょう。 知識ポイント1:SEOとは何か?どのように定義するのでしょうか? SEO は「Search Engine Optimization(検索エンジン最適化)」の略です。
知識ポイント 2: なぜ SEO を行うのか? ウェブサイトの所有者は皆、ウェブサイトへのトラフィックを最大化したいと考えています。ウェブサイトの収益モデルや目標に関わらず、訪問者の存在は必須条件です。SEOはウェブサイトへの訪問者を増やすための最良の方法です。SEOの「メリット」を見ていきましょう。
知識ポイント 3: モバイル インターネット時代でも SEO は必要ですか? SEO がまだ効果的かどうかを確認するために、業界調査データを見てみましょう。
データは「2017年中国インターネット発展統計報告書」より引用しています。
知識ポイント 4: 検索エンジンはどのように機能するのか? 数兆もの情報に直面しながら、検索エンジンはどのようにして1秒、あるいはそれ以下で私たちが求めるコンテンツを返すのでしょうか?この疑問に答えるには、検索エンジンの動作原理を分解する必要があります。それは大きく分けて3つの段階に分けられます。
まずは最初の段階である「這ってつかまる」について見てみましょう。 検索エンジンの主な役割は、インターネット上のウェブページからデータを収集することです。このデータ収集に使用されるツールは、よく「スパイダー」と呼ばれるものです。これは、検索エンジンがウェブページをクロールしてアクセスするために使用するプログラムです。スパイダーがページへのアクセスリクエストを送信すると、サーバーはHTMLコードを返し、スパイダーはそれをデータベースに保存します。スパイダーはリンクをたどり、ページ上のリンクから次のリンクへとクロール(読み取り)するため、「スパイダー」と呼ばれます。
データ収集プロセスにおいて、効率性を向上させ、ウェブページデータの重複読み取りを回避するため、インテリジェントスパイダーは検索エンジンを使用してアドレスデータベースを構築し、「既読」ページと「発見したが未読」ページを記録します。また、読み取ったページデータを保存するために、生のページデータベースを構築します。 読み取りが完了し、元のデータベースが構築されると、検索エンジンは第2段階である「前処理」に進みます。「前処理」とは何でしょうか?元のデータベースには数兆ものウェブページデータが含まれています。ランキングプログラムは、これほど膨大な量のデータを常に分析することは不可能であり、1~2秒以内に検索結果を返すことはできません。そのため、最終的なランキングプログラムに反映させるには、このデータを処理する必要があります。 前処理の最初のステップは、データをフィルタリングし、不要な情報を削除してテキストを抽出することです。現在、検索エンジンは依然としてテキストコンテンツに基づいてデータを取得しています。Webページに表示されるテキストに加えて、データベース内のページデータには、HTMLタグ、JavaScript、その他ランキングに使用できないコンテンツも含まれています。プログラムはこれらの不要な情報を削除し、ランキングに使用できるコンテンツを抽出する必要があります。テキストに加えて、メタタグ内のテキスト、画像の代替テキスト、Flashファイルの代替テキスト、リンクのアンカーテキストなど、テキスト情報を含む特殊なコードも抽出します。
次に、あまり知られていない事実をご紹介しましょう。中国語検索エンジン特有のステップ、「中国語単語分割」です。「単語」は、データ処理とユーザークエリの単位であり、基盤となります。英語とは異なり、検索エンジンは次のステップに進む前に、ユーザーが検索している中国語コンテンツ内のどの文字が単語を構成しているかを区別する必要があります。 単語分割の後、プログラムは「ストップワード」の削除という別のステップを実行する必要があります。どの言語にも、頻繁に出現するもののコンテンツへの影響が小さい単語が存在します。例えば、中国語では「的」(de)、「啊」(a)、「却」(que)、英語では「the」、「a」、「and」、「to」、「of」などが挙げられます。これらは「ストップワード」と呼ばれ、プログラムは検索結果をより目立たせ、計算オーバーヘッドを削減するためにこれらの単語を削除します。 さらに、プログラムは著作権表示やナビゲーション バーのテキストなどの無関係なコンテンツを削除してノイズを除去します。 次に、プログラムはウェブページのデータの重複を排除します。同じコンテンツが複数のウェブサイトに繰り返し公開されている場合があります。ユーザーに複数の重複コンテンツが返されることを避けるため、事前に重複コンテンツを削除する必要があります。 上記の処理が完了すると、プログラムは「ユニークで、トピックを反映した、単語ベース」のコンテンツを取得し、それを前方インデックスでインデックスします。キーワードを抽出することで、コンテンツは「キーワード別」のコレクションに変換され、キーワードの出現頻度、フォーマット(太字、太字アンカーテキスト)、位置(見出し、段落開始、段落終了)などの属性が記録されます。そして、以下の構造に変換され、データベースに保存されます。 順方向インデックスでインデックス付けされたデータは、同じキーワードが複数のファイルに出現する可能性があるため、直接ランキング付けすることはできません。そこで、賢明なプログラマーたちは、ファイルを転置インデックスに再構築する転置インデックスを発明しました。 検索エンジンはいつでもユーザーの検索リクエストを処理できる状態になったので、次のステップは検索エンジンのタスクの 3 番目の段階であるランキングです。 検索エンジンは、ユーザーの検索クエリを受け取ると、次のように処理します。
上記の処理とマッチングの後、プログラムは転置インデックスデータベース内で検索キーワードに一致するファイルセットを検索します。例えば、検索コンテンツに「keyword1」と「keyword2」が含まれている場合、ランキングプログラムはこれらの2つのキーワードを含むファイル、つまり「file2」と「file3」のみを検索すれば済みます。 数千万ものファイルが一致したら、検索エンジンはそれらをすべてランク付けするのだろうか?と疑問に思うかもしれません。答えはノーです。膨大なデータ量のため、検索エンジンプログラムは膨大な量のデータを処理しません。最も重要なページのみをランク付けします。さらに、ユーザーは通常、検索結果の最初の2ページしか閲覧しないため、検索エンジンはすべてのデータをランク付けする手間をかける必要はありません。では、検索エンジンはどのようにして「最も重要なページ」をランク付けするのでしょうか?ここで登場するのが、関連性計算というアルゴリズムです。このアルゴリズムは、ページのデータとユーザーの検索クエリの関連性を計算し、ランク付けを決定します。 この時点で、検索エンジンはユーザーの「検索リクエスト」を実質的に完了しています。しかし、80/20ルールによれば、検索結果の約20%が全体の検索の約80%を占めています。検索エンジンは、頻繁に使用されるキーワードのランキングとデータをキャッシュしています。ユーザーが検索を行う際、検索エンジンはキャッシュされたデータに直接アクセスすることで、大規模でエネルギーを消費する一連の処理を削減し、応答時間を短縮し、ユーザーエクスペリエンスを向上させます。 著者: ケビン 出典: ホテルマーケティング (ID: ホテルマーケティング6) この記事は、Bird Brother Notesの著者の許可を得て掲載されています。転載をご希望の場合は、著者にご連絡の上、出典を明記してください。 おすすめの関連記事: 企業はSEMとSEOのどちらを選択すべきでしょうか?この記事を読めばきっと分かります! SEO最適化:ロングテールキーワードを見つけるには?8つの方法 SEOランキングに影響を与える17の主要要素を独占公開 |