Semalt:Googleナレッジグラフとその仕組みを理解する



Googleがお客様のWebコンテンツを理解しやすくするために、ナレッジグラフのトピックに影響を与える方法を理解することが重要です。 セマルト は、クライアントに最高のサービスを提供することを目的としたWebサイトです。つまり、SEO関連のすべてを理解することを意味します。ウェブデザインとウェブ開発の両方に焦点を当てている会社として、私たちはウェブサイトのあらゆる側面にSEOを取り入れています。もちろん、これにはGoogleナレッジグラフの理解も含まれていました。

知識グラフが特別な理由は何ですか?

ナレッジグラフがなければ、検索エンジン、特にGoogleがエンティティに構造化データを使用することは困難です。マークアップとセマンティックデータは、アイデアと概念を結び付けるのに役立ち、Googleのナレッジグラフに入力したり影響を与えたりするために使用できる構造化データにそれらを簡単に変換できるようにします。

SEOの専門家として、グラフ内のこれらのトピックに影響を与える方法を理解することは私たちの義務です。そのため、Googleのコンテンツの理解に意味のある変化をもたらすことができます。

SEOの専門家として、グラフ内のトピックに影響を与えて、クライアントのコンテンツに対するGoogleの理解に意味のある変化をもたらす方法を理解しています。

Googleナレッジグラフとは何ですか?

知識グラフは、データベースと百科事典の共通部分であると考えています。開発者は、ナレッジグラフの各記事を、Googleの顧客向け記事のエンティティまたはトピックと呼びます。

エンティティは、絶対に何でもかまいません。ほとんどのデータベースと同様に、一意の識別子があり、GoogleのURLに表示されることがあります。 [kgmid=/ g/11f0vfyswk&hl]のようになりますが、パラメータ名「kgmid」はエンティティタイプによって変わる可能性があります。

通常、エンティティに関する複数のステートメントがあります。
  • タイトルまたは名前(「GeorgeBush」など)。
  • 1つまたは複数のタイプ(「人」など)。
  • 説明(「かつては米国大統領だった」など)。
  • 画像のURLのリスト(通常は使用権に関連付けられています)。
  • 詳細な説明(ソースのURLを含む説明テキスト)。
ただし、Googleは、上記のリストの情報は検索APIで直接利用できる可能性があると述べていますが、このデータは内部で大幅に拡張されています。

したがって、上記の例では、データにはブッシュが生まれて死んだ日付も含まれている可能性があります。それは彼がバーバラブッシュと結婚したことを含むかもしれません。それはオフィスなどでの彼の業績のいくつかに言及するかもしれません。

提供されたすべての情報により、百科事典の記事と比較して、どのように大きな違いがないかがわかりやすくなります。ただし、違いは、すべての事実が「在職年数」などのフィールドに分類されているため、マシンではトピック間の点を簡単に結び付けることができるということです。また、機械は、人が要求を行ったときに、ほぼ瞬時に適切な情報を取得する方が簡単です。たとえば、ジョージ・ブッシュと結婚した人を検索するとしますか?あなたはこれを見るはずです:


曖昧さの解消

世界中に多くの知識グラフがあり、Googleの知識グラフはこれらの多くのグラフの1つにすぎません。その他の知識グラフには、Wikidata.org、dbpedia.comなどがあります。実際、半構造化された任意の形式のデータは知識グラフとして説明できます。そのため、IMDBや百科事典などのデータベースは知識グラフと呼ばれます。

当初、Googleは、CIAファクトブックやウィキペディアなどの他のデータセットから知識グラフを作成しました。また、Googleのナレッジパネルがナレッジグラフとしても機能するという噂も耳にしました。ただし、これは正しくないため、無視する必要があります。ナレッジパネルはグラフ内のデータのサブセットを表す場合がありますが、それらは同じものではありません。

ナレッジパネルは、Googleのナレッジグラフを介して接続されたデータ項目の視覚的表現としても機能します。ただし、Googleのナレッジグラフは、トピックに関する視覚的な記録ではありません。

曖昧さを解消しようとする最後のポイントは、用語自体です。一般に、キーワード知識グラフはエンティティまたはトピックで構成されます。わかりやすくするために、Googleは「トピック」という用語を使用することを好むことに気づきました。これは、公開ドキュメントで常に使用されている用語であるためです。

トピックはよりユーザーフレンドリーになる傾向がありますが、Googleがトピックまたはエンティティを参照するときを理解することも困難になりました。

エンティティトピックタイプ

通常、エンティティにはトピックタイプが与えられます。これは人かもしれません。イベント;組織、場所、または国。エンティティがこれらのいずれでもない場合、「モノ」としてラベル付けされます。うまくいけば、Googleは新しいエントリタイプを開発し続け、「Things」の使用頻度を減らします。 Googleが使用するNaturalLanguage Processing APIは、多くのトピックタイプが実際に使用されているかどうかを疑問視する重要な手がかりを提供します。ただし、Googleのナレッジグラフ検索API開発者ページには他にもいくつかのエンティティタイプがあります。現在、Googleはリストされている数のエンティティを分類できないようです。これが時間の経過とともに変化することを願っています。

さらに、公募と比較した場合、Googleが使用する自然言語処理アルゴリズムによって認識されるエンティティは約20%にすぎません。

知識グラフの利点

世界の情報をトピックに整理することで、検索エンジンが活用するWebページやWebサイトのクロールとインデックス作成が容易になります。これらには、多様性、規模、完全性、および速度が含まれます。

スケーリングのメリット

インターネット上のウェブページの数は非常に議論の余地のある主題です。数え切れないほどあると主張する人もいるかもしれませんが、Webページの数はおそらく数兆にのぼり、この数は毎日膨大な速度で拡大し続けています。対照的に、私たち人間が理解しているトピックの数は大幅に少なく、その数ははるかに低い速度で増加しています。

これは、インターネット上で見つけた複数のコンテンツで共有されている同じアイデアが過度に重複していることを示しています。半構造化システムを使用してトピックの詳細をソートすることにより、インターネットに含まれる情報はより小さなスペースを占めることができ、それほど複製されることはありません。

異なるデータソースを持つことの利点

トピックに関する情報を保存することで、複数のデータソースを引用することがはるかに簡単になり、ユーザーを同じWebページに何度も送信する必要がなくなります。これは、Googleがトピックに関する重要な詳細を収集し、画面または他のいくつかのメディアを使用して表示することができ、実際に表示することを示していますが、ユーザーのクエリまたはユーザーに対して改善された方法で表示されます。

理論的には、トピックに関する情報は、インターネット以外のソースから取得される場合があります。

情報の整合性のメリット

Googleナレッジグラフにはエラーや事実の誤りが含まれていることが知られていますが、悪意のある人物やSEOの専門家によって操作されることもあります。ただし、このアプローチには、Googleに信頼できる唯一の情報源を提供するという利点があります。ただし、これは物議を醸すトピックには当てはまらない場合があります。

トピックに関する新しい事実は、Googleのナレッジグラフに追加する前に、いくつかの検証プロセスを通過する必要があります。しかし、Googleがこれらのしきい値について公然と議論する可能性は低いです。

マイナス面として、信頼できる唯一の情報源は、データソース自体がすでに成人化されている場合、情報の多様性にバイアスをかけたり、減らしたりする傾向があります。

情報検索のメリット

トピックごとに情報を分類したおかげで、Googleと、大量のWebページで情報の針を検索している可能性のあるユーザーの両方が情報を取得する速度が大幅に向上しました。

Googleのナレッジグラフはどこで使用されていますか?

多くのAndroidおよびスマートフォンユーザーにとって、ナレッジグラフは主にホーム画面の「検出」機能に使用されます。 Googleは、ユーザーの行動に関する情報を使用して、どのトピックがあなたにとって最も重要であるかを理解し、ユーザーが使用履歴に基づいてそれらの関連トピックを見つけるのを支援します。

Googleトレンドは、ユーザーが興味深いトピックを見つけることができるもう1つの場所でもあります。その時点から、Googleはどのトピックが互いに密接に関連しているかを示すことができます。ただし、現在の証拠によると、このデータは現在、同じユーザーによる他の検索をプルすることによって収集されており、予期しない関連トピックがポップアップする可能性があります。

パネルと同様に、ユーザーが知識グラフを使用して回答できる検索クエリを入力すると、最高品質の検索結果も得られます。多くの場合、これらの結果はコア検索結果を覆い隠し、最終的にWebサイトの父親へのリンクを押し下げてしまいます。

これらの回答は、Googleが音声検索を使用するユーザーに回答を提供するために使用できる方法でも表示されます。

結論

画像検索ではトピックが目立ちやすいので、関連する場所や人物の写真を使って検索すると、関連する情報を見つけることができます。

これは、ナレッジグラフがWebページ以外の他のデータソースのリポジトリとして使用される方法の優れた例です。

mass gmail