Entitaeten

Noch zu Anfang dieses Jahrhunderts war die Suche im Internet ziemlich einfach. Man gab ein Suchwort bei Yahoo oder Altavista ein und die Suchmaschine zeigte alle Dokumente an, die dieses Suchwort enthielten. Mit dem Wachstum des Internets und der online zur Verfügung stehenden Information wurde die Suche im Netz jedoch immer mühsamer. Dann kam Google mit einem neuen Ansatz: Googles Suchalgorithmus stellte nun die Ergebnisse in einer nach Relevanz geordneten Reihenfolge dar. Die Ergebnisse, die die meisten Keywords enthielten, standen vorne und wurden dem Nutzer vorrangig angezeigt. Im Nachgang entstand eine ganze Industrie, die sich daran machte, Googles Suchalgorithmus und seine Veränderungen zu verstehen und zu beeinflussen.

Heutzutage ist das Keyword immer noch eine wichtige Komponente der Suche. Aber Google hat über die Jahre die Suche verändert – weg von der rein auf Keywords zentrierten Suche und hin zum Verständnis des Suchbegriffs selbst. Der Suchmaschinenriese reagiert damit auf das Nutzerbedürfnis, Antworten auf Fragen zu bekommen, anstatt darüber nachzudenken, wie die Anfrage richtig formuliert werden muss. Google arbeitet daran, dass der Suchalgorithmus die Beziehungen zwischen Suchbegriffen und dem größeren Kontext besser versteht.

Google entwickelt die semantische Suche

Ein erstes Anzeichen dafür lieferte Google 2012 mit der Vorstellung des Google Knowledge Graph. Ein Knowledge Graph ist eine Wissensdatenbank, in der Informationen so aufbereitet und strukturiert sind, dass daraus neues Wissen entsteht. Die einzelnen Informationsbausteine werden eingeordnet, bewertet und in Beziehungen zueinander gestellt. Daraus wiederum entsteht ein größerer thematischer Kontext, in dem die Bausteine ihren Platz einnehmen.

Damit begann der Wechsel zur semantischen Suche. Hinter den meisten Suchanfragen steht ja ein eindeutig zu identifizierender Gegenstand, eine Entität, keine Zeichenkette. 2012 zeigte sich das aber in den Suchergebnissen noch nicht sehr deutlich. Aber das sollte sich schon im folgenden Jahr ändern.

Was sich mit dem Hummingbird-Algorithmus verändert hat

2013 ging Google mit Hummingbird den nächsten Schritt auf dem Weg zur semantischen Suche. Die Entitäten zogen graduell in Googles Suchergebnisse ein. Vorher waren die Algorithmen auf die Häufung von Keywords in Dokumenten ausgerichtet. Allerdings kamen immer mehr weitere Rankingfaktoren hinzu, um ein Dokument oder eine Website korrekt einzustufen. Bis in die 2010er-Jahre blieb diese Fixierung bestehen. Das änderte sich, als Google den Hummingbird-Algorithmus ausspielte. Nun wurde die Semantik wichtiger als die Dichte der Keywords oder deren Vorhandensein im Seitentitel, in Überschriften und der Meta-Description eines Dokuments. Die Suchmaschine schaute sich jetzt auch die Semantik von Texten an, die wichtiger wurde als die reine Keyworddichte.

Zu diesem Wandel tragen auch Tendenzen wie das sogenannte „Linkless Ranking“ bei, also das Ranking von Websites ohne eingehende Backlinks. Mittlerweile können Websites auch dann im Ranking gut abschneiden, wenn das betreffende Keyword überhaupt nicht vertreten ist. Diese semantische Suche erfordert nun, dass SEO sich auch um die Optimierung und Etablierung von Entitäten kümmern muss.

Was ist eine Entität?

Die meisten Menschen werden diesen Begriff eher aus der Philosophie kennen. Hier bezeichnet er entweder etwas, das existiert, also einen abstrakten oder konkreten Gegenstand. Oder er bezeichnet das Wesen eines Gegenstandes. Gebräuchlich ist meist die erste Variante.

In der Informatik ist eine Entität ein eindeutig bestimmbarer Gegenstand. Entitäten können Personen, Bauwerke, ein Zustand oder Unternehmen sein. Sie lassen sich durch Eigenschaften wie Farbe, Geburtsdatum, Größe, Temperatur und andere einordnen. Entitäten könnten auch als eine Art Oberbegriff definiert werden, der sich aus eindeutig zuzuordnenden Einzelaspekten ableitet. Aus Typisierungen, also dem Erkennen gleicher Attribute oder Merkmale einer Reihe von Entitäten, lassen sich Entitätstypen und Entitätsklassen ableiten. Aus mehreren Personen können zum Beispiel durch ein gemeinsames Merkmal Kunden bzw. Mitglieder eines Chors oder einer Berufsgruppe werden. Hier einige Beispiele für Entitäten:

  • Städte: Die Entität „Stadt“ beinhaltet semantisch passende Begriffe zu einer bestimmten Stadt. So würde Köln mit dem Karneval, dem Kölner Dom und dem Rhein konnotiert, die Stadt München mit dem Oktoberfest, BMW, dem Marienplatz oder dem Deutschen Museum.

  • Kochrezepte: Damit Google versteht, dass es sich um die Entität „Kochrezept“ handelt, bräuchte die Suchmaschine allgemeine Inhalte wie etwa Zutaten. Ein einzelnes, konkretes Rezept wie „Hamburger Pannfisch“ müsste durch weitere Begriffe definiert werden, also einzelne Zutaten oder Ausdrücke wie „Mittagessen“.

Was ist ein Knowledge Graph?

Beispiel für Knowledge Graph zeigt Informationen über Menschenaffen, Quelle: Google

Beispiel für Knowledge Graph, Quelle: Google

Ein Knowledge Graph repräsentiert Datenstrukturen, mit denen Entitäten gespeichert und verwaltet werden. Entitäten brauchen nicht notwendigerweise in Graphen gespeichert zu werden. Man kann auch Tabellen, Listen oder Datenbanken verwenden. Der Vorteil eines Knowledge Graph besteht darin, dass sich mit ihm Entitäten mit ihren Bestandteilen perfekt darstellen lassen. Im Google Knowledge Graph sind Entitäten die Knoten, die über Kanten aufeinander bezogen sind. Die Kanten beschreiben die Art der Beziehungen zwischen den einzelnen Entitäten. Außerdem klassifiziert der Knowledge Graph die Google Entitäten nach Entitätstypen.

Allerdings ist ein Knowledge Graph keine statische Darstellung. Er kann jederzeit verändert und erweitert werden. Die bekanntesten neben dem Google Knowledge Graph sind Microsofts Satori Knowledge Graph, der Difbot Knowledge Graph, Microsoft Academic oder der LinkedIn Knowledge Graph, der Mitglieder, Jobs und Unternehmen enthält. Auch für den Sprachassistenten Siri gibt es einen eigenen Knowledge Graph. Im Prinzip kann jeder und jedes Unternehmen mit den entsprechenden Ressourcen einen eigenen Knowledge Graph aufbauen.

Googles Knowledge Graph basiert auf Freebase als Basis, einer Graphen-Datenbank, die Google 2010 übernahm, als der Suchmaschinenriese Metaweb kaufte. Fünf Jahre später ersetzte Google Freebase durch Wikidata, obwohl die Freebase-Daten weiter genutzt werden. Daneben greift die Suchmaschine auch auf andere Quellen zurück, zum Beispiel:

  • Datensets (Zugriff durch API oder Downloads);

  • Datenbanken (Zugriff durch Crawling);

  • Wikipedia (entweder direktes Crawling oder indirekter Zugriff);

  • Googles eigene Quellen (etwa Google My Business);

  • Facebook-Einträge;

  • Websites mit strukturierten Daten;

  • Websites und Suchanfragen (Zugriff durch Crawling).

Google Entitäten und semantische SEO

Dass Google Entitäten erkennt und sie zum Einordnen und Ranking von Inhalten und Websites nutzt, hat Konsequenzen für die Suchmaschinenoptimierung. Die Inhalte eines Webauftritts müssen in Zukunft also einen ganzen semantischen Raum abdecken. Dadurch kann Google eine Website selbst als Entität anerkennen und ihr bestimmte Eigenschaften und Begriffe zuordnen. Dann können Unterseiten auch für Begriffe im Ranking auftauchen, für die diese Seiten nicht optimiert wurden. Aber die Inhalte sind für einen bestimmten semantischen Raum relevant und werden deswegen von Google erfasst.

Das könnte so funktionieren: Eine Website mit dem Thema „Winterreifen“ könnte auch für „Sommerreifen“ ranken, wenn Googles Suchalgorithmus gelernt hat, dass die Inhalte die Entität „Reifen“ sehr gut beschreiben. Außerdem muss der Algorithmus Nutzersignale und Verlinkungen gefunden haben, die zeigen, dass auf dieser Website hochwertige Inhalte ausgespielt werden.

Der Weg zur eigenen Entität

Der Marketingexperte Arthur Kosch beschreibt, wie er sich eine eigene Google-Entität geschaffen hat. Eine der Datenbanken, auf die Google zugreift, ist ja Wikidata, der Nachfolger von Freebase. Kosch meldete sich also zunächst bei Wikidata an und hinterließ dort einen Eintrag mit den wichtigsten Informationen. Er gab also an, dass er eine Person ist, seinen Namen, seine Staatsangehörigkeit, Geburtsdatum und Geburtsort, seine Berufstätigkeit und seine Heimat im Netz, also seine Website. Beim Namen „Kosch“ musste er wählen zwischen „Kosch als Stadt“ und „Kosch als Familienname“. Das Objekt „Kosch“ war übrigens in Wikidata bereits angelegt worden, sonst hätte er es selbst tun müssen.

Um sicherzugehen, dass Googles Crawler die neue Google-Entität auch erfassen, verlinkte er den Eintrag über seine Website und ließ ihn durch die Google Search Console crawlen. Außerdem fragte er Google mehrmals nach sich selbst ab. Etwa 48 Stunden später spielte ihm Google dann seinen Eintrag bei Wikidata aus.

Allerdings erlebte er dann einen Rückschlag, denn drei Wochen später war der Wikidata-Eintrag gelöscht worden. Kosch wartete ein paar Wochen und legte dann einen neuen Eintrag an, dieses Mal aber mit wesentlich mehr charakteristischen Merkmalen, die Google im Netz verifizieren konnte, etwa Auftritte als Redner oder Links zu Fachbeiträgen in Online-Magazinen.

Außerdem ließ er sich seine Identität von Google selbst bestätigen. Dazu besuchte er Googles spezielle Seite dafür. Er folgte den Anweisungen und wies Google so nach, dass er die Person ist, die er zu sein beansprucht. Nach einer Woche bestätigte Google seinen Eintrag und gab ihm nun die Möglichkeit, seinen Knowledge Graph zu verwalten und Google selbst Änderungen in den Suchergebnissen vorzuschlagen.

Wer sein eigenes Unternehmen als Google-Entität etablieren möchte, kann das im Übrigen auch über Google My Business erledigen.

Newsletter abonnieren

Verpassen Sie keinen Blog-Eintrag mehr!

Abonnieren Sie unseren Blog und halten Sie Ihr Online-Marketing-Wissen aktuell!
Newsletter abonnieren

Mehr zum Thema Google

Erfahren Sie mehr zu der Suchmaschine.

Google Suche

Von Google Discover und Aktivitätskärtchen: mehr über die Google-Suche.

Suchanfrage ohne Klick

Die Hälfte aller Suchanfragen bleibt ohne Klick. Was bedeutet das?

Entitäten: Woher die Suchmaschine weiß, was der Nutzer wissen will
Beitrag bewerten