Was ist WDF*IDF?

WDF*IDF ist eine Formel aus der Suchmaschinenoptimierung, die berechnet, wie relevant der eigene Content im Vergleich zu anderen Inhalten zum selben Thema ist. Die Formel bestimmt dabei die ideale Verteilung von Keywords (auch „Terme“ genannt). WDF*IDF ist von der Keyword Density zu unterscheiden, bei der lediglich die Häufigkeit beziehungsweise die Häufigkeitsverteilung von Schlüsselbegriffen bestimmt wird.

Kostenfreie Online Marketing Beratung

Steigern Sie Ihre Reichweite und werden Sie sichtbar für Ihre Kunden!

Definition: Was bedeutet WDF? Was bedeutet IDF?

Die Abkürzung WDF steht für „within document frequency“ und bildet ab, wie häufig beziehungsweise stark gewichtet ein Keyword in einem Textdokument ist.

IDF steht für „inverse document frequency“ und zeigt dagegen die inverse Dokumentenhäufigkeit, das heißt, wie stark ein Keyword innerhalb eines Textkorpus’ ist. Im Unterschied zur WDF-Metrik bezieht sich IDF nicht nur auf das eigene Dokument, sondern stellt es im Verhältnis zu anderem Web-Content und bewertet, wie häufig das Keyword auf all diesen Seiten insgesamt vorkommt.

Durch eine Kombination der beiden Metriken lässt sich feststellen, wie der eigene Content zu einem ausgewählten Keyword und Thema im Vergleich zu konkurrierenden ähnlichen Seiten performt. Darüber hinaus fungiert die Analyse als Wegweiser für weiterführende Optimierungsstrategien. Gelingt es, für die eigene Seite eine nach WDF*IDF optimale Gewichtung zu erreichen, signalisiert dies Suchmaschinen, dass die eigene Seite besonders relevant für eine Suchanfrage ist. Das Ergebnis sind ein besseres Ranking und erhöhte Sichtbarkeit bei Google und Co.

Mit welcher Formel wird WDF*IDF berechnet?

In einem ersten Schritt werden die beiden Werte der WDF und IDF jeweils separat in einer eigenen Berechnung ermittelt.

„within document frequency“-Formel

Für die WDF wird gezählt, wie oft ein Keyword in einem Text vorkommt, dies wird dann ins Verhältnis zu anderen im Text enthaltenen Begriffen gesetzt. Dabei kommt ein Logarithmus zum Einsatz, der die Berechnung so reguliert, dass das Hauptkeyword keine zu große Gewichtung bekommt und damit das Ergebnis verzerrt.

In der Praxis erfolgt die Berechnung der WDF mit dieser Formel:

WDF(i) = log2(Freq(i, j)+1) / log2(L)

i steht für das Keyword, für das die WDF ermittelt werden soll.

j bezeichnet das jeweilige Dokument, das analysiert wird.

L steht für die Anzahl aller Wörter in Dokument j.

Freq(i, j) stellt die Häufigkeit des Keywords i im Dokument j dar.

log2 ist der Logarithmus der Zahl x zur Basis 2.

Um den WDF-Wert für den Begriff i im Dokument j auszurechen, wird erst die Begriffshäufigkeit mit 1 addiert. Im Anschluss wird dieses Zwischenergebnis durch die Anzahl sämtlicher Wörter L aus dem Dokument j geteilt. Wie in der Formel aufgezeigt, wird der Logarithmus log2 auf beide Teile der Division angewendet.

„inverse document frequency“-Formel

Der zweite Wert, die IDF, bemisst die Bedeutung eines Keywords anhand seines Vorkommens im gesamten für das Thema relevanten Dokumentenkorpus. Die Höhe des IDF-Wertes richtet sich danach, wieviel Potenzial ein Keyword hat. Beispielsweise erreicht ein Begriff einen hohen IDF-Wert, wenn er in einer geringen Anzahl an Dokumenten sehr häufig auftaucht. Weniger relevant sind dagegen Begriffe, die in dem Korpus entweder in vielen der Dokumente häufig oder aber besonders selten erscheinen, wie zum Beispiel das Wort „Impressum“. Wie auch bei der Berechnung der WDF kommt wieder ein Logarithmus zum Einsatz, um das Ergebnis zu regulieren.

Der IDF-Wert wird mit dieser Formel errechnet:

IDFt = log(1 + Nd / ft)

t steht für den Begriff, für den die IDF ermittelt wird.

ND bezeichnet die Anzahl aller im Dokumentenkorpus enthaltenen Dokumente zum jeweiligen Thema.

ft steht für die Anzahl der Dokumente, die den Begriff t enthalten.

log ist der Logarithmus der Zahl x zur Basis 10 (beziehungsweise zu einer beliebigen Basis b).

Der IDF-Wert für t kann errechnet werden, indem ND durch ft geteilt und dann 1 addiert wird. Zu deutsch: die Anzahl aller im Dokumentenkorpus enthaltenen Dokumente, geteilt durch die Anzahl der Dokumente, die den Begriff enthalten. Wie bei der WDF-Formel wird auch hier anschließend log auf das Ergebnis angewendet. Bei Berechnung der Anzahl aller Dokumente im Korpus ist zu beachten, dass dieser Wert nicht einheitlich bestimmt werden kann. (vgl. https://www.ionos.de/digitalguide/online-marketing/web-analyse/wdfidf-die-formel-fuer-besseren-content/)

Mehr über Webanalyse lernen!

Nehmen Sie an unseren Webinaren teil oder sehen Sie sich eine Aufzeichnung an.

Wie wird WDF*IDF berechnet?

Sobald die beiden Einzelwerte ermittelt wurden, kann in einem nächsten Schritt der WDF*IDF-Wert errechnet werden mit dem Ziel, herauszufinden, wie hoch die Begriffsfrequenz ist und welches Optimierungspotenzial tatsächlich in den einzelnen Keywords steckt. Dazu werden die beiden Ergebnisse der WDF und IDF miteinander multipliziert:

TF(i, j) = WDFi, j * IDFt

Welche Bedeutung hat WDF*IDF für die Suchmaschinenoptimierung?

Die Annahme hinter WDF*IDF ist zunächst einmal simpel: kommt ein bestimmtes Keyword auf einer Website besonders häufig vor, die von Suchmaschinen als besonders relevant für eine Suche bewertet wird, desto höher scheint die Relevanz dieses Keywords für den Suchbegriff zu sein.

Eine WDF*IDF-Analyse ist demnach sinnvoll, um herauszufinden, welche ergänzenden Keywords zu diesem Suchbegriff thematisch relevant sind, sogenannte Proofkeywords, und wo Optimierungspotenzial besteht. Damit die eigene Seite in den Suchergebnissen besser abschneidet, weil die Suchmaschine sie als besonders relevant für eine Suchanfrage bewertet, sollten diese ergänzenden Keywords ebenfalls in den eigenen Text eingebaut oder beispielsweise auch die Anzahl bereits verwendeter Keywords verringert werden. Die Empfehlung von zusätzlichen Keywords sowie zur erstrebenswerten Gewichtung orientiert sich dabei an den Seiten, die für den Suchbegriff bereits ein hohes Ranking erreichen.

Damit handelt es sich um eine nachhaltige OnPage-Optimierungsstrategie für digitalen Content. Ein für WDF*IDF optimierter Text zeichnet sich vor allem dadurch aus, dass er ein Thema in besonderer Tiefe behandelt und nicht nur oberflächlich Keywords beinhaltet — exakt die Faktoren, die von Suchmaschinen hoch geranked werden.

Wie bei jeder SEO-Strategie gilt aber auch bei der Optimierung mithilfe der WDF*IDF Analyse, dass Nutzerfreundlichkeit und Lesbarkeit des Textes im Vordergrund stehen sollten. Eine Seite, die auf WDF- und IDF-Werte optimiert ist, ohne inhaltlichen Mehrwert für die Suchenden zu bieten, wirkt sich auf Dauer wieder negativ auf das Ranking aus.

Kostenfreie SEO Webinare

Profitieren Sie von unserem Expertenwissen. Jetzt anmelden oder Aufzeichnungen anfordern!

Welche Vor- und Nachteile hat WDF*IDF?

Auch wenn es sich bei der WDF*IDF-Analyse um eine aufwendige Methode handelt, bringt sie mehrere Vorteile mit sich und

  • liefert wichtige Erkenntnisse für das Marketing eines Website-Betreibers sowie für eine klare Optimierungsstrategie.
  • verschafft einen Überblick über Keyword-Strategien und semantisch relevante Keywords, die von Konkurrenten und ähnlichen Seiten getargeted werden.
  • zeigt Potenzial in Themennischen auf, die noch wenig Konkurrenz haben.
  • verdeutlicht, ab welchen Werten Suchmaschinen wie Google eine Seite für eine bestimmte Suche weit vorne platzieren.

Gleichzeitig gibt es auch bei der stärksten Optimierungsstrategie einige Nachteile:

  • Verlässliche Werte können erst dann ermittelt werden, wenn ein möglichst großer Dokumentenkorpus analysiert wird.
  • Es reicht nicht aus, nur das Primärkeyword einer Website zu überprüfen, vielmehr sollte WDF*IDF für alle relevanten Begriffe ermittelt werden.
  • Die Analyse einer Website bezieht sich nicht nur auf themenspezifischen Text, sondern auf sämtlichen Text inklusive Bildunterschriften und Co.
  • Aus dem Ergebnis können keine Schlüsse für einzelne Content-Pieces oder kleinere Texteinheiten wie Absätze gezogen werden, sondern nur für die gesamte Website.
  • Der auszuwertende Text sollte eine gewisse Mindestlänge haben, um aussagekräftige Werte zu erzielen, womit die WDF*IDF nicht für jedes Webprojekt sinnvoll ist.
  • Die Analyse ist sehr arbeitsintensiv.
  • WDF*IDF-Tools können zwar Arbeit abnehmen, sind aber dafür mit Kosten verbunden, womit sowohl die Tools als auch die Analyse selbst weniger für Privatpersonen geeignet sind als für Marketing-Agenturen.

Welche WDF*IDF-Tools gibt es?

Die Komplexität dieser Analyse sowie die notwendige Datenmenge macht eine manuelle Ermittlung verlässlicher Kennzahlen quasi unmöglich. Deshalb ist es sinnvoll, die Arbeit von dafür vorgesehenen WDF*IDF-Tools ausführen zu lassen.

Sie bewerten dabei nicht nur die im eigenen Text verwendeten Keywords zu einem Thema, sondern auch deren semantischen Kontext. Auf Basis dieser Bewertung schlagen die Tools dann weitere Begriffe vor, die thematisch relevant sind.

Für eine WDF*IDF-Analyse stehen Agenturen verschiedene Tools zur Verfügung, darunter:

  • Ryte
  • Searchmetrics
  • Seobility
  • SEOlyze
  • Sistrix
  • XOVI