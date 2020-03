Bloß: Warum ist das so? Woher weiß Google , dass diese Geschäfte Buntstifte im Repertoire haben? Und warum steht „Majas Malwelt“ in der Liste der Suchergebnisse unterhalb von „Kurts Künstlerbedarf“ und der wiederum hinter dem Universal-Alles-Verkäufer Amazon, der natürlich ebenfalls Buntstifte anbietet? Wenn Sie immer schon mal wissen wollten, wie die große Suchmaschine funktioniert, sind Sie hier richtig. Wir verraten es nämlich im folgenden Artikel.

Foto: j zamora © unsplash.com

Vieles, von dem, was Google macht, lässt sich am besten erklären, wenn man dazu analoge Beispiele heranzieht. Stellen wir uns deshalb das Internet einmal kurz als analoge Bibliothek voller Bücher vor – als gigantische Bibliothek, in der jede einzelne Webseite ein eigenes Buch darstellt. Um das als Zahl zu nennen: Aktuell gibt es auf der Welt ungefähr 1,3 Milliarden einzelne Webseiten und dazu ein Vielfaches an Unterseiten (etwa eine einzelne Produktseite auf einem Online-Shop). Wahrscheinlich gehen die Zahlen in die hunderten Milliarden oder sogar Billionen. Ganz genau kann das jedoch niemand sagen, da das Netz mittlerweile schlicht viel zu groß ist und zudem ständig pulsiert und in Veränderung begriffen ist.

In dieser XXXL-Bibliothek gibt es jedoch nur eine Handvoll Bibliothekare – das sind die Suchmaschinen. Stellen wir uns Google hier als den Bibliothekar vor, der bei allen Besuchern der mit Abstand Schlaueste und Beliebteste ist. Denn Google ist tatsächlich nicht nur diejenige Suchmaschine mit den meisten und exaktesten Ergebnissen, sondern hat eine global fast schon monopol-artige Stellung, ganz besonders im mobilen Bereich – alle anderen Suchmaschinen, auch die, die älter sind oder auch zu großen Unternehmen gehören (etwa Bing von Microsoft) haben nur einen Bruchteil von Googles Bedeutung.

Unser Bibliothekar Google weiß deshalb so viel, weil er unermüdlich Tag und Nacht arbeitet – wahrscheinlich auch härter als seine Konkurrenten. Dazu nutzt Google enorm große Serverfarmen und sogenannte Crawler. Das sind sehr clevere Programme, die unermüdlich jede einzelne Webseite durchforsten, deren Inhalte auslesen und für unseren Bibliothekar einen Index erstellen, eine Art Stichwortverzeichnis. Anhand dessen weiß er nicht nur, was für Bücher er im Bestand hat, sondern auch, was deren zentrale Inhalte sind.

Keywords und mehr

Foto: Webaroo © unsplash.com

Warum crawlt der Crawler eine Webseite und wie tut er das? Primär liegt es an den Webseitenbetreibern. Wenn jemand eine neue Webseite erstellt, legt er dazu eine Reihe von Parametern fest – unter anderem die sogenannten Keywords.

Dabei handelt es sich um „Schlüsselwörter“, die nicht bloß für den Menschen gedacht sind, sondern vor allem für Google. Sie sind absolut zentral wichtig, denn sie enthalten das, was der Webseitenbetreiber für besonders wichtig erachtet. Denken wir also an unsere Anbieter von Buntstiften zurück, wären die Keywords beispielsweise:

Buntstifte

Ausmalen

Malen

Zeichnen

Künstlerbedarf

Und so weiter. Alles Wörter, die den Kern einer Seite und um was sie sich dreht, zusammenfassen.

Wenn ein Betreiber eine Webseite neu eröffnet, wendet er sich an Google. Die Suchmaschine hat dazu ein Tool namens Search Console eingerichtet. Darin kann man diverse Parameter rund ums Crawlen eingeben.

In der Folge werden Googles crawlende Gehilfen erstmalig die Seite durchsuchen und auch danach regelmäßig wiederkehren und auf Veränderungen durchforsten – das mit den Veränderungen sollten Sie sich merken, es wird später im Text nochmals wichtig.

Auf diese Weise hat Google 24/7 einen unglaublich exakten Überblick über das Internet und zeigt für jede Anfrage die passenden Seiten – das geht allerdings nur deshalb, weil das Unternehmen zu den weltgrößten Betreibern von Rechenzentren gehört. Allein der Suchindex umfasst rund hundert Millionen Gigabyte.

Rennen um die besten Plätze

Erinnern wir uns an den Eingangstext: Warum werden die Ergebnisse in exakt dieser Reihenfolge präsentiert? Um das zu erklären, ist zunächst der Oberbegriff notwendig: diese Reihenfolge und alles, was mit ihr zusammenhängt, nennt sich Ranking.

Es gibt natürlich für alles mehrere Webseiten. Sie alle stehen in Konkurrenz zueinander, da die allermeisten Webseiten nicht aus Nächstenliebe betrieben werden, sondern dem Betreiber Einnahmen generieren – sei es, weil er dort Werbung geschaltet hat oder weil es sich um einen Shop handelt, auf dem er Buntstifte und Co. verkauft.

Klar ist, dass alle davon, wenn wir eines ihrer Keywords in die Suchmaske eingeben, möglichst ganz vorn angezeigt werden wollen – denn das erhöht natürlich die Chance, dass wir daraufklicken und dort unser Geld lassen (und nicht beim Konkurrenten), ganz enorm.

Doch wie rankt Google? Sehr vieles davon geschieht im Verborgenen. Klar, Google möchte sich natürlich nicht dem Vorwurf aussetzen, bestechlich zu sein. Aber ganz neutral ist unser Bibliothekar auch nicht, denn er ermöglicht es Webseitenbetreibern durchaus, ihre Positionierung zu verbessern:

SEA oder Search Engine Advertising bzw. Suchmaschinenwerbung ist die direkte Methode. Das sind die Handvoll Anzeigen, die in den Ergebnissen ganz oben gezeigt werden – direkt daneben steht dick Anzeige . Wer hier erscheinen will, zahlt für jeden einzelnen Klick Geld an Google; die Suchmaschine muss ja Mittel für ihren Betrieb bekommen.

. Wer hier erscheinen will, zahlt für jeden einzelnen Klick Geld an Google; die Suchmaschine muss ja Mittel für ihren Betrieb bekommen. SEO oder Search Engine Optimization bzw. Suchmaschinenoptimierung ist indirekter. Hierbei nutzen Seitenbetreiber die Tatsache, dass Google es unter anderem belohnt, wenn die Seite regelmäßig verändert, das heißt, aktualisiert und um hochwertige Inhalte ergänzt wird.

Vor allem letzteres hat sich in den vergangenen Jahren zur großen Kunst entwickelt. Denn Google ist ein sehr strenger Bibliothekar. In früheren Zeiten der Suchmaschine genügte es, einfach nur seine Keywords so häufig wie nur möglich auf seiner Webseite und den Unterseiten unterzubringen, das nennt sich Keyword Spam.

Heute indes würde Google ein derartiges Verhalten nicht bloß nicht belohnen, sondern sogar bestrafen – die Seite würde dann mit voller Absicht auf die hinteren Ränge der Suchergebnisse gelistet werden, wo die Chance, dass sich jemand bis hierhin durchklickt, verschwindend gering ist.

Dass es diese Weiterentwicklung gab, liegt vor allem daran, dass Google tagtäglich unermüdlich seine KI weiterentwickelt, der sogenannten Google-Algorithmus. Er ist mittlerweile extrem fähig, kann teilweise sogar besser als der Mensch erkennen, ob eine Webseite qualitativ wirklich gut oder nur „schein-gut“ ist.

Der Sinn dahinter? Google ist sich seiner Macht natürlich bewusst. Und das Unternehmen möchte sie nutzen, um das Internet zu verbessern. Praktisch die digitale Anwendung des alten Prinzips „die Guten ins Töpfchen, die Schlechten ins Kröpfchen“, damit wir als Suchende nur das präsentiert bekommen, was wir sehen möchten – wenn Sie nach Buntstiften suchen, möchten Sie ja beispielsweise nicht eine ellenlange Geschichte der Buntstiftproduktion vorgesetzt bekommen, sondern Produkte.