Archiv für das Tag 'SEO'

joe

Google und valides HTML

Unfreiwillig habe ich in den letzten Tagen einen Test gemacht, wie sehr Google fehler im HTML Quelltext einer Seite toleriert. Normelerweise ist dieses Blog XHTML komform, zumindest unregelmäßig überprüfe ich das auch beim W3C, wenn ich wollte dürfte ich dann also glatt dieses schöne Logo einbauen:

Valid XHTML 1.0 Transitional

Ich verkneife mir das aber mal, an ein Buch schreibt ja auch niemand drann das es frei von Rechtschreibfehler ist.

Durch einen Cut und Paste Fehler hatte ich nun aber versehentlich einen Umbruch mitten in einen Link (<br>) in den Quelltext eingebaut wodurch das XHTML nicht mehr gültig war. Erst fiel es mir nicht auf, sowohl IE als auch Firefox renderten wie erwartet, nur bei Google war die Seite praktisch weg. Der Googlebot scheint nur bis zum ersten Fehler zu analysieren und es dann schlichtweg aufzugeben. Nun ist so ein einmaliges Ergebnis sicherlich nicht repäsentativ aber ein Argument mehr valides (X)HTML auszuliefern.

Eigentlich ist Google ja mit seiner schlichten Startseite berühmt geworden, aber ein paar Auswahlmöglichkeiten gibt es dann ja doch. Sobald man die deutsche Google Startseite aufruft, gibts neben dem Suchfeld noch die Möglichkeit “Seiten in Deutsch” und “Seiten aus Deutschland” zu suchen. Aber wo ist eigentlich Deutschland? Woran erkennt Google, wann eine Seite aus Deutschland kommt.
Nach einiger Suche bin ich dabei auf zwei Interessante Post gefunden, offensichtlich scheint für Google sowohl die IP Adresse des Servers als auch die Domain Endung von Bedeutung zu sein.

In our understanding of web content, Google considers both the IP address and the top-level domain (e.g. .com, .co.uk). Because we attempt to serve geographically relevant content, we factor domains that have a regional significance. For example, “.co.uk ” domains are likely very relevant for user queries originating from the UK. In the absence of a significant top-level domain, we often use the web server’s IP address as an added hint in our understanding of content.

Noch spannender man kann Google sogar erzählen wo man gerne gefunden werden möchte.