Sitemaps

Das Sitemaps Protokoll ermöglicht es einem Webmaster, Suchmaschinen darüber zu informieren URLs auf einer Website, die zum Krabbeln verfügbar ist. Eine Sitemap ist eine Xml Datei, in der die URLs für eine Site aufgeführt sind. Es ermöglicht den Webmaster, zusätzliche Informationen zu jeder URL hinzuzufügen: Wenn sie zuletzt aktualisiert wurde, wie oft sie sich ändert und wie wichtig sie in Bezug auf andere URLs der Website ist. Auf diese Weise können Suchmaschinen die Site effizienter kriechen und URLs finden, die aus dem Rest des Inhalts der Website isoliert werden können. Das Sitemaps -Protokoll ist ein URL -Einschlussprotokoll und ergänzt sich Robots.txt, ein URL -Ausschlussprotokoll.

Geschichte

Google stellte im Juni 2005 Sitemaps 0.84 erstmals vor, sodass Webentwickler Linkslisten aus ihren Websites veröffentlichen konnten.[1] Google, Yahoo! Und Microsoft kündigte im November 2006 die gemeinsame Unterstützung für das Sitemaps -Protokoll an.[2] Die Schema -Version wurde in "Sitemap 0,90" geändert, aber es wurden keine anderen Änderungen vorgenommen.

Im April 2007 kündigten Ask.com und IBM die Unterstützung für Sitemaps an.[3] Auch Google, Yahoo, MSN kündigte automatische Entdeckung für Sitemaps durch Robots.txt. Im Mai 2007 gaben die Landesregierungen von Arizona, Kalifornien, Utah und Virginia bekannt, dass sie Sitemaps auf ihren Websites verwenden würden.[4]

Das Sitemaps -Protokoll basiert auf Ideen[5] Von "Crawler-freundlichem Webservern", "[6] mit Verbesserungen einschließlich Auto-Discovery durch Robots.txt und die Fähigkeit, die Priorität und Änderung der Seiten der Seiten anzugeben.

Zweck

Sitemaps sind besonders auf Websites von Vorteil, auf denen:

  • Einige Bereiche der Website sind nicht über die Browsable -Schnittstelle verfügbar[7]
  • Webmaster verwenden Rich Ajax, Silberlicht, oder Blinken Inhalt, der normalerweise nicht verarbeitet wird von Suchmaschinen.
  • Die Website ist sehr groß und es besteht die Möglichkeit, dass die Webcrawler einige der neuen oder kürzlich aktualisierten Inhalte übersehen können[7]
  • Wenn Websites eine große Anzahl von Seiten haben, die isoliert oder nicht gut miteinander verbunden sind, oder[7]
  • Wenn eine Website nur wenige externe Links hat[7]

Datei Format

Das Sitemap -Protokollformat besteht aus XML -Tags. Die Datei selbst muss sein UTF-8 codiert. Sitemaps können auch nur eine einfache Textliste von URLs sein. Sie können auch im .gz -Format komprimiert werden.

Eine Beispiel -Sitemap, die nur eine URL enthält und alle optionalen Tags verwendet, wird unten angezeigt.

  xmlns ="http://www.sitemaps.org/schemas/sitemap/0.9"  xmlns: xsi ="http://www.w3.org/2001/xmlschema-instance"  XSI: Schemalokalisierung ="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">    http://example.com/  2006-11-18  Täglich  0,8    

Das Sitemap XML -Protokoll wird ebenfalls erweitert, um mehrere Sitemaps in einer "Sitemap -Index" -Datei aufzulisten. Die maximale Sitemap -Größe von 50MiB oder 50.000 URLs[8] bedeutet, dass dies für große Standorte notwendig ist.

Ein Beispiel für den Sitemap -Index, der eine separate Sitemap verweist, folgt.

  xmlns ="http://www.sitemaps.org/schemas/sitemap/0.9">    http://www.example.com/sitemap1.xml.gz  2014-10-01T18: 23: 17+00: 00: 00    

Elementdefinitionen

Die Definitionen für die Elemente sind unten dargestellt:[8]

Element Erforderlich? Beschreibung
Ja Das Element auf Dokumentebene für die Sitemap. Der Rest des Dokuments nach dem Element "<? XML -Version>" muss darin enthalten sein.
Ja Übergeordnetes Element für jeden Eintrag.
Ja Das Element auf Dokumentebene für den Sitemap-Index. Der Rest des Dokuments nach dem Element "<? XML -Version>" muss darin enthalten sein.
Ja Übergeordnetes Element für jeden Eintrag im Index.
Ja Bietet die vollständige URL der Seite oder Sitemap, einschließlich des Protokolls (z. B. HTTP, HTTPS) und eines nachverfolgenden Schrägs, falls vom Hosting -Server der Website erforderlich. Dieser Wert muss kürzer sein als 2.048 Zeichen. Beachten Sie, dass Verstärker in der URL als entkommen müssen wie &.
Nein Das Datum, an dem die Datei zuletzt geändert wurde, in ISO 8601 Format. Dies kann das vollständige Datum und die volle Uhrzeit anzeigen oder, falls gewünscht, einfach das Datum im Format yjyy-mm-dd sein kann.
Nein Wie häufig kann sich die Seite ändern:
  • stets
  • stündlich
  • Täglich
  • wöchentlich
  • monatlich
  • jährlich
  • noch nie

"Immer" wird verwendet, um Dokumente zu bezeichnen, die sich jedes Mal ändern, wenn sie zugegriffen werden. "Never" wird verwendet, um archivierte URLs zu bezeichnen (d. H. Dateien, die nicht wieder geändert werden).

Dies wird nur als Leitfaden für verwendet Kriecherund wird nicht verwendet, um zu bestimmen, wie häufig Seiten indiziert werden.

Trifft nicht auf ... zu Elemente.

Nein Die Priorität dieser URL im Vergleich zu anderen URLs auf der Website. Auf diese Weise können Webmaster Crawler vorschlagen, welche Seiten als wichtiger angesehen werden.

Der gültige Bereich liegt zwischen 0,0 und 1,0, wobei 1,0 der wichtigste ist. Der Standardwert beträgt 0,5.

Wenn Sie alle Seiten auf einer Website mit hoher Priorität bewerten, wird sich keine Auswirkungen auf die Sucheinträge auswirken, da sie den Crawlern nur vorschlagen, wie wichtig die Seiten der Website für einander sind.

Trifft nicht auf ... zu Elemente.

Die Unterstützung der nicht erforderlichen Elemente kann von einer Suchmaschine zur anderen variieren.[8]

Andere Formate

Textdatei

Das Sitemaps -Protokoll ermöglicht es der Sitemap, eine einfache Liste von URLs in einer Textdatei zu sein. Die Dateispezifikationen von XML -Sitemaps gelten auch für Text -Sitemaps. Die Datei muss UTF-8 codiert sein und nicht mehr als 50 MB (unkomprimiert) sein oder mehr als 50.000 URLs enthalten. Sitemaps, die diese Grenzen überschreiten, sollten mit einer Sitemap -Indexdatei in mehrere Sitemaps unterteilt werden (eine Datei, die auf mehrere Sitemaps verweist).[9]

Syndication -Feed

A Syndication -Feed ist eine zulässige Methode, um URLs an Crawler zu senden; Dies wird hauptsächlich für Websites mit Syndication -Feeds empfohlen. Ein angegebener Nachteil ist, dass diese Methode möglicherweise nur Crawler mit kürzlich erstellten URLs liefert, aber während des normalen Krabbelns können noch andere URLs entdeckt werden.[8]

Es kann vorteilhaft sein, einen Syndikations -Feed als Delta -Update (mit nur dem neuesten Inhalt) zu haben, um eine vollständige Sitemap zu ergänzen.

Suchmaschinenübermittlung

Wenn Sitemaps direkt an eine Suchmaschine übermittelt werden (Pinged), es gibt Statusinformationen und alle Verarbeitungsfehler zurück. Die mit der Einreichung verbundenen Details variieren von den verschiedenen Suchmaschinen. Der Ort der Sitemap kann auch in der enthalten sein Robots.txt Datei durch Hinzufügen der folgenden Zeile:

Seitenverzeichnis:

Das sollte die vollständige URL der Sitemap sein, wie z. B.:

https://www.example.org/sitemap.xml

Diese Anweisung ist unabhängig von der Benutzer-Agent-Linie, daher spielt es keine Rolle, wo sie in die Datei platziert ist. Wenn die Website über mehrere Sitemaps verfügt, können mehrere "Sitemap:" -Datensätze enthalten sein Robots.txtoder die URL kann einfach auf die Haupt -Sitemap -Indexdatei verweisen.

In der folgenden Tabelle werden die URLs der Sitemap -Einreichung für einige wichtige Suchmaschinen aufgeführt:

Suchmaschine URL Submission Hilfe Seite Markt
Baidu https://zhannzhang.baidu.com/dashboard/index Baidu Webmaster Dashboard China, Singapur
Bing (und Yahoo!)) https://www.bing.com/webmaster/ping.aspx?sitemap= Bing Webmaster Tools Global
Google https://www.google.com/webmasters/tools/ping?sitemap= Senden einer Sitemap Global
Yandex https://webmaster.yandex.com/site/map.xml Sitemaps -Dateien Russland, Ukraine, Weißrussland, Kasachstan, Türkei

Sitemap -URLs, die mit den Sitemap -Einreichungs -URLs eingereicht wurden URL-codiertZum Beispiel: Ersetzen : (Dickdarm) mit %3a, ersetzen / (Schrägstrich) mit %2f.[8]

Einschränkungen für die Suchmaschinenindizierung

Sitemaps ergänzen und ersetzen die vorhandenen Crawl-basierten Mechanismen, mit denen Suchmaschinen bereits URLs entdecken. Die Verwendung dieses Protokolls garantiert weder, dass Webseiten in Suchindizes enthalten sind, und es beeinflusst auch nicht die Art und Weise, wie Seiten in Suchergebnissen eingestuft werden. Spezifische Beispiele finden Sie unten.

  • Google - Webmaster -Unterstützung auf Sitemaps: "Die Verwendung einer Sitemap garantiert nicht, dass alle Elemente in Ihrem Sitemap gekrabbt und indiziert werden, da Google -Prozesse auf komplexen Algorithmen angewiesen sind, um das Krabbeln zu planen. Wenn Sie eine Sitemap haben, werden Sie nie dafür bestraft, eine zu haben. "[10]
  • Bing - Bing verwendet das Standard -Sitemaps.org -Protokoll und ist dem unten erwähnten sehr ähnlich.
  • Yahoo - Nach dem Suchabkommen zwischen Yahoo! Inc. und Microsoft, Yahoo! Site Explorer hat sich mit verschmolzen mit Bing Webmaster Tools

Sitemap -Grenzen

Sitemap -Dateien haben eine Grenze von 50.000 URLs und 50Mb pro Sitemap. Sitemaps können mit Verwendung komprimiert werden gzip, Reduzierung des Bandbreitenverbrauchs. Mehrere Sitemap -Dateien werden unterstützt, wobei eine Sitemap -Indexdatei als Einstiegspunkt dient. In Sitemap -Indexdateien werden möglicherweise nicht mehr als 50.000 Sitemaps aufgeführt und dürfen nicht größer als 50 seinMiB (52.428.800 Bytes) und können komprimiert werden. Sie können mehr als eine Sitemap -Indexdatei haben.[8]

Wie bei allen XML -Dateien müssen alle Datenwerte (einschließlich URLs) Entity -Escape -Codes für die Zeichenverstärker (&), ein einzelnes Zitat ('), das doppelte Zitat ("), weniger als (<) und größer als (>) verwenden. .

Best Practice zur Optimierung eines Sitemap -Index für die Krabbbarkeit von Suchmaschinen besteht darin, sicherzustellen, dass sich der Index nur auf Sitemaps im Gegensatz zu anderen Sitemap -Indizes bezieht. Das Nisten eines Sitemap -Index innerhalb eines Sitemap -Index ist gemäß Google ungültig.[11]

Zusätzliche Sitemap -Typen

Eine Reihe zusätzlicher XML -Sitemap -Typen außerhalb des Umfangs des Sitemaps -Protokolls werden von Google unterstützt, damit Webmaster zusätzliche Daten zum Inhalt ihrer Websites bereitstellen kann. Video- und Image -Sitemaps sollen die Fähigkeiten von Websites verbessern, um die Bild- und Video -Suche zu bewerten.[12][13]

Video -Sitemaps

Video -Sitemaps geben Daten an, die sich auf Einbettung und Autoplaying beziehen, bevorzugte Miniaturansichten in Suchergebnissen, Veröffentlichungsdatum, Videodauer und anderen Metadaten.[13] Video -Sitemaps werden auch verwendet, um Suchmaschinen zu ermöglichen, Videos zu indexieren, die auf einer Website eingebettet sind, die jedoch extern gehostet werden, z. B. auf Vimeo oder Youtube.

Bild -Sitemaps

Image -Sitemaps werden verwendet, um Bildmetadaten wie Lizenzinformationen, geografischer Standort und Bildunterschrift anzuzeigen.[12]

Google News Sitemaps

Google unterstützt einen Google News-Sitemap-Typ für die schnelle Indexierung zeitkritischer Nachrichten.[14][15]

Mehrsprachige und multinationale Sitemaps

Im Dezember 2011 kündigte Google die Anmerkungen für Websites an, die Benutzer in vielen Sprachen und optional Ländern ansprechen möchten. Ein paar Monate später kündigte Google in ihrem offiziellen Blog an.[16] dass sie Unterstützung für die Angabe des rel = "alternativ" und hinzufügen Hreflang Anmerkungen in Sitemaps. Anstelle der (bis dahin nur Option) HTML -Linkelemente bot die Sitemaps -Option viele Vorteile, die eine kleinere Seitengröße und eine einfachere Bereitstellung für einige Websites enthalten.

Ein Beispiel für das mehrsprachige Sitemap wäre wie folgt:

Wenn wir beispielsweise eine Website haben, die auf englischsprachige Benutzer abzielt http://www.example.com/en und griechische Sprachnutzer durch http://www.example.com/grBis dahin war die einzige Möglichkeit, die Hreflang -Annotation entweder im HTTP -Header oder als HTML -Elemente auf beiden URLs wie diesem hinzuzufügen

 rel ="wechseln" hreflang ="en" href ="https://www.example.com/en" />  rel ="wechseln" hreflang ="GR" href ="https://www.example.com/gr" /> 

Aber jetzt kann man das folgende äquivalente Markup in Sitemaps alternativ verwenden:

    https://www.example.com/en      rel ="wechseln"   hreflang ="GR"   href ="https://www.example.com/gr" />      rel ="wechseln"   hreflang ="en"   href ="https://www.example.com/en" />       https://www.example.com/gr      rel ="wechseln"   hreflang ="GR"   href ="https://www.example.com/gr" />      rel ="wechseln"   hreflang ="en"   href ="https://www.example.com/en" />   

Siehe auch

Verweise

  1. ^ Shivakumar, Shiva (2005-06-02). "Google Blog: Webmaster-freundlich". web.archive.org. Archiviert vom Original am 2005-06-08. Abgerufen 2021-12-31.
  2. ^ "Große Suchmaschinen vereinen sich, um einen gemeinsamen Mechanismus für die Einreichung der Website zu unterstützen.". Nachrichten von Google. 16. November 2006. Abgerufen 2021-12-31.{{}}: CS1 Wartung: URL-Status (Link)
  3. ^ Pathak, Vivek (2007-05-11). "The Ask.com Blog: Sitemaps Autodiscovery". Asks offizieller Blog. Archiviert von das Original am 2007-05-18. Abgerufen 2021-12-31.
  4. ^ "Informationen für Organisationen des öffentlichen Sektors". web.archive.org. Archiviert von das Original Am 2007-04-30.
  5. ^ M.L. Nelson; J.A. Schmied; Del Campo; H. van de Sompel; X. Liu (2006). "Effiziente, automatisierte Webressourcenernte" (PDF). Widm'06.
  6. ^ O. Brandman, J. Cho, Hector Garcia-Molina, und Narayanan Shivakumar (2000). "Crawler-freundliche Webserver". Proceedings of ACM Sigmetrics Performance Evaluation Review, Band 28, Ausgabe 2. doi:10.1145/362883.362894.{{}}: Cs1 montiert: Mehrfachnamen: Autorenliste (Link)
  7. ^ a b c d "Erfahren Sie mehr über Sitemaps | Suchen Sie in Zentral". Google -Entwickler. Abgerufen 2021-06-01.
  8. ^ a b c d e f "Sitemaps XML -Format". Sitemaps.org. 2016-11-21. Abgerufen 2016-12-01.
  9. ^ "Erstellen und senden Sie eine Sitemap - Suchkonsole Hilfe". Support.google.com. Abgerufen 30. November 2020.
  10. ^ "Über Google Sitemaps". 2016-12-01. Abgerufen 2016-12-01.
  11. ^ "Sitemaps Report - Suchkonsole Hilfe". Support.google.com. Abgerufen 2020-04-15.
  12. ^ a b "Bild Sitemaps". Google -Suchkonsole. Abgerufen 28. Dezember 2018.
  13. ^ a b "Video -Sitemaps". Google -Suchkonsole. Abgerufen 28. Dezember 2018.
  14. ^ Bigby, Garenne. "Warum Sie eine Google News -Sitemap verwenden sollten". Dyno Mapper. Abgerufen 28. Dezember 2018.
  15. ^ "Google News Sitemaps". Google -Suchkonsole. Abgerufen 28. Dezember 2018.
  16. ^ "Mehrsprachige und multinationale Site -Anmerkungen in Sitemaps". Google Webmaster Central Blog. Pierre weit. 24. Mai 2012.

Externe Links