robots.txt

Startseite » Glossary » R » robots.txt

Eine robots.txt ist eine Textdatei, die dem Bot einer Suchmaschine Anweisungen gibt, welche Teile einer Website sie crawlen und indexieren dürfen. Die Datei befindet sich im Stammverzeichnis einer Website und ist für Suchmaschinen wie Google und Bing sichtbar.

Funktionsweise der robots.txt

Eine robots.txt-Datei besteht aus einer Liste von Anweisungen, die mit dem Befehl User-agent beginnen. Der Befehl User-agent gibt an, für welchen Webcrawler die Anweisungen gelten. So kann eine Website beispielsweise bestimmte Anweisungen nur für Googlebots oder nur für Bingbots erteilen.

Die folgenden Anweisungen sind in einer robots.txt-Datei möglich:

Allow: Erlaubt dem angegebenen Webcrawler, die angegebene URL oder den angegebenen Pfad zu crawlen und zu indexieren.
Disallow: Verbietet dem angegebenen Webcrawler, die angegebene URL oder den angegebenen Pfad zu crawlen und zu indexieren.
Sitemap: Gibt die URL einer Sitemap an, die dem Webcrawler angezeigt werden soll.

Vorteile robots.txt

Eine robots.txt-Datei kann folgende Vorteile haben:

  • Verbesserte Leistung: Eine robots.txt-Datei kann dazu beitragen, die Leistung einer Website zu verbessern, indem sie Webcrawlern mitteilt, welche Teile der Website sie nicht crawlen müssen.
  • Verbesserte Sicherheit: Eine robots.txt-Datei kann dazu beitragen, die Sicherheit einer Website zu verbessern, indem sie Webcrawlern den Zugriff auf bestimmte Bereiche der Website verbietet.
  • Verbesserte Suchmaschinenoptimierung (SEO): Eine robots.txt-Datei kann dazu beitragen, die Suchmaschinenoptimierung (SEO) einer Website zu verbessern, indem sie Webcrawlern mitteilt, welche Teile der Website für die Suchmaschinen relevant sind.

Nachteile robots.txt

Eine robots.txt-Datei kann auch folgende Nachteile haben:

SEO Angebot
  • Fehlerhafte Anweisungen: Falsche Befehle in einer robots.txt-Datei können dazu führen, dass Webcrawler bestimmte Teile einer Website nicht crawlen oder indexieren können.

Auswahl der Anweisungen

Die Auswahl der Anweisungen für eine robots.txt-Datei hängt von den individuellen Bedürfnissen einer Website ab. Bei der Auswahl sollten folgende Faktoren berücksichtigt werden:

  • Leistung: Welche Teile der Website müssen für die Leistung der Website crawlbar sein?
  • Sicherheit: Welche Teile der Website müssen aus Sicherheitsgründen für Webcrawler unzugänglich sein?
  • SEO: Welche Teile der Website sind für die Suchmaschinenoptimierung (SEO) relevant?

Beispiele

Hier sind einige Beispiele für robots.txt-Anweisungen:

User-agent: *
Disallow: /verzeichnis/

User-agent: Googlebot
Allow: /blog/
Allow: /kontakt/

Die erste Anweisung verbietet allen Webcrawlern, den Ordner verzeichnis zu crawlen. Die zweite Anweisung erlaubt Googlebots, die Ordner blog und kontakt zu crawlen.

Fazit zur Nutzung der robots.txt

Eine robots.txt-Datei kann ein wichtiges Werkzeug für die Verwaltung von Webcrawlern sein. Bei der Erstellung einer robots.txt-Datei ist es wichtig, die individuellen Bedürfnisse der Website zu berücksichtigen. Falsche Befehle in einer robots.txt-Datei können das Ranking einer Website negativ beeinflussen. Deshalb sollten die Einträge in der robots.txt mit Bedacht gewählt werden.

SEO Glossar

SEO Angebot
SEO Anfrage