google sitemap generator

Maik20

Erfahrenes Mitglied
Hallo,

kennt sich hier jemand mit dem google sitemap generator (python) aus?

Ich bekomme beim ausführen folgenden Fehler:

Code:
[ERROR] XML error in the config file (line 46, column 0): no element found
Configuration file errors -- exiting.

Meine config.xml sieht wie folgt aus. Wobei ich meine Domain hier durch domain.tld ersetzt habe:

Code:
 <site
  base_url="http://www.domain.tld/"
  store_into="/webseiten/sitemap.xml"
  verbose="1"
  sitemap_type="web"
 >

Oder kann es sein das ich das Tool falsch verstehe? Ich gehe davon aus, das dies die Links auf meiner Webseite abklappert und daraus ein sitemap erstellt? Dann sollten diese Infos doch reichen.
 
Hi.

Offenbar ist dein config.xml kein valides XML. Das ist doch nicht die vollständige Datei, oder? Du mußt zumindest das <site> Element ordentlich schließen:
XML:
<site base_url="http://www.domain.tld/"
  ...
/>
Gruß
 
Zuletzt bearbeitet von einem Moderator:
Jup,

da hast du recht. Als ich das Tag gültig geschlossen habe lieferte er zumindest diesen Fehler nicht mehr. Allerdings bekomme ich als Ergebnis ein leeres Sitemap mit 0 URLs und das obwohl die dort angegebene Startseite (index.php) einige URLs auf Unterseiten enthält.

Wie kann ich prüfen ob die Seite crawlbar ist oder ich irgendwo einen fundamentalen Fehler habe?
 
Wenn ich verbose auf 3 setze bekomme ich folgende Ausgabe:

Reading configuration file: config.xml
BaseURL is set to: http://www.domain.tld/
The Sitemap type is WEB Sitemap.
[WARNING] There were no inputs to generate a sitemap from.
[WARNING] No URLs were recorded, writing an empty sitemap.

Was mich wundert ist:

There were no inputs to generate a sitemap from

Die BaseURL ist doch angegebene? Warum wird die nicht geparst?
 
Danke für den Link.

Das war sehr aufschlussreich. Allerdings werde ich immer noch nicht so recht schlau.

Es gibt:

Code:
url
Optionales Tag, das Sie verwenden können, um jede URL auf Ihrer Website aufzulisten
Dann könnte ich ja gleich ein eigenes Sitemap-Script schreiben welches mir die XML Datei erstellt wenn ich hier doch alle Seiten manuell angeben muss

Code:
urllist
...
s.o.

Code:
directory
...
Hilft mir nicht weiter, da ich nur eine Index.php habe und diese über Parameter (index.php?site=123) steuere

Code:
accesslog
...
Hilft mir auch nicht, da die Seite neu ist, diese also noch kaum besuche hat.

Code:
sitemap
...
Da wären wir wieder bei einem eigenen Script

Kann der google Sitemap generator nicht einfach meine Webseite parsen und die Links in eine Sitemap zusammenführen? Oder verstehe ich nur den Sinn dieses Generators nicht?
 
Code:
accesslog
...
Hilft mir auch nicht, da die Seite neu ist, diese also noch kaum besuche hat.
Das wäre eigentlich die einzige sinnvolle Option für deine Situation.
Kann der google Sitemap generator nicht einfach meine Webseite parsen und die Links in eine Sitemap zusammenführen?
Nein, das kann das Programm nicht. Siehe Beschreibung auf der Seite. Aber du könntest ja andere Tools (z.B. lynx) dafür verwenden eine URL Liste zu generieren und dann diese Liste an das Google Tool weiterreichen.

Gruß
 
Danke,

hast du zu der Verwendung von Lynx auch einen Link? Ich finde unter google nur den TextWebBrowser.
 
Zurück