Tipps + Fragen zum Plugin Suchmaschinen-Sitemap Generator

Hier können Probleme und alles andere in Deutscher Sprache gelöst werden.
Post Reply
Czorneboh
Regular
Posts: 384
Joined: Tue Apr 08, 2008 7:17 pm
Location: Berlin
Contact:

Tipps + Fragen zum Plugin Suchmaschinen-Sitemap Generator

Post by Czorneboh » Sat Sep 05, 2015 3:14 pm

Hallo miteinander!

Gehört das Plugin (engl: serendipity_event_google_sitemap) zum Kern der Version 2.0?
Oder fehlt sie nach einer Neuinstallation und damit auch noch die sitemap.xml-Datei?

Diese Datei ist für das Crowling der Website wichtig.

Soweit eine Sitemap-Datei erzeugt ist, liegt diese im gleichen Verzeichnis wie die .htaccess-Datei und robots.txt-Datei. Aber sie ist gepackt: sitempam.xml.gz. Weil ich es so eingestellt habe.

Gehe ich richtig in der Annahme, dass die Crowler der Suchmaschinen gz-Dateien lesen können?

SEO-Tools im Browser zeigen mir an, dass sie meine sitemap nicht gefunden haben. Die Datei sitemap.xml.gz ist aber im Verzeichnis /blog/ vorhanden.

Jetzt habe ich (nach der Umbennenung von "Webmaster Tools" erstmals (wieder) die Search Console von Google aufgerufen.

Ich gehe in der Navigation zu "Crowling": "Keine Fehler in den letzten 90 Tagen. Super!"

Hier ist nur ein Fehler unter "sitemaps" verzeichnet, aber vom 13.08.2013.
Zu dem Datum ist vermerkt: Eingereicht: 4.859, davon 1.228 Seiten indexiert.

Benutzung von SEO-Addons für Browser
Für mich sieht es so aus, als ob für Google die sitemap erreichbar ist, die Meldungen der SEO-Tools irritieren mich. Kann es sein, dass diese keinen Liveabruf machen und deren Datum zu sitemap veraltet ist? - Viele Parameter solcher Tools wie (für Chrome z.B.) SEO for Chrome bekommen beim Aufruf keine (frischen?) Ergebnisse oder liefern erst Ergebnisse ab einer bestimmten Größe der Website.

Jetzt habe ich mir auch diese sitemap.xml mal geöffnet und angesehen (bisher noch nie).

Die Gewichtung von bestimmten Seitenklassen lassen sich mit dem Plugin Suchmaschinen-Sitemap Generator einstellen. Ich habe das jetzt mal geöffnet (weiß nicht, wann ich das mal früher geöffnet hatte). Beschrieben ist das Plugin im Buch "Serendipity" auf Seite 314 - 317, habe ich gelesen.

Die Gewichtung kann man in der Google Search Console selbst einstellen/ändern unter "Darstellung der Suche" und dann "Sitelinks". Es gibt dort einen Link zu weiteren Informationen, wie man das macht.

Zurück zum Plugin, den Einstellungen hier:

Ich frage mich, ob die unter "URL-Liste für Pings"
gezeigte url
http://www.google.com/webmasters/tools/ ... sitemap=%s

noch korrekt ist. Die Webmaster Tools sind seit Mai 2015 jetzt die Search Console. Aber ich bin in meiner (Ich hatte mich früher schon für die Webmaster Tools registriert) und hier gibt es noch diese url, z.B.:
https://www.google.com/webmasters/tools ... ebsite.de/

Unter diesem Feld für die Url für da Pingen kann man einstellen, ob die Sitemap gepackt werden soll mit gzip.

Was für Gründe gibt es, nicht zu packen (wenn Crowler die gz-Datei lesen können?

Der nächste Punkt ist "URL-Typen". Deaktiviert sind bei mir feeds und Autoren und Tag-Seiten.

Die "Autoren"-Seiten sind ebenfalls in meiner robots.txt für ein Crowlen gesperrt.
Frage Wird von hier aus die Einstellung in der robots.txt geschrieben? (Ich weiß nicht wie das gehen sollte). Offenbar nicht, denn feeds sind in der robots.txt nicht gesperrt.

Wenn nicht, sollte man mal beides miteinander vergleichen, zumal wenn man sich mit dem Thema duplicate content und dessen Vermeidung beschäftigt.

In der Zeitschrift Websiteboosting #33 gibt es aktuell einen Artikel von einem Buchautoren, dessen Buch "Suchmaschinen-Optinierung" ich in der 4. Auflage habe (Galileo-Verlag): Sebastian Erlhofer: "SEO? Haben auch Sie Ihr Potential verschenkt?"

Darin geht es um die Crowlbarkeit der Website. Hier zeigt er auch eine noindex-Falle, wenn man zusätzlich zum noindex für eine Seite auch noch diese in der robots.txt. aussperrt.

Es gibt hier noch eine Einstellmöglichkeit, die noch noch nicht ins Deutsche übersetzt ist: "Merge GoogleNews sitemap with normal sitemap"

Könnte man noch korrigieren.

Dabei kommt mir noch eine Frage: Gibt es noch die Regelung, dass eine sitemap auf 1.000 urls beschränkt ist? Von meiner Website sind mehr als 1.000 urls indexiert.
Aus SEO-Gründen macht es Sinn, bei größeren Seiten mehrere sitemaps anzulegen. Das schreibt Erlhofer in dem Artikel in Websiteboosting. Die Frage ist hier, wie man diese dann "zusammenführt", wie das die Blogsoftware macht oder was man hier in einem der Felder eintragen muss, etwa unter

"Manueller Zusatzinhalt"?

Oder könnten die Entwickler hier noch ein Feld mit aufnehmen, in welchem man diese Verbindung aller vorhandenen Sitemaps vornehmen kann? - Aber mir kommen Zweifel, ob das Plugin mit mehreren sitemaps umgehen kann. :roll:

Wunsch:
Google news Kategorien:
Ich nutze diese Funktion Googlenews-Kategorien momentan nicht, bis auf "Blog"
Könnte man bei den news-Kategorien nicht noch weitere ergänzen? Mich interessiert besonders die Kategorie "Reisen". Technik-Blogger vielleicht "Wissen/Technik".

So weit mal zu diesem Plugin und zum Thema SEO.

Ich hoffe, einige finden hier ein paar Anregungen.

User avatar
yellowled
Regular
Posts: 7111
Joined: Fri Jan 13, 2006 11:46 am
Location: Eutin, Germany
Contact:

Re: Tipps + Fragen zum Plugin Suchmaschinen-Sitemap Generato

Post by yellowled » Mon Sep 07, 2015 5:57 pm

Czorneboh wrote:Gehört das Plugin (engl: serendipity_event_google_sitemap) zum Kern der Version 2.0? Oder fehlt sie nach einer Neuinstallation und damit auch noch die sitemap.xml-Datei?
Nein, es gehört nicht zum Kern, sondern muss per Spartacus oder manuell nachinstalliert werden.
Czorneboh wrote:Gehe ich richtig in der Annahme, dass die Crowler der Suchmaschinen gz-Dateien lesen können?
Ja.
Czorneboh wrote:SEO-Tools im Browser zeigen mir an, dass sie meine sitemap nicht gefunden haben. Die Datei sitemap.xml.gz ist aber im Verzeichnis /blog/ vorhanden.
Es wäre immerhin möglich, dass diese „SEO-Tools“ Mist anzeigen. Kann ich nicht beurteilen.

Die zweite Variante wäre, das Suchmaschinen-Crawler die sitemap.xml.gz immer im DocumentRoot erwarten. Das bin ich spontan überfragt.
Czorneboh wrote:Ich frage mich, ob die unter "URL-Liste für Pings"
gezeigte url
http://www.google.com/webmasters/tools/ ... sitemap=%s
submissions.ask.com existiert nicht mehr. Und ehe Du schimpfst, wieso es dann noch drin steht – veraltete Dienste aus Plugin-Einstellungen zu entfernen hat nun mal keine besonders hohe Priorität in der Entwicklung, insbesondere bei Nicht-Kern-Plugins und zumal man diese veralteten Dienste erstmal suchen müsste. Kleines Team, limitierte zeitliche Ressourcen.
Czorneboh wrote:Was für Gründe gibt es, nicht zu packen (wenn Crowler die gz-Datei lesen können?
Es gibt leider immer noch Webserver, die keine gzip-Kompression leisten. Den Crawlern ist es egal, ob sie .xml oder .xml.gz bekommen.
Czorneboh wrote:Frage Wird von hier aus die Einstellung in der robots.txt geschrieben? (Ich weiß nicht wie das gehen sollte).
Anscheinend, und wenn, dann wird die robots.txt mit PHP umgeschrieben. Alternativ (das ist wahrscheinlicher) wird über die .htaccess etwas redirected. Genauer weiß ich es leider nicht.
Czorneboh wrote:Gibt es noch die Regelung, dass eine sitemap auf 1.000 urls beschränkt ist?
Steht (schon seit 2010) bei 50.000 URL bzw. 50 MB, wobei letzteres unkomprimiert gemessen wird (also vor gzip).

(Generelle Anmerkung: Man kann Sitemaps und ihre Bedeutung für SEO auch überbewerten.)

YL
amazon Wishlist - Serendipity-Podcast (German only, sorry)

xoxyss
Regular
Posts: 91
Joined: Wed May 27, 2015 12:13 am
Location: Baden-Württemberg
Contact:

Re: Tipps + Fragen zum Plugin Suchmaschinen-Sitemap Generato

Post by xoxyss » Wed Dec 16, 2015 8:46 am

Hi,
ich benutze für die Sitemap das Plugin serendipity_event_google_sitemap. Wo genau die Sitemap durch das Plugin gespeichert wird kann ich nicht sagen, ich kann aber bei Interesse mal nachschauen.

Ich hatte bei mir mit gepackter Sitemap ein paar Probleme und habs deshalb ausgeschaltet. Die paar bytes machen es bei der kleinen Datei auch nicht :-)

Ich benutze nur noch Google und Bing:
http://www.google.com/webmasters/tools/ ... siteMap=%s

Bei URL-Typen habe ich nur "Statische Seiten" eingestellt, Blogeinträge (die ja eigentlich zum Typ "Archiv" gehören) werden komischerweise automatisch erfasst.

An sonsten stimme ich YL natürlich zu man muss es nicht unbedingt übertreiben ;-)

User avatar
yellowled
Regular
Posts: 7111
Joined: Fri Jan 13, 2006 11:46 am
Location: Eutin, Germany
Contact:

Re: Tipps + Fragen zum Plugin Suchmaschinen-Sitemap Generato

Post by yellowled » Wed Dec 16, 2015 12:43 pm

xoxyss wrote:Wo genau die Sitemap durch das Plugin gespeichert wird kann ich nicht sagen, ich kann aber bei Interesse mal nachschauen.
Da, wo Bots sie erwarten: Im Wurzelverzeichnis des zugehörigen Blogs.

YL
amazon Wishlist - Serendipity-Podcast (German only, sorry)

xoxyss
Regular
Posts: 91
Joined: Wed May 27, 2015 12:13 am
Location: Baden-Württemberg
Contact:

Re: Tipps + Fragen zum Plugin Suchmaschinen-Sitemap Generato

Post by xoxyss » Wed Dec 16, 2015 1:11 pm

yellowled wrote:Die zweite Variante wäre, das Suchmaschinen-Crawler die sitemap.xml.gz immer im DocumentRoot erwarten. Das bin ich spontan überfragt.
Da du dir auch nicht sicher warst hatte ich nur angeboten nachzusehen ;-)

Post Reply