Page 1 of 1

[Erledigt] KARMA: Webcrawler.com

Posted: Fri Sep 04, 2015 11:21 am
by HadleyB
Hallo zusammen!

Seit drei Tagen besucht mich dieser Webcrawler

http://www.seokicks.de/robot.html

und läßt alle Artikel mit einem "Übel" im Karma zurück. Warum darf der das? Wie macht der das? Wie kann ich den ausschließen?

Re: KARMA: Webcrawler.com

Posted: Fri Sep 04, 2015 11:38 am
by garvinhicking
Am besten per robots.txt ganz aussperren?

Kannst ansonsten in deiner serendipity_config_local.inc.php so etwas schreiben wie:

Code: Select all

if (stristr($_SERVER['HTTP_USER_AGENT'], 'seokicks')) {
  die('Dies ist dein Inhalt.');
}
Man könnte die IF-Abfrage uach theoretisch noch so anreichern dass es nur greift wenn gewisse Karmavoting-URL-Parameter gesetzt sind.

LG,
Garvin

Re: KARMA: Webcrawler.com

Posted: Fri Sep 04, 2015 12:29 pm
by HadleyB

Code: Select all

if (stristr($_SERVER['HTTP_USER_AGENT'], 'seokicks')) {
  die('Dies ist dein Inhalt.');
}
Danke, ich nehm' mal das hier. Der war schon wieder da. Dann sollte ja jetzt Ruhe sein.

Re: [Erledigt] KARMA: Webcrawler.com

Posted: Fri Sep 04, 2015 6:23 pm
by HadleyB
Das funktioniert einwandfrei. Seolink findet übrigens:

Code: Select all

Normalerweise dürfte der Aufruf eines Links niemals zur Abgabe einer Bewertung führen, hierfür setzt man Techniken wie versteckte Formularfelder oder Postbacks ein. Wenn die Funktion dennoch per Verlinkung gelöst werden muss, dann sollten Sie den entsprechenden Pfad zumindest per robots.txt Eintrag sperren. Andernfalls würde der Link wohl durch zahlreiche Webcrawler aufgerufen, vermutlich sogar direkt durch die Google Crawler. Es sollte daher unbedingt eine generelle Lösung gefunden werden, damit Webcrawler niemals das aktuell beobachtete Verhalten auslösen können.

Neuere Webbrowser rufen im Hintergrund übrigens ebenfalls die auf einer Seite verlinkten Seiten schon vorab ab, um die Seiten sofort darstellen zu können falls ein Link angeklickt wird. Auch dies könnte zu Bewertungen führen, die der Nutzer selbst so niemals vorgenommen hat. Es ist daher allgemein wirklich keine gute Wahl eine so wichtige Funktion über klassische Links zu realisieren.
Das passiert aber ausschließlich bei deen Crawler, die anderen Bots lassen mein Karma in Ruhe!