[Erledigt] KARMA: Webcrawler.com

Hier können Probleme und alles andere in Deutscher Sprache gelöst werden.
Post Reply
HadleyB
Regular
Posts: 837
Joined: Sat Feb 11, 2006 11:47 pm

[Erledigt] KARMA: Webcrawler.com

Post by HadleyB »

Hallo zusammen!

Seit drei Tagen besucht mich dieser Webcrawler

http://www.seokicks.de/robot.html

und läßt alle Artikel mit einem "Übel" im Karma zurück. Warum darf der das? Wie macht der das? Wie kann ich den ausschließen?
Last edited by HadleyB on Fri Sep 04, 2015 6:22 pm, edited 1 time in total.
mfg
Hadley
garvinhicking
Core Developer
Posts: 30022
Joined: Tue Sep 16, 2003 9:45 pm
Location: Cologne, Germany
Contact:

Re: KARMA: Webcrawler.com

Post by garvinhicking »

Am besten per robots.txt ganz aussperren?

Kannst ansonsten in deiner serendipity_config_local.inc.php so etwas schreiben wie:

Code: Select all

if (stristr($_SERVER['HTTP_USER_AGENT'], 'seokicks')) {
  die('Dies ist dein Inhalt.');
}
Man könnte die IF-Abfrage uach theoretisch noch so anreichern dass es nur greift wenn gewisse Karmavoting-URL-Parameter gesetzt sind.

LG,
Garvin
# Garvin Hicking (s9y Developer)
# Did I help you? Consider making me happy: http://wishes.garv.in/
# or use my PayPal account "paypal {at} supergarv (dot) de"
# My "other" hobby: http://flickr.garv.in/
HadleyB
Regular
Posts: 837
Joined: Sat Feb 11, 2006 11:47 pm

Re: KARMA: Webcrawler.com

Post by HadleyB »

Code: Select all

if (stristr($_SERVER['HTTP_USER_AGENT'], 'seokicks')) {
  die('Dies ist dein Inhalt.');
}
Danke, ich nehm' mal das hier. Der war schon wieder da. Dann sollte ja jetzt Ruhe sein.
mfg
Hadley
HadleyB
Regular
Posts: 837
Joined: Sat Feb 11, 2006 11:47 pm

Re: [Erledigt] KARMA: Webcrawler.com

Post by HadleyB »

Das funktioniert einwandfrei. Seolink findet übrigens:

Code: Select all

Normalerweise dürfte der Aufruf eines Links niemals zur Abgabe einer Bewertung führen, hierfür setzt man Techniken wie versteckte Formularfelder oder Postbacks ein. Wenn die Funktion dennoch per Verlinkung gelöst werden muss, dann sollten Sie den entsprechenden Pfad zumindest per robots.txt Eintrag sperren. Andernfalls würde der Link wohl durch zahlreiche Webcrawler aufgerufen, vermutlich sogar direkt durch die Google Crawler. Es sollte daher unbedingt eine generelle Lösung gefunden werden, damit Webcrawler niemals das aktuell beobachtete Verhalten auslösen können.

Neuere Webbrowser rufen im Hintergrund übrigens ebenfalls die auf einer Seite verlinkten Seiten schon vorab ab, um die Seiten sofort darstellen zu können falls ein Link angeklickt wird. Auch dies könnte zu Bewertungen führen, die der Nutzer selbst so niemals vorgenommen hat. Es ist daher allgemein wirklich keine gute Wahl eine so wichtige Funktion über klassische Links zu realisieren.
Das passiert aber ausschließlich bei deen Crawler, die anderen Bots lassen mein Karma in Ruhe!
mfg
Hadley
Post Reply