tutorials.de Buch-Aktion 05/2012
ERLEDIGT
JA
ANTWORTEN
7
ZUGRIFFE
1269
EMPFEHLEN
  • An Twitter übertragen
  • An Facebook übertragen
AUF DIESES THEMA
ANTWORTEN
  1. #1
    Avatar von Klein0r
    Klein0r Klein0r ist offline Mitglied Platin
    Registriert seit
    Sep 2007
    Ort
    Paderborn
    Beiträge
    718
    Hallo zusammen!

    Ich suche eine Liste mit den Namen der Agents (wie sich die einzelnen Crawler/Search-Bots ausgeben) damit ich denen eine optimierte Seite (ohne Bilder etc.) liefern kann wenn sich ein Bot auf meine Seite verirrt. Außerdem will ich vermeiden, dass diese im Besuchercounter auftauchen.

    Hat da jemand was?

    Bisher selbst "entlarvte" Robots:
    Code :
    1
    2
    3
    4
    5
    6
    
    msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)
    msnbot/1.1 (+http://search.msn.com/msnbot.htm)
    Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
    Mozilla/5.0 (Twiceler-0.9 http://www.cuil.com/twiceler/robot.html)
    Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
    Yanga WorldSearch Bot v1.1/beta (http://www.yanga.co.uk/)
    (einige davon sind mir auch komplett neu...)

    Mit der Zeit werde ich sicher was gesammelt haben.
    Aber ich bin doch nicht der einzige der sowas schonmal gemacht hat, oder?

    lg
    Geändert von Klein0r (21.09.08 um 19:55 Uhr)
     
    - Ich fotografiere mit Nikon -
    Mehr zur Ausrüstung in meinem Profil

    :: klein0r.de :: kleine-photo.com :: flickr ::

  2. #2
    Avatar von Flex
    Flex Flex ist offline (aka Felix Jacobi)
    tutorials.de Moderator
    Registriert seit
    Nov 2001
    Ort
    Wuppertal
    Beiträge
    5.295
    Blog-Einträge
    65
    RobotsTXT.org

    Sonst fällt mir keine größere Datenbank dafür mehr ein.
     
    KIDS Kinderbetreuungsdienst
    Xing

    "When you play the game of thrones, you win or you die. There is no middle ground."
    by Cersei Lannister in "A Game Of Thrones"

  3. #3
    Avatar von Sven Mintel
    Sven Mintel Sven Mintel ist offline Mitglied
    Registriert seit
    Aug 2003
    Beiträge
    18.238
    Blog-Einträge
    6
    Nur so als Hinweis: Suchmaschinen mögen es nicht, wenn man ihnen anderen Inhalt liefert als normalen Besuchern, du riskierst damit, aus dem Index entfernt zu Werden.

    Zum Thema
    Wenn du dir Awstats herunterlädtst, findest du darin eine Datei namens "robots.pm"

    Diese enthält reguläre Ausdrücke, an denen du robots erkennst
     

  4. #4
    Avatar von Klein0r
    Klein0r Klein0r ist offline Mitglied Platin
    Registriert seit
    Sep 2007
    Ort
    Paderborn
    Beiträge
    718
    Wie genau wollen die das denn rausbekommen ob die anderen Inhalt bekommen?
    Glaube nicht das sich da eine Masse von Mitarbeitern hinsetzt und den Inhalt den die Suchmaschine bekommen hat mit dem von normalen Browsern vergleicht

    Weiß auch noch nicht ob ich das mit dem anderen Inhalt umsetze.
    Aber mir gehts erstmal darum das die Crawler nicht als Besucher im Couter auftauchen!
    Die verfälschen das Ergebnis total...

    lg
     
    - Ich fotografiere mit Nikon -
    Mehr zur Ausrüstung in meinem Profil

    :: klein0r.de :: kleine-photo.com :: flickr ::

  5. #5
    Maik Tutorials.de Gastzugang
    Zitat Zitat von Klein0r Beitrag anzeigen
    Wie genau wollen die das denn rausbekommen ob die anderen Inhalt bekommen?
    Guckst du hier -> Cloaking Erkennung: Webseitenanalyse

    Ansonsten Cloaking -> http://de.wikipedia.org/wiki/Cloaking

    mfg Maik
     

  6. #6
    Avatar von Klein0r
    Klein0r Klein0r ist offline Mitglied Platin
    Registriert seit
    Sep 2007
    Ort
    Paderborn
    Beiträge
    718
    Hey danke wieder was gelernt

    Bei deinem ersten Link sind auf meiner Homepage sogar alle Bilder schon ausgeblendet... Gut - warum sollte ein Bot die Bilder auch abfragen...

    Kennt jemand ein Plugin für FF (oder anderen Browser) mit dem es möglich ist einen anderen Referer zu senden? Würde gerne mal mit den "Augen" eines Crawlers surfen
    EDIT >> schon erledigt...

    Achso und wie ist der Wikipedia-Satz gemeint:
    Weiterhin besitzen die Spider und Browser jeweils eine Art „Footprint“, durch den man beide unabhängig vom UserAgent recht gut unterscheiden kann.
    lg
     
    - Ich fotografiere mit Nikon -
    Mehr zur Ausrüstung in meinem Profil

    :: klein0r.de :: kleine-photo.com :: flickr ::

  7. #7
    Avatar von Homer Simpson
    Homer Simpson Homer Simpson ist offline Mitglied Silber
    Registriert seit
    Nov 2003
    Ort
    Aachen
    Beiträge
    79
    Zitat Zitat von Klein0r Beitrag anzeigen
    Bei deinem ersten Link sind auf meiner Homepage sogar alle Bilder schon ausgeblendet... Gut - warum sollte ein Bot die Bilder auch abfragen...
    Wär das nicht bspw. interessant für die Google-Bildersuche?
     

  8. #8
    Avatar von Klein0r
    Klein0r Klein0r ist offline Mitglied Platin
    Registriert seit
    Sep 2007
    Ort
    Paderborn
    Beiträge
    718
    Kann ja sein das die Adressen gespeichert werden und nen anderer Bot nachher alle Bilder abfragt - keine Ahnung

    Aber ich bin ehrlich zu doof... Habe eben Referrer mit Agent verwechselt. Natürlich suche ich eine Liste aller Agent-Namen der Bots!
    Wenn man danach sucht findet man gleich viel mehr...

    http://www.bots-on-para.de/
    http://www.user-agents.org/index.shtml

    Das hat man davon wenn man den halben Sonntag programmiert Da wird man langsam ein wenig wirr... Aber ich glaube ihr habt mein Problem schon verstanden :P Zumindest ist es ansonsten wohl keinem aufgefallen?!

    Evt kann ein Mod oder Admin das Thema ja auch umbenennen damit andere nicht
    verwirrt werden oder das Thema über die Suche leichter gefunden wird Danke und sorry

    - fixed by Maik -

    lg
    Geändert von Klein0r (21.09.08 um 20:19 Uhr)
     
    - Ich fotografiere mit Nikon -
    Mehr zur Ausrüstung in meinem Profil

    :: klein0r.de :: kleine-photo.com :: flickr ::

Ähnliche Themen

  1. C++ Crawler
    Von fabianh im Forum C/C++
    Antworten: 0
    Letzter Beitrag: 25.08.10, 16:49
  2. Website Crawler
    Von lajilla im Forum HTML & XHTML
    Antworten: 2
    Letzter Beitrag: 28.07.10, 15:41
  3. Domain Crawler
    Von KingDiggyDag im Forum PHP
    Antworten: 9
    Letzter Beitrag: 04.05.09, 02:49
  4. SEO und Crawler
    Von Webgau im Forum PHP
    Antworten: 5
    Letzter Beitrag: 09.01.09, 12:38
  5. kleiner Crawler
    Von maxikey im Forum PHP
    Antworten: 22
    Letzter Beitrag: 27.06.08, 22:11