Archives For alexa

Alexa bemüht sich im Rennen gegen Google, wer die meisten Daten herausgeben kann und so sah ich gerade folgende Anzeige auf alexa.com:

Der direkt verlinkte Download kann sich sehen lassen. Nicht mehr die Top 500 (oder die Top 100 auf Länderebene), sondern die Top 1 Million Einträge von Alexa gibt es jetzt komfortabel als CSV zum Download (top-1m.csv.zip 9,5 MB Zipfile, ausgepackt 21,4 MB) . Datenbestand ist recht frisch (24. November sagt die Timestamp) Diese Liste hätte über die Amazon Web Services 2500 US$ gekostet. Dumm, wer jetzt noch mit Office 2003 arbeitet und mit dem Zeilenlimit von 65536 leben muss…

Einige Beobachtungen zum Inhalt: Mir und einigen Freunden ist durch diesen CSV-Download erst jetzt aufgefallen, dass Alexa neuerdings(?) auch die Subdomains einzelner Bloghoster gesondert zählt. wordpress.com, blogspot.com, blog.br, blogs.com und andere (Sub-)Domains auf denen sich unabhängige Inhalte befinden, werden jetzt korrekterweise gesondert gezählt. Auch werden durch ~username oder my.domain.tld/user/name Syntax benannte Einträge seperat erfasst, was allerdings zu einigen fehlerhaften Einträgen in der Liste führt, da z.B. die feeds.domain.tld/~r/ Verzeichnisse einiger Feedburner-Nutzer erfasst werden.

Ansonsten gilt aber nur: Danke Amazon/Alexa für dieses etwas verfrühte Weihnachtsgeschenk 🙂

read my english translation on randolf.jorberg.com