Microformats und die Bots

Sebastian schreibt in seinem Beitrag zum Einsatz von Microformats folgendes:

Zunächst fand ich die Herangehensweise sehr praktisch, da bestehende Standards benutzt werden. Im Grunde ist es nichts anderes als xml mit anderem Namen. Bei weiterer Betrachtung finde ich es aber doch ein wenig bedenklich wenn ich da so an diverse e-mail Spam Bots denke. Bei dem Gedanken das dann auch meine Wohnort, meine Tagesplanung (hCal) und vieles mehr ausgelesen werden kann. Und das vollautomatisch. Einfach den Bot starten und Daten harvesten.

Diesen - ich sage mal auf den ersten Blick nachvollziehbaren - Einwand äußerten auch einige der anwesenden Zuhörer auf dem ersten Bremer Webmontag, wo ich eine kleine Einführung in den Einsatz von Microformats gab. Da die “Und was ist mit den Spambots?”-Frage einiges an Diskussionsstoff bietet, wollte ich mal meine Meinung dazu kundgeben.

Private Daten im semantischen Web

Zunächst sollte man feststellen, dass es sich bei dem Thema nicht um eine reine Microformats-Problematik handelt - es betrifft das gesammte semantische Web, in dem Daten maschinenlesbar aufbereitet werden. Egal ob ich meine Anschrift, Telefonnummer oder ähnliches als hCard oder per RDFa publiziere - ich gebe Webcrawlern damit die Möglichkeit meine Daten aufzunehmen und zu verwerten.

Nun wissen wir, dass es in diesem Fall zwei Arten von Crawlern gibt: Harvester die Adressen zum zuspammen sammeln (sozusagen die Bösen) und Dienste, die uns dafür belohnen, dass wir unsere Daten maschinenlesbar aufbereiten, indem sie uns einen darauf basierenden Mehrwert bieten (hier sei zum Beispiel wieder mal auf Technorati verwiesen).

Das Web, die Henne und das Ei

Etwas problematisch wird es, wenn man den sich aktuell bietenden Mehrwert hinterfragt: Selbst als Microformats-Evangelist muss man zugeben, dass es zur Zeit noch ein wenig an Diensten mangelt, die eben diesen wirklich bieten. Wir befinden uns derzeit in einer Phase, in der Microformats sehr gut angenommen werden und in der ein wichtiger Schritt in Richtung semantisches Web genommen wird.

Wir erleben zur Zeit den Netzwerk-Effekt, bei dem sowohl Webentwickler Mikroformate implementieren, als auch Anbieter diese Implementierung nutzen, um die darauf aufbauenden Mehrwert-bietenden Anwendungen zu entwickeln. Die Henne-Ei-Problematik: Wie soll es das eine ohne das vorangehende geben?

Und nu?

Die Antwort mag nicht wirklich zufrieden stellen, da es momentan nur vereinzelt gewinnbringende Anwendungsbereiche gibt, allerdings würde ich auch hier mit den Worten schließen, die ich den Zuhörern der Einführung mit auf den Weg gegeben hab: „Benutzt Microformats!“

Dieser Ratschlag basiert auf der sich zeigenden Entwicklung, dass Microformats schon in ihrer noch frühen Entwicklung (erst knapp 1,5 Jahre alt das Thema) sehr gut angenommen werden und sich die wirklichen Mehrwerte und Möglichkeiten erst mit zunehmendem Entwicklungsstatus offensichtlich zeigen werden. Ich bin fest davon überzeugt, dass der Nutzen, den wir in den kommenden Jahren aus der Implementierung von Microformats ziehen werden die Nachteile überwiegen wird.

Um nochmal auf das Veröffentlichen von Daten zurückzukommen: Sebastian Küpers und Raju Bitter gehen auf dieses Thema in ihrem Podcast zu StructurredBlogging näher ein und schließen mit einem Hinweis, der für jeden auch selbstverständlich sein sollte, der Informationen im Internet veröffentlicht: Macht euch Gedanken darüber, was ihr warum publiziert - es liegt an jedem selbst, wie viel (persönliche) Daten er preisgeben will und die Konsequenzen zu beurteilen. Dabei sollte jeder für sich wissen, ob die Vor- oder Nachteile überwiegen und gegebenenfalls von der Veröffentlichung absehen. Es wird ja auch niemand gezwungen, seine Daten maschinenlesbar aufzubereiten (noch nicht ;))

iOS app for GitHub

iOctocat

ist GitHub für die Hosentasche - deine Projekte und das was dort passiert immer dabei mit deinem iPhone und iPod Touch.
Die App ist