iDisk? Eigener WebDAV-Server die bessere Alternative!

iDisk war mir persönlich immer zu teuer. Vor allen Dingen benötigte ich immer nur eine Funktionalität, nämlich den Speicherplatz auf den Apple-Servern, um dort Dateien auszulagern, so dass ich sie auf mehreren Rechnern nutzen konnte. Auf diesen ganzen iPhoto, Webseiten und Adressbuch-Kram konnte ich gut verzichten.
Was mich allerdings immer noch gestört hat — neben den 100 EUR im Jahr — war die extrem langsame Zugriffszeit auf meine iDisk und der begrenzte Speicher.
Naja und da hab ich mir gedacht, dass eine Alternative her muss. Und siehe da: Debian + Apache2 + WebDAV war die Lösung. Zu dieser Installation gibt es sogar eine Anleitung unter www.debian-administration.org/articles/285. Und letztendlich basiert die iDisk anscheinend ja auch auf WebDAV (Web-based Distributed Authoring and Versioning).
Nun gut, jetzt hab ich einen schnelleren und größeren externen Speicher und die Kosten für den Server hatte ich ja sowieso schon immer. 😉
Zudem hab ich mir mit dem Automator folgendes 2-Komponenten-Skript zusammengeklickt, welches ich beim Hochfahren des Rechners ausführe und somit gleich zum WebDAV-Server verbinde:

WebDAV Automator Skript

Wer natürlich die ganzen Gimmick-Funktionalitäten der iDisk benötigt, für den reicht diese Lösung dann aber doch nicht. 😉

Privacy Survival Guide for social networks

My last posting dealt with privacy in social networks. In one of the comments Tristan Louis made the following statement:

The balance between privacy and openness is an interesting one. I’m not sure of how to address it… yet :)

I thought about it and my first idea was: Disguise your data.

Its not bad if social networks share their data. The bad thing is, if your profile-data from network A can by easily connected to your profile-data from network B. With “easily” i mean especially in an automated way.

So where are the possible junctures between profiles?

  • First of all your Email-Address. Its an unique identifier.
  • Your chosen username.
  • Your name. Not unique but a possible connection.
  • Your address.
  • A picture of you. Modern image recognition algorithms are available and can answer the question if two pictures are equal or not.
  • The contacts you invite.
  • The URL of your homepage.

So what can you do to avoid the connection of profiles?

  1. One social network = one new email-address. Use different email-addresses in every network.
  2. Use different usernames.
  3. Yes, also use different names. Ok, you don’t need to rename yourself into ‘Peter’ if your name is ‘Daniel’. But make little changes in your first- and especially in your lastname (the firstname is often used if the social platform gets in contact with you. The lastname is not so important.)
  4. Always use a fake address. No social platform needs your real address.
  5. If you want to use a personal picture in the social network always use a new one for each network you take part in.
  6. Do not always invite the same people in every network. Your personal circle of friends is also like a huge identifier.
  7. Avoid to reveal the URL of your personal homepage.
  8. Change your day of birth. Minor “modifications” are sufficient (e.g. change your day +/- 5)

If you follow these tips, every network you use will get a unique profile. So its nearly impossible to find a connection of profiles between different networks — in an automated way.
Ok, if a real human wants to get the connection he will get it. But you can complicate it. 😉

Managing your identity

I just thought about identity-management on the internet and build the following figure:
your internet identity
It shows your identity as a person (including realname etc.) and connects different partial-identities to it.
A partial-identity is a subset of your whole identity-information. You create such subsets with nearly every service you use on the internet.
For example by using a social bookmark service, your partial-identity is the information about your preferred bookmarks.
Such subsets of your identity are not very delicate if you can’t connect them to your whole identity. If you are able to connect them, the information from the partial-identity become authentic. And thats a problem for your privacy.
So the best way to protect your identity is to avoid information which can connect the subsets among each other. And also avoid information which can directly map a subset to your identity. You can use for example different email-addresses for each service.

Automatisierter Datenschutz mit P3P

Wer kennt es nicht? Man geht auf eine Webseite und muss dort persönliche Daten eingeben. Aber wer liest sich schon immer die Datenschutz (Privacy) Richtlinien der Seite durch und entscheidet dann aufgrund dessen was er an Informationen herausgibt? Richtig, fast niemand.
Aber wäre es nicht schön, wenn z.B. der Browser den Benutzer automatisch darauf hinweisen würde, was dieser am besten preisgeben sollte und was nicht?
Und genau hierfür braucht man standardisierte Angaben zu den Datenschutz-Richtlinien einer Webseite. So können diese automatisiert verarbeitet und interpretiert werden.
Hier setzt das “Platform for Privacy Preferences Project (P3P) vom W3C an und definiert das entsprechende Format für diese Angaben. Format ist XML und es gibt sogar ein RDF-Schema dafür.
Das werde ich auf jeden Fall mal weiterverfolgen.

Web 2.0, soziale Netze und der Datenschutz

Was hat man nicht alles in den letzten Monaten lesen koennen: Web 2.0 — das neue Web, unendliche Moeglichkeiten, die neue Generation des Internets usw.
Und ich muss gestehen, dass der ganze Hype einige schoene Ideen mit sich gebracht hat.

Doch in Mitten dieser Welt aus huebschen Kanten und Knoten, Bildern und persoenlichen Informationen, geraet der Datenschutz in Vergessenheit. Die Leute oeffnen ihr ganzes Leben der Internetgemeinde. Sei es nun, dass man alle seine Freunde und Bekannte preisgibt, seine Lieblingsplaetze auflistet oder den aktuellen Arbeitgeber bzw. damalige Arbeitgeber zur Verfuegung stellt.

In einem Umfeld in dem alle Nutzer ehrliche, nette Menschen sind und keiner die Daten missbrauchen moechte, ist das auch alles schoen und gut und kann u.U. sogar sinnvoll sein. Aber die Realitaet sieht anders aus.

Schauen wir uns doch mal eine Plattform an, die die sogenannte “Web2.0”-Technologie nutzt: Da haben wir zum Beispiel die Bewertungs-Plattform QYPE.com.

Hier suchen wir uns speziell einen fleissigen Benutzer wie z.B. Herrn U aus H. Was haben wir denn da alles?

  • Realname und natuerlich ein Bild
  • nun werden wahrheitsgemaess alle Lieblings-Locations angegeben. Dank Google-Maps haben wir auch gleich die passenden Koordinaten. Hieraus koennte man doch ein klasse Bewegungsprofil erstellen.
  • Da Herr U auch seinen Hausarzt und seinen Lieblingsbaecker fuers Wochenende angegeben hat, koennte man Rueckschluesse auf die Lage seiner Wohnung ziehen. Je mehr Anhaltspunkte man hat, desto mehr kann der Bereich eingegrenzt werden.
  • Durch Angabe von Autovertragswerkstaetten kann man sich ueberlegen welche Automarke der Herr faehrt.
  • Zudem sind noch reichlich Freunde in seinem Netz vorhanden. Viele auch mit realen Namen.
  • Es wird sogar die aktuelle Firma angegeben.
  • Wir erfahren, dass er einen kleinen Sohn hat, der gerne in den Zoo geht.

So geht das weiter und man kann ein schoenes Profil zusammenbekommen. Und das alles ohne viel Aufwand und auch gerne automatisiert.
Die oben genannte Bewertungsseite ist nur ein Beispiel fuer eine Plattform wo Benutzer ein schoenes Profil pflegen.
Andere Plattformen wie orkut (sexuelle Interessen, …) oder openBC (ex-firmen, geschaeftskontakte, …) gehen da noch viel weiter.

Alle Plattformen sind wirklich interessant und teilweise sinnvoll, aber der Benutzer sollte auf seine persoenlichen Daten doch mehr achten.

WordNet im Semantic Web Bereich

Ich beschaeftige mich seit kurzer Zeit mit WordNet — einer lexographischen Datenbank, die Woerter untereinander nach linguistischen Methoden in eine semantische Beziehung setzt.

Das ist ganz interessant und man lernt eine ganze Menge neuer Woerter kennen, von denen ich vorher noch nie etwas gehoert habe: Hyponym, Holonym, Hypernym, Meronym und so weiter. 😉 Diese Begriffe bezeichnen unterschiedliche Beziehungen, die Woerter untereinander haben koennen.

Nun gut, jetzt ueberlege ich schon die ganze Zeit, wie man das sinnvoll im Semantic Web Bereich verwenden kann. Matt Biddulph hat zum Beispiel vor einiger Zeit vorgeschlagen, dass man mit Hilfe von WordNet Bilder beschreiben kann. Wenn auf dem Bild beispielsweise ein Hund zu sehen ist, dann zieht man aus WordNet automatisch einige weitere Begriffe, welche als Metadaten fuer das Bild dienen (z.B. Tier, Raubtier, Koeter, …).

Die Idee finde ich ganz interessant und man kann sie ja auch noch erweitern. Zum Beispiel koennte man solche Metadaten fuer jede Art von Daten automatisch generieren lassen. Beispielsweise koennten Artikel, die ins Netz gestellt werden, nach Schlagworten durchsucht werden, die den Inhalt gut charakterisieren. Mit diesen Schlagworten koennte man dann WordNet “fuettern” und so automatisch z.B. Keywords erzeugen und diese mit auf der Seite speichern oder die Schluesselwoerter fuer eine Kategorisierung verwenden.

Ich denke, dass WordNet eine Menge interessanter Moeglichkeiten bietet. Ich werde mich auf jeden Fall noch weiter damit beschaeftigen und vielleicht kommt ja irgendwann mal ein Geistesblitz. :-)