Unicode

Ich habe es lange herausgezögert, aber jetzt führt kein Weg daran vorbei: ich stelle meine Seiten um auf Unicode - genauer: auf UTF-8.

Bei meinem ersten Versuch, online zu gehen, hatte ich schlicht keine Ahnung von Unicode - ziemlich beschämend für jemanden, der schon zu der Zeit fünfzehn Jahre im Software-Business unterwegs war. Wie auch immer: ich habe mit HTML-Seiten angefangen, die noch nach ISO-8859-1 codiert waren - und da ich später zu faul war, die ersten Sachen zu Fuß umzustellen, muß ich jetzt den harten Weg gehen, und mehr als 300 Blogeinträge, eine Serie von "losen" Texten sowie einige PHP-Dateien via Skript konvertieren. - Das Skript ist geschrieben, alle Daten sind gesichert, ich starte das jetzt - und erwarte gar nicht, daß das auf Anhieb klappt. Wenn irgendwo komische Zeichen im Blog erscheinen: das gibt sich wieder.

[Done:] So - geschafft. Das war wider Erwarten relativ einfach (von dem einen oder anderen Kollateralschaden abgesehen, wie z.B. einigen nach UTF-8 konvertierten JPEG-Fotos). Ich werde noch ein wenig durch die Seiten scrollen, um die eine oder andere Unstimmigkeit zu beseitigen (das Euro-Zeichen scheint es nicht so recht überlebt zu haben, dabei ist PHP's utf8_encode() eigentlich narrensicher); für jeden, der ein wenig programmieren kann, und nicht recht kapiert, worum es gerade geht, sei dringend dieser Artikel von Joel Spolsky empfohlen.