Nun, sobald du Zeichenketten in ANSI/ASCII abspeichern kannst,
kannst du auch die Nummer jeglichen Zeichens abspeichern,
welches in unicode definiert wurde - kannst es auch in
allen XMLs ausgeben und auch in HTML, dort sind das dann
solche Gebilde: ß
Von der Idee her ordnet unicode erstmal nur jedem Zeichen
eine Nummer zu, was dann damit angestellt wird, ist nochmal
ein anderes Problem.
Interpretiert wird das wohl mittlerweile von jedem halbwegs
aktuellen browser. Ein ganz anderes Problem ist dabei, ob in
der verfügbaren Schriftart für solch ein Zeichen auch ein
graphisches Symbol vorhanden ist, ob der Glyph also selbst
darstellbar ist oder nur das Symbol für einen fehlenden
Glyphen verwendet wird, der in jeder Schrftart vorhanden sein
sollte.
ISO 8859-1, UTF-8 oder UTF-16 setzen Teilbereiche des unicodes
um, jeweils mit eigener Kodierung. Bei UTF-16 beziehungsweise
UTF-8 passen die Zahlenkombinationen für die Zeichen, sofern
vorhanden, ISO-Kodierungen sind hingegen wohl älter als unicode
und vom System her paßt da zwangsläufig nie alles zusammen,
wenn was anderes als ISO 8859-1 verwendet wird.
Wenn man nur die Zeichen braucht, die UTF-8 abdeckt, sollte
das auch funktionieren. Bei PHP sollte man noch mal genau in
der Dokumentation gucken, wie die sich das vorstellen.
Man erfährt da etwa, daß eigentlich nur die üblichen 256
Zeichen verfügbar sind:
php.net/manual/de/language.types.string.php
Es gibt aber offenbar Funktionen, mit denen man Zeichenketten
in UTF-8 erzeugen kann:
php.net/manual/de/function.utf8-encode.php
Wie es andersherum funktionieren soll, wenn wirklich der
komplette Umfang von UTF-8 benutzt wird, wird allerdings nicht
erklärt:
php.net/manual/de/function.utf8-decode.php
Sollte man mal mit einem exotischeren UTF-8-Text probieren,
der Zeichen aus den verschiedensten Sprachen der Welt
enthält - bestimmt interessant, was dabei herauskommt ;o)
Allerdings muß das PHP selbst nicht zwangsläufig verstehen, was
es verarbeitet, wichtiger ist dann, daß man dem browser korrekt
kundtut, was es wirklich ist, damit dieser das geeignet darstellen
kann ;o) Dazu muß der header eines ausgegebenen Dokumentes
dann jeweils die passenden Kodierungsangaben enthalten.
Details werden ja auch immer wieder gern bei wikipedia
kundgetan:
de.wikipedia.org/wiki/Unicode