Hi,
was hat es eigentlich mit den verschiedenen HTML-Kodierungen auf sich?
oder
Wo ist der Unterschied zwischen beiden bzw. was bringen die einzelnen für Vorteile?
MfG, xcube
Hi,
was hat es eigentlich mit den verschiedenen HTML-Kodierungen auf sich?
oder
Wo ist der Unterschied zwischen beiden bzw. was bringen die einzelnen für Vorteile?
MfG, xcube
iso-8859-1 ist ein 1-byte zeichensatz.
d.h. es ist auf direkte art nur möglich maximal 256 (1 Byte) verschiedene Zeichen darzustellen.
UTF-8 ist eine spezielle Kodierung, welches den Unicode Zeichensatz kodiert mit vairabler länge (1-4 byte)
d.h. dort sind so ziemlich alle Unicode zeichen möglich. auch japanische/chinesische etc.
utf-8 ist also eine ecke umfangreicher, und dann sinnvoll, wenn man gerade asiatische oder andere “kryptische” Zeichen nutzen möchte.
aber innerhalb von iso-8859-1 ist es trotzdem möglich indirekt Zeichen aus dem Unicode Zeichensatz zu verwenden.
Mit der Umschriebung in HTMLEntities, kann man auf diese Symbole referenzieren.
man kann das in dezimaler schreibweise: あ
oder in hexadezimaler: あ
um dieses Zeichen zu erhalten: あ (sofern du passende japanische schriftarten isntalliert hast)
Gemeinsam haben die beiden Kodierungen, dass sie auf den ASCII Zeichensatz basieren.
d.h. alle Zeichen mit dem Bytewert von 0-127 sind in beiden Kodierungen darstellbar.
die Byte-werte 128-255 sind bei iso-8859-x (x als platzhalter für die Zahlen 1 bis 15) je nach gewählter Zahl am Ende (1 ist üblich für Deutsche) eine unterschiedlicher Zeichensatz. Sind dann aber natürlich nur maximal 128 zusätzliche Sonderzeichen.
Welcher iso kodierung welche Zeichen enthält, kann man hier nachschauen:
ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/
(oder bei einem passenden Wikipedia Artikel)
bei UTF-8 werden die oberen Byte-werte (128-255) für die verschachtelung von Unicde verwendet.
Ist bissel komplexer, darum werde ich darauf jetzt nicht eingehen.
UTF-8 ist (wenn ich mich nicht irre) internationaler Standard, und soll soweit ich weiß, mindestanforderung für neue Protokolle und Clients sein.
mfg Balmung
Reicht die Antwort? wenn nicht einfach weiter Fragen stellen 
Weiters ist es so ziemlich egal was du im HTML-Code angibst, da sich der Browser nach dem Zeichensatz richtet den der Server im HTTP-Header mitsendet.
Also muss auch schon der Quelltext mit der entsprechenden Kodierung abgespeichert werden.
Vielen Dank erstmal,
vorerst habe ich keine Fragen mehr, sonst meld ich mich nochmal 
MfG, xcube
Daß es egal ist, ist nun auch wieder übertrieben.
Wenn der server keine Angaben macht, soll der browser darauf
zurückgreifen (oder bei XML/XHTML eben auf die Angabe in der
Verarbeitungsanweisung). Wenn das Dokument also auf der
lokalen Platte abgespeichert wird, sollte der browser beim Aufruf
der Kopie die angegebene Kodierung verwenden, wäre also
schlecht, wenn die Angabe falsch ist. Zudem kann die Angabe
als Gedächtnisstütze dienen, wenn man das Dokument
modifiziert und erneut abspeichert - sollte man dann in der
passenden Kodierung tun.