Mange undervurderer viktigheten av charset taggen på nettsidene sine. (<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />) De klipper ut denne taggen fra en annen nettside, og limer den inn i sin, for at siden skal validere. Og, ja, den validerer, men feil tegnsett kan føre til at æ, ø og å (++) ikke vises korrekt i andre OS.
Dersom en bruker windows kan det hende at iso-8859-1 kan føre til det samme problemet for brukere av andre OS. Det samme gjelder dersom du skriver siden i UTF-8 men har iso-8859-1 i charset taggen.
Vet du ikke hvilket charset du bruker?
her er en liste over standardcharsets:
- Linux/UNIX bruker vanligvis ISO-8859-1, også kjendt som latin1
- RedHat/Fedora bruker UTF8 som standard, men kan også bruke ISO-8859-1
- Windows bruker et
superset
av latin1, kjendt som CP-1252
- Mac bruker vanligvis MacRoman, som er et
superset
av ASCII, og som ellers ikke har noe med latin1 å gjøre
Siden MacOS X er en Unix, kan det antageligvis bruke ISO-8859-1 eller UTF8 også.
En annen ting er at en del webservere (som Apache 2.x) overstyrer det charset’et du setter i html’en og på den måten griser det til.
Den beste løsningen er å bruke html-entities men det er litt mye arbeid
Mer om tegnsett
RFC’en for UTF8 (RFC3639)