5 berichten aan het bekijken - 1 tot 5 (van in totaal 5)
  • Q:
    Bijdrager
    Vasilis

    Welke tekstcodering

    Ik vraag mij al een tijdje af welke tekstcodering ik moet gebruiken voor mijn sites. En waarom.
    Ik kan er maar geen duidelijk antwoord op vinden.
    Moet ik nou iso-8859-1 of utf-8 gebruiken.
    Wat is het verschil?
    En hoe reageren de verschillende browsers hier op?
    Werkt utf-16 eigenlijk?

    Bijdrager
    iljitsch

    Ik zou ISO-8859-1 gebruiken. Een enkel unicode-teken kan je dan altijd met ampersand-hekje-nummer-puntkomma doen. Alleen als je veel karakters nodig hebt die niet in 8859-1 voorkomen is UTF-8 waarschijnlijk handiger. Ik weet niet welke browsers allemaal UTF-8 ondersteunen, maar de wat oudere waarschijnlijk niet. Met UTF-16 geef ik je weinig kans.

    Let wel op dat je in alle gevallen meestuurt wat de encodering is, zodat de browser weet hoe-ie een en ander af moet beelden.

    Bijdrager
    Vasilis

    Dank je. Ik had al even een utf-16 testje gemaakt. Dat werkt inderdaad niet.
    Wat is precies het verschil tussen utf-8 en ISO-8859-1?

    Bijdrager
    iljitsch

    Bij traditionele karaktersets zoals ISO-8859-1 heb je 8 bits per karakter = 256 verschillende mogelijke karakters, waarbij de eerste 128 standaard ASCII zijn en de overige 128 per karakterset verschillen. Bij ISO-8859-1 zijn dit vooral de letters met accenten die in West-Europese talen gebruikt worden.

    Omdat 8 bits maar 256 karakters toestaat kom je er niet zo ver mee, vandaar dat er zoveel van die karaktersets zijn. Hiervoor biedt Unicode de oplossing. Hierbij zijn (minstens) tienduizenden verschillende karakters beschikbaar, dus je kan er iedere taal in de wereld in schrijven. Nadeel is wel dat je tot 31 bits nodig hebt om een Unicode-karakter weer te geven.

    UTF-8 is een truuk om systemen die verwachten dat tekst in 8-bit karakters geschreven wordt toch met Unicode te laten werken. Hierdoor worden speciale tekens (alles wat niet overeenkomt met standaard ASCII) weergeven met meerdere 8-bit waarden.

    ISO-8859-1 heeft als voordeel dat het al zo’n 20 jaar bestaat en de default is voor het WWW. Hiermee ben je dus altijd compatible. UTF-8 heeft als voordeel dat het veel meer niet-standaard karakters toestaat maar er is nog ruimschoots software in gebruik die UTF-8 niet snapt. Als je alleen een enkele keer een Unicode-karakter nodig hebt is het makkelijker dit met die ampersand truuk in de HTML op te nemen, hiervoor hoeft alleen de browser Unicode-support te hebben, bij UTF-8 moet je editor het ook ondersteunen.

    Bijdrager
    Vasilis

    Dank je wel voor deze duidelijke uitleg.

5 berichten aan het bekijken - 1 tot 5 (van in totaal 5)

Je moet ingelogd zijn om een reactie op dit onderwerp te kunnen geven.