Codificación de caracteres

La codificación de caracteres es el método que permite convertir un carácter de un lenguaje natural (como el de un alfabeto o silabario) en un símbolo de otro sistema de representación, como un número o una secuencia de pulsos electrónicos en un sistema electrónico aplicando normas o reglas de codificación.

Normas comunes de codificación de caracteres

Normas comunes de codificación de caracteres

  • ISO 8859:
    • ISO 8859-1 Europa occidental
    • ISO 8859-2 Europa occidental y Centroeuropa (checo, polaco, croata, rumano, esloveno, …)
    • ISO 8859-3 Europa occidental y Europa del Sur
    • ISO 8859-4 Europa occidental y países bálticos (lituano, estonio y lapón)
    • ISO 8859-5 alfabeto cirílico
    • ISO 8859-6 árabe
    • ISO 8859-7 griego
    • ISO 8859-8 Hebreo
    • ISO 8859-9 Europa occidental con el juego de caracteres turco
    • ISO 8859-10 Europa occidental con juegos de caracteres nórdicos, incluyendo el de Islandia.
    • ISO 8859-13 idiomas bálticos y polaco
    • ISO 8859-14 idiomas celtas (gaélico irlandés, escocés, galés)
    • ISO 8859-15 Añade el símbolo de Euro y otros a ISO 8859-1
    • ISO 8859-16 idiomas centroeuropeos (polaco, checo, esloveno, eslovaco, húngaro, albano, rumano, alemán e italiano)
  • CP437, CP737, CP850, CP852, CP855, CP857, CP858, CP860, CP861, CP863, CP865, CP866, CP869
  • Juegos de caracteres de Windows:
    • Windows-1250 para idiomas centroeuropeos que utilizan un guion latino (polaco, checo, eslovaco, húngaro, esloveno, serbio, croata, rumano y albano)
    • Windows-1251 para alfabetos cirílicos
    • Windows-1252 para idiomas occidentales
    • Windows-1253 para griego
    • Windows-1254 para turco
    • Windows-1255 para hebreo
    • Windows-1256 para árabe
    • Windows-1257 para idiomas bálticos
  • Unicode (y sus subconjuntos, como el Basic Multilingual Plane de 16 bits). Véase también UTF-8 y UTF-16.