PHP Codificaciones de Caracteres (o cómo una máquina entiende las letras)
PHP Cuando un programa abre un archivo, lee todos los bytes de ese archivo y muestra una representación legible para los humanos: las letras, números, símbolos y otros caracteres
¿Cómo sabe que si se encuentra el byte 01100001 debe mostrar una 'a' ?
¿Cómo sabe que cuando apretamos la letra 'a' en el teclado, él debe escribir el byte 01100001 en el archivo? ¡Por la codificación de caracteres que esté usando!
PHP Los ordenadores no ven letras, ven 0s y 1s
1 bit puede tener 2 valores: 0 y 1
8 bits son 1 byte
1 byte puede tener 256 valores diferentes (2 8 ) ¡Son muy pocos para representar todos los caracteres posibles! (latinos, cirílicos, japoneses, koreanos, turco, hebreo, árabe, hindi...)
PHP ¿Cómo funcionaba el mundo hasta ahora?
PHP ISO-8859-1  (latin-1) Es la codificación de caracteres usada en gran parte de europa y américa (muy similar a ANSI o Windows-1252, pero no igual)
Contiene a-z A-Z 0-9 y casi todos los símbolos de uso habitual, excepto el €
1 byte por carácter
Sólo puede representar 256 carácteres diferentes
Limitado
PHP ISO-8859-15  (latin-9) Prácticamente idéntico a ISO-8859-1, con algunas variaciones
Incluye el € EUC-JP  (unix) o  Shift JIS  (windows) Para representar caracteres japoneses, chinos y/o koreanos, dependiendo del S.O. ISO-8859-2  (latin-2) Europa Central y Este: bosnio, croata, checo, húngaro...
PHP ISO-8859-3 (latin-3) Europa del sur: Turco, Esperanto (¿?) y maltés PASCII Estándar indio para lenguajes basados en escritura árabe (cachemir, urdu, persa, sindhi) ISO-8859-8 Hebreo ¡Y aún hay más!
PHP ¡¡¡¡¡¡BASTAAAAAAAAAAAAAAA!!!!!!

Codificaciones caracteres (es)

  • 1.
    PHP Codificaciones deCaracteres (o cómo una máquina entiende las letras)
  • 2.
    PHP Cuando unprograma abre un archivo, lee todos los bytes de ese archivo y muestra una representación legible para los humanos: las letras, números, símbolos y otros caracteres
  • 3.
    ¿Cómo sabe quesi se encuentra el byte 01100001 debe mostrar una 'a' ?
  • 4.
    ¿Cómo sabe quecuando apretamos la letra 'a' en el teclado, él debe escribir el byte 01100001 en el archivo? ¡Por la codificación de caracteres que esté usando!
  • 5.
    PHP Los ordenadoresno ven letras, ven 0s y 1s
  • 6.
    1 bit puedetener 2 valores: 0 y 1
  • 7.
    8 bits son1 byte
  • 8.
    1 byte puedetener 256 valores diferentes (2 8 ) ¡Son muy pocos para representar todos los caracteres posibles! (latinos, cirílicos, japoneses, koreanos, turco, hebreo, árabe, hindi...)
  • 9.
    PHP ¿Cómo funcionabael mundo hasta ahora?
  • 10.
    PHP ISO-8859-1 (latin-1) Es la codificación de caracteres usada en gran parte de europa y américa (muy similar a ANSI o Windows-1252, pero no igual)
  • 11.
    Contiene a-z A-Z0-9 y casi todos los símbolos de uso habitual, excepto el €
  • 12.
    1 byte porcarácter
  • 13.
    Sólo puede representar256 carácteres diferentes
  • 14.
  • 15.
    PHP ISO-8859-15 (latin-9) Prácticamente idéntico a ISO-8859-1, con algunas variaciones
  • 16.
    Incluye el €EUC-JP (unix) o Shift JIS (windows) Para representar caracteres japoneses, chinos y/o koreanos, dependiendo del S.O. ISO-8859-2 (latin-2) Europa Central y Este: bosnio, croata, checo, húngaro...
  • 17.
    PHP ISO-8859-3 (latin-3)Europa del sur: Turco, Esperanto (¿?) y maltés PASCII Estándar indio para lenguajes basados en escritura árabe (cachemir, urdu, persa, sindhi) ISO-8859-8 Hebreo ¡Y aún hay más!
  • 18.