Codificación de texto: ASCII, Unicode y UTF-8

Aprende cómo se representa el texto en sistemas informáticos y evita errores comunes de codificación, caracteres rotos y compatibilidad entre plataformas.

Para un ordenador, el texto no existe como letras: existe como números que se interpretan según una tabla de codificación.

ASCII resolvió una etapa inicial, pero Unicode permitió representar múltiples idiomas y símbolos en un estándar global.

UTF-8 se volvió la codificación dominante por compatibilidad y eficiencia, especialmente en web y APIs.

  • ASCII fue útil, Unicode es imprescindible hoy.
  • ASCII clásico: 7 bits, conjunto limitado de caracteres.
  • Unicode: estándar universal para representar texto multilingüe.
  • UTF-8: codificación variable de Unicode compatible con ASCII.
  • En proyectos modernos, UTF-8 debe ser la opción por defecto.

ASCII vs Unicode sin tecnicismos innecesarios

ASCII fue útil, Unicode es imprescindible hoy.

  • ASCII clásico: 7 bits, conjunto limitado de caracteres.
  • Unicode: estándar universal para representar texto multilingüe.
  • UTF-8: codificación variable de Unicode compatible con ASCII.
  • En proyectos modernos, UTF-8 debe ser la opción por defecto.

Errores típicos de codificación y cómo prevenirlos

Los ‘caracteres raros’ suelen ser problema de encoding, no de contenido.

Si un archivo se guarda en una codificación y se lee en otra, aparecen símbolos corruptos (mojibake).

Para evitarlo, define UTF-8 de extremo a extremo: editor, backend, base de datos y salida HTTP.

En revisión de calidad, validar tildes y eñes no es detalle cosmético: es parte de la integridad de datos.

Informática
04

Codificación de texto: ASCII, Unicode y UTF-8

Aprende cómo se representa el texto en sistemas informáticos y evita errores comunes de codificación, caracteres rotos y compatibilidad entre plataformas.

Código del tema: Fundamentos de sistemas y redes

📘 Teoría

ASCII vs Unicode sin tecnicismos innecesarios

ASCII fue útil, Unicode es imprescindible hoy.

  • ASCII clásico: 7 bits, conjunto limitado de caracteres.
  • Unicode: estándar universal para representar texto multilingüe.
  • UTF-8: codificación variable de Unicode compatible con ASCII.
  • En proyectos modernos, UTF-8 debe ser la opción por defecto.

Errores típicos de codificación y cómo prevenirlos

Los ‘caracteres raros’ suelen ser problema de encoding, no de contenido.

1

Si un archivo se guarda en una codificación y se lee en otra, aparecen símbolos corruptos (mojibake).

2

Para evitarlo, define UTF-8 de extremo a extremo: editor, backend, base de datos y salida HTTP.

3

En revisión de calidad, validar tildes y eñes no es detalle cosmético: es parte de la integridad de datos.

🧰 Recursos

¿Qué es esto?

Soy Cristian Eslava y a veces hago webs para procrastinar yo y vosotros 😉.

Esta la hice en febrero de 2026 para facilitar el aprendizaje de mis alumnxs. Aprender desarrollo web practicando. La idea es que crezca semanalmente con nuevos temas, tests y retos.

Inspirado en MDN, en W3Schools, en Codepen, en el crack de Manz y en mil sitios de documentación sobre desarrollo web. Quería aportar además de bloques teóricos con ejemplos, la gamificación de los retos y el sistema de test que ya tenía en culTest .

Si te gustó, si no te gustó, si quieres saludarme, o invitarme a 🍻 no dudes en escribirme en cristianeslava@gmail.com .