O documento discute a importância do Unicode para suportar múltiplas linguagens, definindo um conjunto universal de caracteres. Explica que o Unicode mapeia caracteres para números e que UTF-8 é um encoding baseado no Unicode que suporta mais de cem mil caracteres e é capaz de acomodar páginas misturando diferentes linguagens.
17. Unicode é um conjunto universal de caracteres, um padrão que define, em um único lugar, todos os caracteres necessários para escrever na maioria dos idiomas vivos usados nos computadores
18. Arabic Greek Khmer Runic Armenian Gujurati Lao Sinhala Bengali Gurmukhi Latin Tamil Cherokee Hangul Mongolian Telugu Cyrillic Hebrew Tibetan Thaana Devanagari Ethiopic Georgian etc...