El HTML fue definido por Tim Berners-Lee a principios de los años 90 como un subconjunto del SGML para describir la estructura y contenido de páginas web. Es el lenguaje de marcado predominante utilizado para construir páginas web mediante etiquetas que definen texto, imágenes y otros objetos. Aunque es fácil de usar y muy extendido, el HTML tiene la desventaja de no ser semántico y de que su contenido no puede ser reconocido ni procesado automáticamente.