
HTML, siglas de HyperText Markup Language («lenguaje de marcado hipertextual»), hace referencia al lenguaje de marcado predominante para la elaboración de páginas web que se utiliza para describir y traducir la estructura y la información en forma de texto, así como para complementar el texto con objetos tales como imágenes. El HTML se escribe en forma de «etiquetas», rodeadas por corchetes angulares (<,>). HTML también puede describir, hasta un cierto punto, la apariencia de un documento, y puede incluir o hacer referencia a un tipo de programa llamado script, el cual puede afectar el comportamiento de navegadores web y otros procesadores de HTML.
HTML también sirve para referirse al contenido del tipo de MIME text/html o todavía más ampliamente como un término genérico para el HTML, ya sea en forma descendida del XML (como XHTML 1.0 y posteriores) o en forma descendida directamente de SGML (como HTML 4.01 y anteriores).
Primeras especificacionesHistoria de HTML
La primera descripción de HTML disponible públicamente fue un documento llamado HTML Tags (Etiquetas HTML), publicado por primera vez en Internet por Tim Berners-Lee en 1991. Describe 22 elementos que incluyen el diseño inicial y relativamente
simple de HTML. Trece de estos elementos todavía existen en HTML 4.
Berners-Lee consideraba a HTML una ampliación de SGML, pero no fue formalmente reconocida como tal hasta la publicación de mediados de 1993, por la IETF, de una primera proposición para una especificación de HTML: el boceto Hypertext Markup Language de Berners-Lee y Dan Connolly, el cual incluía una Definición de Tipo de Documento SGML para definir la gramática. El boceto expiró luego de seis meses, pero fue notable por su reconocimiento de la etiqueta propia del navegador Mosaic
usada para insertar imágenes sin cambio de línea, que reflejaba la
filosofía del IETF de basar estándares en prototipos con éxito. De la misma manera, el boceto competidor de Dave Raggett HTML+ (Hypertext Markup Format) (Formato de Marcaje de Hipertexto), de finales de 1993, sugería estandarizar características ya implementadas, como las tablas.
Marcado HTML
HTML consta de varios componentes vitales, entre ellos los elementos y sus atributos, tipos de data y la declaración de tipo de documento.
Elementos
Los elementos son la estructura básica de HTML. Los elementos tienen
dos propiedades básicas: atributos y contenido. Cada atributo y
contenido tiene ciertas restricciones para que se considere válido al
documento HTML. Un elemento generalmente tiene una etiqueta de inicio
(por ejemplo, <nombre-de-elemento>
) y una etiqueta de cierre (por ejemplo, </nombre-de-elemento>
).
Los atributos del elemento están contenidos en la etiqueta de inicio y
el contenido está ubicado entre las dos etiquetas (por ejemplo, <nombre-de-elemento atributo="valor">Contenido</nombre-de-elemento>
). Algunos elementos, tales como <br>
, no tienen contenido ni llevan una etiqueta de cierre. Debajo se listan varios tipos de elementos de marcado usados en HTML.

El marcado estructural describe el propósito del texto. Por ejemplo, <h2>Golf</h2>
establece «Golf» como un encabezamiento de segundo nivel, el cual se
mostraría en un navegador de una manera similar al título «Marcado HTML»
al principio de esta sección. El marcado estructural no define cómo se
verá el elemento, pero la mayoría de los navegadores web han
estandarizado el formato de los elementos. Puede aplicarse un formato
específico al texto por medio de hojas de estilo en cascada.
El marcado presentacional describe la apariencia del texto, sin importar su función. Por ejemplo, <b>negrita</b>
indica que los navegadores web visuales deben mostrar el texto en negrita,
pero no indica qué deben hacer los navegadores web que muestran el
contenido de otra manera (por ejemplo, los que leen el texto en voz
alta). En el caso de <b>negrita</b>
e <i>itálica</i>
, existen elementos que se ven de la misma manera pero tienen una naturaleza más semántica: <strong>enfásis fuerte</strong>
y <em>énfasis</em>
. Es fácil ver cómo un lector de pantalla
debería interpretar estos dos elementos. Sin embargo, son equivalentes a
sus correspondientes elementos presentacionales: un lector de pantalla
no debería decir más fuerte el nombre de un libro, aunque éste esté en itálicas en una pantalla. La mayoría del marcado presentacional ha sido desechada con HTML 4.0, en favor de hojas de estilo en cascada.
El marcado hipertextual se utiliza para enlazar partes del
documento con otros documentos o con otras partes del mismo documento.
Para crear un enlace es necesario utilizar la etiqueta de ancla <a>
junto con el atributo href
,
que establecerá la dirección URL a la que apunta el enlace. Por
ejemplo, un enlace que muestre el texto de la dirección y vaya hacia
nuestra Wikipedia podría ser de la forma: <ahref=”http://www.wikipedia.org”>http://www.wikipedia.org</a>
. También se pueden crear enlaces sobre otros objetos, tales como imágenes <a href=”enlace”><img src=”imagen” /></a>
.
Atributos
La mayoría de los atributos de un elemento son pares nombre-valor,
separados por un signo de igual «=» y escritos en la etiqueta de
comienzo de un elemento, después del nombre de éste. El valor puede
estar rodeado por comillas dobles o simples, aunque ciertos tipos de
valores pueden estar sin comillas en HTML (pero no en XHTML). De todas maneras, dejar los valores sin comillas es considerado poco seguro. En contraste con los pares nombre-elemento, hay algunos atributos que afectan al elemento simplemente por su presencia (tal como el atributo ismap
para el elemento img
).
Códigos HTML básicos
<html>
: define el inicio del documento HTML, le indica al navegador que lo que viene a continuación debe ser interpretado como código HTML. Esto es así de facto, ya que en teoría lo que define el tipo de documento es el DOCTYPE, que significa la palabra justo tras DOCTYPE el tag de raíz.
<script>
: incrusta un script en una web, o llama a uno mediante src="url del script"
. Se recomienda incluir el tipo MIME en el atributo type
, en el caso de JavaScript text/javascript
.
<head>
: define la cabecera del documento HTML; esta cabecera suele contener información sobre el documento que no se muestra directamente al usuario como, por ejemplo, el título de la ventana del navegador. Dentro de la cabecera <head>
es posible encontrar:
-
<title>
: define el título de la página. Por lo general, el título aparece en la barra de título encima de la ventana.
-
<link>
: para vincular el sitio a hojas de estilo o iconos. Por ejemplo:<link rel="stylesheet" href="/style.css" type="text/css">
.
-
<style>
: para colocar el estilo interno de la página; ya sea usando CSS u otros lenguajes similares. No es necesario colocarlo si se va a vincular a un archivo externo usando la etiqueta <link>
.
-
<meta>
: para metadatos como la autoría o la licencia, incluso para indicar parámetros http (mediante http-equiv=""
) cuando no se pueden modificar por no estar disponible la configuración o por dificultades con server-side scripting.
<body>
: define el contenido principal o cuerpo
del documento. Esta es la parte del documento html que se muestra en el
navegador; dentro de esta etiqueta pueden definirse propiedades comunes a
toda la página, como color de fondo y márgenes. Dentro del cuerpo <body>
es posible encontrar numerosas etiquetas. A continuación se indican algunas a modo de ejemplo:
-
<h1>
a <h6>
: encabezados o títulos del documento con diferente relevancia.
-
<table>
: define una tabla.
-
-
-
-
-
<td>
: celda de una tabla (debe estar dentro de una fila).
-
<a>
: hipervínculo o enlace, dentro o fuera del sitio web. Debe definirse el parámetro de pasada por medio del atributo href. Por ejemplo: <a href="http://www.example.com" title="Ejemplo" target="_blank" tabindex="1">Ejemplo</a>
se representa como Ejemplo).
-
<div>
: división de la página. Se recomienda, junto con css, en vez de <table>
cuando se desea alinear contenido.
-
<img>
: imagen. Requiere del atributo src, que indica la ruta en la que se encuentra la imagen. Por ejemplo: <img src="./imágenes/mifoto.jpg" />
. Es conveniente, por accesibilidad, poner un atributo alt="texto alternativo"
.
-
<li>
<ol>
<ul>
: etiquetas para listas.
-
<b>
: texto en negrita (etiqueta desaprobada. Se recomienda usar la etiqueta <strong>
).
-
<i>
: texto en cursiva (etiqueta desaprobada. Se recomienda usar la etiqueta <em>
).
-
<s>
: texto tachado (etiqueta desaprobada. Se recomienda usar la etiqueta <del>
).
-
<u>
: Antes texto subrayado. A partir de HTML 5
define porciones de texto diferenciadas o destacadas del resto, para
indicar correcciones por ejemplo. (etiqueta desaprobada en HTML 4.01 y
redefinida en HTML 5)
La mayoría de etiquetas deben cerrarse como se abren, pero con una barra («/») tal como se muestra en los siguientes ejemplos:
<table><tr><td>Contenido de una celda</td></tr></table>
.
<script>Código de un script integrado en la página</script>
.
Nociones básicas de HTML
El lenguaje HTML puede ser creado y editado con cualquier editor de textos básico, como puede ser Gedit en Linux, el Bloc de notas de Windows, o cualquier otro editor que admita texto sin formato como GNU Emacs, Microsoft Wordpad, TextPad, Vim, Notepad++, entre otros. Existen, además, otros editores para la realización de sitios web con características WYSIWYG (What You See Is What You Get,
o en español: «lo que ves es lo que obtienes»). Estos editores permiten
ver el resultado de lo que se está editando en tiempo real, a medida
que se va desarrollando el documento. Ahora bien, esto no significa una
manera distinta de realizar sitios web, sino que una forma un tanto más
simple, ya que estos programas, además de tener la opción de trabajar
con la vista preliminar, tiene su propia sección HTML, la cual va
generando todo el código a medida que se va trabajando. Algunos ejemplos
de editores WYSIWYG son KompoZer, Microsoft FrontPage o Adobe Dreamweaver.
Combinar estos dos métodos resulta muy interesante, ya que de alguna
manera se ayudan entre sí. Por ejemplo, si se edita todo en HTML y de
pronto se olvida algún código o etiqueta, simplemente me dirijo al
editor visual o WYSIWYG y se continúa ahí la edición o viceversa, ya que
hay casos en que resulta más rápido y fácil escribir directamente el
código de alguna característica que el usuario desea adherir al sitio
que buscar la opción en el programa mismo.
Existe otro tipo de editores HTML llamados WYSIWYM
que dan más importancia al contenido y al significado que a la
apariencia visual. Entre los objetivos que tienen estos editores es la
separación del contenido y la presentación, fundamental en el diseño
web. HTML utiliza etiquetas o marcas, que consisten en breves
instrucciones de comienzo y final, mediante las cuales se determina la
forma en la que debe aparecer en su navegador el texto, así como también las imágenes y los demás elementos, en la pantalla del ordenador.
Toda etiqueta se identifica porque está encerrada entre los signos
menor que y mayor que (<>), y algunas tienen atributos que pueden
tomar algún valor. En general las etiquetas se aplicarán de dos formas
especiales:
- Se abren y se cierran, como por ejemplo: <b>negrita</b>, que se vería en su navegador web como negrita.
- No pueden abrirse y cerrarse, como <hr />, que se vería en su navegador web como una línea horizontal.
- Otras que pueden abrirse y cerrarse, como por ejemplo <p>.
- Las etiquetas básicas o mínimas son:
<!DOCTYPE HTML>
<html>
<head>
<title>Ejemplo1</title>
</head>
<body>
<p>ejemplo1</p>
</body>
</html>
Accesibilidad web
El diseño en HTML, aparte de cumplir con las especificaciones propias del lenguaje, debe respetar ciertos criterios de accesibilidad web,
siguiendo unas pautas o las normativas y leyes vigentes en los países
donde se regule dicho concepto. Se encuentra disponible y desarrollado
por el W3C a través de las Pautas de Accesibilidad al Contenido Web 1.0 WCAG (actualizadas recientemente con la especificación 2.0), aunque muchos países tienen especificaciones propias, como es el caso de España con la Norma UNE 139803.
Entidades HTML
Los caracteres especiales como signo de puntuación, letras con tilde o
diéresis o símbolos del lenguaje se deben convertir en entidad HTML
para mostrarse en un navegador. La siguiente es una lista de caracteres
españoles y su correspondiente entidad HTML:
Carácter |
Entidad HTML |
Carácter |
Entidad HTML |
á
|
á
|
Á
|
Á
|
é
|
é
|
É
|
É
|
í
|
í
|
Í
|
Í
|
ó
|
ó
|
Ó
|
Ó
|
ú
|
ú
|
Ú
|
Ú
|
ü
|
ü
|
Ü
|
Ü
|
ñ
|
ñ
|
Ñ
|
Ñ
|
¡
|
¡
|
¿
|
¿
|