Lenguaje de marcado para niños
Un lenguaje de marcado es una forma especial de escribir documentos. Imagina que, además del texto que lees, hay unas "etiquetas" o "marcas" escondidas. Estas etiquetas le dan información extra al documento, como por ejemplo, si algo es un título, un párrafo, o si debe ir en negrita.
El lenguaje de marcado más conocido es el HTML (que significa Lenguaje de Marcado de Hipertexto). Este es el lenguaje principal que se usa para crear las páginas que ves en la World Wide Web (la internet que conocemos).
A veces, la gente confunde los lenguajes de marcado con los lenguajes de programación. Pero no son lo mismo. Un lenguaje de marcado no puede hacer cálculos ni tiene "variables" como los lenguajes de programación. Históricamente, los lenguajes de marcado se usaban mucho en la industria de los libros y periódicos, para que los autores, editores e impresores pudieran comunicarse sobre cómo debía verse el texto.
Piensa en cómo funciona un lenguaje de marcado con un ejemplo: si le dictaras un documento a alguien que lo escribe a máquina, le dirías cosas como: "Pon estilo de carta, pon comillas, pon mayúsculas, Estimado Juan, pon dos puntos, aparte, sangría, pon la primera letra mayúscula, te escribo esta carta, pon negritas, de forma muy urgente, cierra negrita, ya que no me has enviado...", y así sucesivamente. Esas instrucciones son como las "marcas" que le dan formato al texto.
Contenido
Tipos de lenguajes de marcado
Existen diferentes tipos de lenguajes de marcado, aunque a veces se mezclan en un mismo documento. Por ejemplo, el HTML tiene etiquetas que indican cómo se ve algo (como la 'B' para negrita) y otras que describen qué es algo (como 'BLOCKQUOTE' para una cita).
Marcado de presentación: ¿Cómo se ve el texto?
El marcado de presentación se enfoca en cómo se ve el texto. Por ejemplo, indica si algo es negrita, cursiva o de cierto tamaño. Es útil para diseñar cómo se verá un documento al leerlo. Sin embargo, no es muy bueno si quieres que una computadora entienda el significado de la información.
Este tipo de marcado es más fácil de usar para documentos pequeños. Pero si el proyecto es muy grande, puede ser difícil de mantener o cambiar. Por eso, en proyectos grandes, se prefieren otros tipos de marcado que organizan mejor la información. Un ejemplo de marcado de presentación es el RTF.
Marcado de procedimientos: Instrucciones paso a paso
El marcado de procedimientos también se centra en la apariencia del texto, pero las instrucciones son visibles para la persona que edita el documento. El programa que muestra el documento debe seguir estas instrucciones en el orden en que aparecen. Por ejemplo, para un título, habría instrucciones antes del texto que le dicen al programa que lo centre, lo haga más grande o lo ponga en negrita. Después del título, habría otras instrucciones para volver a la normalidad.
Algunos ejemplos de este tipo de marcado son nroff, troff y TeX. Se usaron mucho en la edición profesional, pero requerían conocimientos avanzados. Con la llegada de los procesadores de texto modernos (como los que ves lo que escribes al instante), estos lenguajes se usaron menos.
Marcado descriptivo: ¿Qué significa el texto?
El marcado descriptivo o semántico usa etiquetas para describir qué son las partes del texto, pero no dice cómo deben verse. Por ejemplo, una etiqueta podría decir que algo es un "título" o una "fecha", pero no si debe ser grande o de color rojo. Los lenguajes SGML y XML son ejemplos de marcado descriptivo.
Una gran ventaja del marcado descriptivo es su flexibilidad. Como el texto se etiqueta por lo que es y no por cómo se ve, se puede usar de muchas maneras. Por ejemplo, un hiperenlace (un enlace en una página web) fue diseñado para que lo pulses, pero los buscadores también lo usan para encontrar páginas relacionadas.
Este tipo de marcado también facilita cambiar el diseño de un texto. Si la información del formato está separada del contenido, puedes cambiar el estilo de todo el documento sin tener que revisar cada parte.
Un vistazo a los lenguajes de marcado
Aquí te mostramos algunos de los lenguajes de marcado más importantes, organizados por su uso. Los lenguajes generales pueden usarse para cosas más específicas, pero no al revés.
Los más importantes
- GML --> SGML --> XML --> Variantes de XML
Documentos en general
Lenguajes descriptivos | Lenguajes de presentación | Lenguajes sencillos | Lenguajes para manuales |
|
|
|
|
Tecnologías de internet
World Wide Web | Interfaz de usuario | Sindicación | Servicios web |
|
|
|
Lenguajes especializados
- Gráficos 2D: SVG, CGM, VML, InkML.
- Gráficos 3D: VRML/X3D, STEP.
- Matemática: MathML y OpenMath.
- Música: LilyPond y MusicXML.
- Taxonomía: DITA
- Contabilidad financiera: eXtensible Business Reporting Language.
- Geomática: Geography ML.
- Aeronáutica: Spacecraft ML.
- Multimedia: Synchronized Multimedia Integration Language.
- Voz: VoiceXML.
- Mensajería instantánea: XMPP.
- Videojuegos: BulletML, COLLADA.
Historia de los lenguajes de marcado
Los lenguajes de marcado tienen su nombre de una antigua costumbre: marcar los manuscritos con instrucciones para la imprenta en los bordes. En la época de la imprenta, había personas llamadas "marcadores" que indicaban el tipo de letra, el estilo y el tamaño, y corregían errores. Esto llevó a crear un grupo de marcas estándar. Cuando llegaron las computadoras, una idea similar se aplicó al mundo digital.
Los inicios
La idea de un lenguaje de marcado fue propuesta por primera vez por William W. Tunnicliffe en 1967. Lo más novedoso fue separar cómo se ve el texto de su estructura. Tunnicliffe llamó a esto "codificación genérica" y luego ayudó a desarrollar un estándar llamado GenCode para la industria editorial.
Sin embargo, a quien se considera el "padre" de los lenguajes de marcado es Charles Goldfarb, un investigador de IBM. Goldfarb participó en la creación del lenguaje GML y luego lideró el comité que creó el estándar SGML, que es la base de muchos lenguajes de marcado. Aunque hay debates sobre su origen exacto, se cree que la idea surgió varias veces de forma independiente en los años 70 y se hizo popular en los 80.
Los primeros lenguajes
El primer lenguaje que separó claramente la estructura de la presentación fue Scribe, desarrollado por Brian Reid en 1980. Scribe fue innovador porque no solo separaba el estilo de las marcas, sino que también controlaba cómo se usaban los elementos descriptivos. Scribe influyó en el desarrollo de lenguajes posteriores.
Otro estándar importante es TeX, creado por Donald Knuth en los años 70 y 80. TeX se enfoca en la estructura detallada del texto y la descripción de las fuentes, especialmente para publicaciones de matemáticas. TeX requiere muchos conocimientos para usarse, por lo que es más común en el ámbito académico. El programa más usado para TeX es LaTeX.
Fuera de la industria editorial, también surgieron lenguajes como troff y nroff, usados para dar formato en sistemas UNIX. Eran limitados y requerían mucha prueba y error. Con la llegada de los procesadores de texto que muestran el resultado al instante (conocidos como WYSIWYG), estos sistemas quedaron en el olvido.
La expansión de los lenguajes de marcado
La base de los lenguajes actuales vino de IBM, que buscaba cómo manejar grandes cantidades de documentos. Charles F. Goldfarb, junto con Edward Mosher y Raymond Lorie, diseñaron el Generalized Markup Language o GML. Este lenguaje tomó la idea de GenCode de separar la presentación del contenido. Así, el marcado se centró en definir la estructura del texto.
El GML fue un gran éxito y se extendió rápidamente, incluso siendo adoptado por el gobierno de Estados Unidos. Esto hizo que fuera necesario estandarizarlo. A principios de los años 80, se formó un comité liderado por Goldfarb. Después de un largo proceso, en 1986, la Organización Internacional para la Estandarización publicó el Standard Generalized Markup Language (SGML) como estándar internacional (ISO 8879).
El SGML define cómo se deben incluir las marcas en los textos y qué etiquetas están permitidas. Esto permitía a los autores usar las marcas que quisieran, eligiendo nombres que tuvieran sentido para el tema y el idioma. El SGML es un "metalenguaje", lo que significa que de él se derivan muchos lenguajes especializados. Desde finales de los 80, han aparecido nuevos lenguajes basados en SGML, como el TEI o el DocBook.
El SGML fue muy bien recibido y se usa en campos que necesitan mucha documentación. Sin embargo, era complicado y difícil de aprender debido a sus muchos objetivos. Su gran poder era a la vez una ventaja y una desventaja. Por ejemplo, algunas etiquetas podían tener solo un inicio o un final, o incluso omitirse, pensando en que los textos se escribirían a mano para ahorrar pulsaciones. A pesar de esto, fue clave para el desarrollo de los lenguajes de marcado actuales, ya que la mayoría derivan de él.
La popularización: el HTML
En 1991, parecía que los editores WYSIWYG (que guardaban documentos en formatos especiales de cada programa) dominarían el procesamiento de textos, dejando el SGML para usos muy específicos. Pero todo cambió cuando Sir Tim Berners-Lee, quien había aprendido SGML de un colega en el CERN, usó la sintaxis SGML para crear el HTML.
Este lenguaje era similar a otros creados con SGML, pero era increíblemente sencillo. DeRose dice que la flexibilidad del HTML, junto con el uso de URLs y la distribución gratuita de navegadores, fue clave para el éxito de la World Wide Web.
Hoy en día, el HTML es el tipo de documento más usado en el mundo. Su sencillez hizo que cualquiera pudiera escribir documentos en este formato, casi sin necesidad de saber de informática. Esta fue una de las razones de su éxito, pero también llevó a cierto desorden. El crecimiento rápido de la web en los años 90 produjo muchísimos documentos mal estructurados, un problema que empeoró porque los diseñadores web y los fabricantes de software no siempre seguían los estándares.
La madurez: el XML
La solución a los problemas del HTML llegó con el XML (eXtensible Markup Language). El XML es un metalenguaje que permite crear etiquetas personalizadas según las necesidades (por eso es "extensible"). El estándar define cómo deben ser esas etiquetas y qué se puede hacer con ellas. Además, es muy estricto: todo documento XML debe ser "válido" y estar "bien formado".
El XML fue desarrollado por el World Wide Web Consortium, por un comité liderado por Jon Bosak. El objetivo principal era simplificar el SGML para adaptarlo a un campo muy específico: los documentos en internet.
El nuevo lenguaje se extendió rápidamente porque todo documento XML es también SGML. Los programas y documentos creados para SGML podían convertirse casi automáticamente al nuevo lenguaje. El XML simplificó mucho la complejidad del SGML, haciendo que fuera más fácil de aprender y usar. También solucionó problemas antiguos, como los de la internacionalización y la dificultad de validar un documento sin un esquema. El gran acierto de este lenguaje es que logra un equilibrio entre simplicidad y flexibilidad.
El XML fue pensado inicialmente para textos y publicaciones. Un ejemplo claro es el XHTML, que es una versión de HTML hecha con XML. Pero pronto se vio que sus ventajas podían ser útiles en muchos otros campos. Los lenguajes basados en XML tienen muchísimas aplicaciones, como el intercambio de datos entre servidores, información financiera, fórmulas y reacciones químicas, y mucho más.
Tendencias actuales
Las nuevas tendencias han ido más allá de los documentos con estructura en árbol. Los textos antiguos, como la literatura, suelen tener estructuras de prosa o poesía: versículos, párrafos, etc. Los documentos de referencia se organizan en libros, capítulos, versos y líneas. A menudo, estas estructuras se mezclan, por lo que una estructura de árbol no siempre es suficiente. Los nuevos sistemas de modelado superan estos problemas, como el MECS, diseñado para la obra de Wittgenstein, o las TEI Guidelines, LMNL y CLIX.
La Iniciativa de Codificación de Textos o Text Encoding Initiative (TEI) ha publicado muchas guías para codificar documentos importantes en humanidades y ciencias sociales. Estas guías se han usado en muchísimos proyectos para catalogar documentos históricos y trabajos académicos.
La web semántica
Los lenguajes de marcado son una herramienta fundamental para la web semántica. Esta es una web que no solo te permite acceder a la información, sino que también define su significado. Así, las computadoras pueden procesar la información de forma más inteligente y reutilizarla para diferentes aplicaciones. Esto se logra añadiendo datos extra a los documentos, usando dos lenguajes creados para ello: el RDF (Plataforma de descripción de recursos) y OWL (Lenguaje de ontologías para la web), ambos basados en XML.
¿Qué hace especiales a los lenguajes de marcado?
Texto sencillo
Una de las grandes ventajas de estos lenguajes es que la mayoría se pueden leer directamente porque son archivos de texto plano. Esto es diferente de los archivos binarios (como los de algunos programas de texto), que solo se pueden leer con un programa específico. Un documento escrito con lenguajes de marcado puede ser editado con un simple editor de texto, aunque también se pueden usar programas más avanzados.
Como solo son texto, estos documentos no dependen del tipo de computadora, sistema operativo o programa con el que fueron creados. Esta fue una idea clave para los creadores de GML en los años 70: no poner límites al intercambio de información. Es una de las razones por las que han sido tan populares y tienen un gran futuro.
Compactos
Las instrucciones de marcado se mezclan con el contenido en un solo archivo. Mira estos ejemplos en diferentes lenguajes de marcado:
Ejemplos | HTML | LaTeX | Wikitexto |
---|---|---|---|
Título | <h1>Título</h1> | \section{Título} | == Título == |
Lista |
<ul> |
\begin{itemize} |
* Punto 1 |
texto en negrita | <b>texto</b> | \bf{texto} | '''texto''' |
texto en cursiva | <i>texto</i> | \it{texto} | ''texto'' |
El código entre símbolos como <ul> o \section son las instrucciones de marcado, también llamadas etiquetas. Estas etiquetas describen la estructura del documento. La etiqueta i (de italics, cursiva), por otro lado, dice que el texto debe mostrarse en cursiva, sin decir por qué: es una etiqueta de presentación. El texto entre estas instrucciones es el contenido del documento.
Fáciles de procesar
Las organizaciones que crean estándares han desarrollado lenguajes especiales para tipos de documentos específicos de ciertas comunidades o industrias. Uno de los primeros fue el CALS, usado por las fuerzas armadas de EE.UU. para sus manuales técnicos. Otras industrias que necesitan mucha documentación, como la aeronáutica, telecomunicaciones, automoción o hardware, han creado lenguajes adaptados a sus necesidades. Esto ha llevado a que sus manuales se editen primero en formato electrónico, y luego se obtengan de ahí las versiones impresas, en línea o en CD. Un ejemplo notable fue Sun Microsystems, una empresa que decidió escribir la documentación de sus productos en SGML, ahorrando mucho dinero. El responsable de esa decisión fue Jon Bosak, quien más tarde fundaría el comité del XML.
Flexibles
Aunque al principio los lenguajes de marcado se crearon para documentos de texto, ahora se usan en áreas como gráficos vectoriales, servicios web, sindicación web o interfaces de usuario. Estas nuevas aplicaciones aprovechan la sencillez y el poder del lenguaje XML. Esto ha permitido combinar varios lenguajes de marcado diferentes en un solo archivo, como en el caso de XHTML+SMIL y de XHTML+MathML+SVG.
Galería de imágenes
-
Un lenguaje especializado basado en SGML se usa para la versión digital del Oxford English Dictionary. Permite búsquedas avanzadas y facilita la conversión a HTML.
Véase también
En inglés: Markup language Facts for Kids