SGML (Lenguaje de marcado generalizado estándar) es un estándar sobre cómo especificar un lenguaje de marcado de documentos o un conjunto de etiquetas. Dicha especificación es en sí misma una definición de tipo de documento (DTD). SGML no es en sí mismo un lenguaje de documentos, sino una descripción de cómo especificar uno. Son metadatos.
SGML se basa en la idea de que los documentos tienen elementos estructurales y otros elementos semánticos que pueden describirse sin hacer referencia a cómo deben mostrarse dichos elementos. La visualización real de dicho documento puede variar, según el medio de salida y las preferencias de estilo. Algunas ventajas de los documentos basados en SGML son:
- Se pueden crear pensando en términos de estructura del documento en lugar de características de apariencia (que pueden cambiar con el tiempo).
- Serán más portátiles porque un compilador SGML puede interpretar cualquier documento por referencia a su definición de tipo de documento (DTD).
- Los documentos originalmente destinados al medio de impresión se pueden readaptar fácilmente para otros medios, como la pantalla de visualización de la computadora.
El lenguaje que utiliza este navegador web, lenguaje de marcado de hipertexto (HTML), es un ejemplo de lenguaje basado en SGML. Existe una definición de tipo de documento para HTML (y leer la especificación HTML es leer efectivamente una versión ampliada de la definición de tipo de documento). En el entorno de redes distribuidas actual, muchos documentos se describen con el Lenguaje de marcado extensible (XML), que es un lenguaje de descripción de datos (y un documento puede verse como una colección de datos) que utiliza principios SGML.
SGML se basa en cierta medida en lenguajes de marcado generalizados anteriores desarrollados en IBM, incluidos General Markup Language (GML) e ISIL.