Standardverallgemeinerte Markup -Sprache
![]() | |
Dateiname Erweiterung | .Sgml |
---|---|
Internet -Medientyp | Anwendung/SGML, Text/SGML |
Uniform Typ Identifier (UTI) | public.xml[Klarstellung erforderlich] |
Entwickelt von | ISO |
Art des Formats | Auszeichnungssprache |
Erweitert von | GML |
Erweitert um | Html, Xml |
Standard | ISO 8879 |
Das Standardverallgemeinerte Markup -Sprache (SGML; ISO 8879: 1986) ist ein Standard für die Definition der generalisierten Definition Markup -Sprachen Für Dokumente. ISO 8879 Anhang A.1 gibt an, dass das verallgemeinerte Markup "auf zwei basiert Postulate":[1]
- Deklarativ: Markup sollte die Struktur und andere Attribute eines Dokuments beschreiben, anstatt die Verarbeitung anzugeben, die durchgeführt werden muss, da es weniger wahrscheinlich ist, dass es zukünftigen Entwicklungen in Konflikt steht.
- Rigoros: Um Markup die zur Verarbeitung verfügbaren Techniken zu nutzen, sollte Markup Objekte wie Programme und Programme streng definieren Datenbanken.
Dokument Sgml und Linuxdoc sind Beispiele, die fast ausschließlich mit tatsächlichen SGML -Tools verwendet wurden.
Standardversionen
SGML ist ein ISO Standard: "ISO 8879: 1986 Informationsverarbeitung - Text- und Bürosysteme - Standardverallgemeinerte Markup -Sprache (SGML)", von denen es drei Versionen gibt:
- Original SGML, das im Oktober 1986 akzeptiert wurde, gefolgt von einem kleinen technischen Korrigendum.
- SGML (en)1996 resultierte aus einem technischen Korrigendum, um hinzuzufügen Erweiterte Namensregeln Ermöglichen Sie willkürlichsprachiger und -Skript -Markup.
- SGML (ENR+WWW oder WebGML), 1998, resultierte aus a Technischer Korrigendum Um die XML- und WWW -Anforderungen besser zu unterstützen.
SGML ist Teil eines Trios von ISO -Standards für elektronische Dokumente entwickelt von ISO/IEC JTC1/SC34[1][2] (Joint Technical Committee 1 ISO/IEC, Unterausschuss 34 - Dokumentenbeschreibung und Verarbeitungssprachen):
- SGML (ISO 8879) - Verallgemeinerte Markup -Sprache
- DSSSL (ISO/IEC 10179) - Dokumentverarbeitungs- und Styling -Sprache basierend auf Planen.
- HyTime - verallgemeinert Hypertext und Planung.[3]
SGML wird insbesondere durch verschiedene technische Berichte unterstützt
- ISO/IEC TR 9573 - Informationsverarbeitung - SGML -Support -Einrichtungen - Techniken zur Verwendung von SGML[4]
- Teil 13: öffentliche Einheit Sätze für Mathematik und Wissenschaft
- Im Jahr 2007 erklärte sich die W3C MathML -Arbeitsgruppe bereit, die Wartung dieser Unternehmenssätze zu übernehmen.
- Teil 13: öffentliche Einheit Sätze für Mathematik und Wissenschaft
Geschichte
SGML stieg von IBM's Verallgemeinerte Markup -Sprache (GML), was Charles Goldfarb, Edward Mosher und Raymond Lorie entwickelten sich in den 1960er Jahren. Goldfarb, Herausgeber des internationalen Standards, prägte den Begriff "GML" mit ihren Nachnameninitialen.[5] Goldfarb schrieb auch die endgültige Arbeit zur SGML -Syntax in "The SGML Handbook".[6] Die Syntax von SGML ist näher an der KAKAO Format.[Klarstellung erforderlich] Als Dokument -Markup -Sprache wurde SGML ursprünglich so konzipiert maschinenlesbar Dokumente in großem Projekt in Regierung, Recht und Industrie. Viele solcher Dokumente müssen mehrere Jahrzehnte lang lesbar bleiben - eine lange Zeit in der Informationstechnologie aufstellen. SGML wurde auch vom Militär und der Luft- und Raumfahrt-, technischen Referenz- und Industrieverlagindustrie ausgiebig angewendet. Das Aufkommen der Xml Das Profil hat SGML für eine weit verbreitete Anwendung für die Anwendung in kleinem Maßstab geeignet.

Dokumentgültigkeit
SGML (ENR+WWW) definiert zwei Arten von Gültigkeit. Nach den überarbeiteten Bedingungen und Definitionen von ISO 8879 (aus dem öffentlichen Entwurf[7]):
Ein konformes SGML-Dokument muss entweder ein Typ-Valid-SGML-Dokument, ein Tag-Valid-SGML-Dokument oder beides sein. Hinweis: Ein Benutzer möchte möglicherweise zusätzliche Einschränkungen für ein Dokument durchsetzen, z.
A Typ-Valid SGML -Dokument wird durch den Standard als definiert
Ein SGML -Dokument, in dem für jede Dokumentinstanz ein zugeordnet ist Dokumenttyperklärung (DTD), wessen DTD diese Instanz entspricht.
A Tag-Valid SGML -Dokument wird durch den Standard als definiert
Ein SGML -Dokument, dessen Dokumenteninstanzen voll markiert sind. Es muss keine geben Dokumenttyperklärung mit einer der Fälle verbunden. Hinweis: Wenn es a ist DokumenttyperklärungDie Instanz kann mit oder ohne Hinweis darauf analysiert werden.
Terminologie
Tag-Validität wurde in SGML (ENR+WWW) zur Unterstützung eingeführt Xml Dies ermöglicht Dokumente ohne DocType -Erklärung, die jedoch ohne Grammatik analysiert werden können, oder Dokumente mit einer DocType -Erklärung, die keine macht XML Infoset Beiträge zum Dokument. Der Standard nennt dies voll markiert. Integral gespeichert reflektiert die Xml Anforderung, dass Elemente in derselben Einheit enden, in der sie angefangen haben. Referenzfrei reflektiert die Html Erfordernis, dass Entitätsreferenzen für Sonderzeichen gelten und kein Markup enthalten. SGML -Validitätskommentar, insbesondere Kommentar, der vor 1997 abgelegt wurde oder der SGML (ENR+WWW) nicht weiß, Covers Typ-Validität nur.
Die SGML -Betonung auf die Gültigkeit unterstützt die Anforderung für ein verallgemeinertes Markup, das Markup sollte streng sein. (ISO 8879 A.1)
Syntax
Ein SGML -Dokument kann drei Teile haben:
- die SGML -Erklärung,
- Der Prolog, der eine DocType -Erklärung mit den verschiedenen enthält Markup -Erklärungen das zusammen macht a Dokumenttypdefinition (DTD) und
- Die Instanz selbst, die ein erstklassiges Element und seinen Inhalt enthält.
Ein SGML -Dokument kann aus vielen komponiert werden Entitäten (diskrete Textstücke). In SGML können die im Dokument verwendeten Entitäten und Elementtypen mit einem DTD angegeben werden. Betonsyntax des Dokuments.
Obwohl die vollständige SGML implizite Markup und einige andere Arten von Tags ermöglicht, ist die Xml Spezifikation (S4.3.1) Staaten:
Jedes XML -Dokument hat sowohl eine logische als auch eine physikalische Struktur. Physikalisch besteht das Dokument aus Einheiten, die als Unternehmen bezeichnet werden. Ein Unternehmen kann sich auf andere Unternehmen beziehen, um ihre Aufnahme in das Dokument zu verursachen. Ein Dokument beginnt in einer "Root" oder einer Dokumententität. Logischerweise besteht das Dokument aus Erklärungen, Elementen, Kommentaren, Charakterreferenzen und Verarbeitungsanweisungenalle sind im Dokument durch explizites Markup angegeben.
Einführende Informationen zu einer grundlegenden, modernen SGML -Syntax finden Sie unter Xml. Das folgende Material konzentriert sich auf Merkmale nicht in XML und ist keine umfassende Zusammenfassung der SGML -Syntax.
Optionale Funktionen
SGML verallgemeinert und unterstützt eine breite Palette von Markup -Sprachen, wie Mitte der 1980er Jahre gefunden. Diese reichten von knapp Wiki-ähnliche Syntaxe zu RTF-ähnliche Sprachen mit Klammern zu Html-ähnliche Matching-Tag-Sprachen. SGML tat dies mit einem relativ einfachen Standard Referenzbetonsyntax erweitert mit einer großen Anzahl optionaler Funktionen, die in der SGML -Erklärung aktiviert werden können. Nicht jeder SGML -Parser kann unbedingt jedes SGML -Dokument verarbeiten. Weil jeder Prozessor Systemerklärung kann mit dem Dokument verglichen werden SGML -Erklärung Es ist immer möglich zu wissen, ob ein Dokument von einem bestimmten Prozessor unterstützt wird.
Viele SGML -Funktionen beziehen sich auf die Markinierung von Markups. Andere Funktionen beziehen sich auf gleichzeitiger (paralleler) Markup (Übereinstimmung) mit der Verknüpfung von Verarbeitungsattributen (Link) und zur Einbettung von SGML -Dokumenten in SGML -Dokumente (Subdoc).
Der Begriff der anpassbaren Funktionen war nicht für die Webnutzung geeignet, daher ein Ziel von Xml war, optionale Funktionen zu minimieren. Die Wohlstandsregeln von XML können jedoch keine Wiki-ähnlichen Sprachen unterstützen, was sie nicht in die Nicht-Text-Informationssysteme integrieren und schwer zu integrieren.
Konkrete und abstrakte Syntaxe
Das übliche (Standard) SGML Betonsyntax ähnelt diesem Beispiel, was der Standard ist Html Betonsyntax:
Typ ="Beispiel"> Normalerweise so etwas wie Dies
SGML bietet an Zusammenfassung Syntax das kann sein implementiert in vielen verschiedenen Arten von Betonsyntax. Obwohl die Markup -Norm verwendet Winkelklammern als Start- und End-Tag Grenzwerte in einem SGML-Dokument (gemäß Standard-definiert Referenzbetonsyntax)) Es ist möglich, andere Zeichen zu verwenden - ein geeignetes Gebot Betonsyntax ist in der SGML -Erklärung des Dokuments definiert.[8] Zum Beispiel könnte ein SGML -Dolmetscher programmiert werden, um GML zu analysieren, wobei die Tags mit einem linken Abschluss abgrenzt werden Doppelpunkt und ein Recht Punktsomit ein : e Das Präfix bezeichnet ein End -Tag: : xmp.hello, Welt: exmp.
. Gemäß der Referenzsyntax unterscheidet sich die Buchstabe-Fälle (ober- oder niedriger) nicht in Tag-Namen, somit die drei Tags: (i).
(ii)
und (iii)
sind äquivalent. (HINWEIS: Eine konkrete Syntax könnte Rückgeld Diese Regel über die Namenserklärungen der Namensschreiberennamen).
Markup -Minimierung
SGML verfügt über Funktionen zur Reduzierung der Anzahl der Zeichen, die zum Markieren eines Dokuments erforderlich sind, das in der SGML -Erklärung aktiviert werden muss. SGML -Prozessoren müssen nicht jede verfügbare Funktion unterstützen, sodass Anwendungen viele Arten von versehentlichen Markup -Auslassungen tolerieren können. SGML -Systeme sind jedoch normalerweise in Unverträglichkeit gegen ungültige Strukturen. XML ist intolerant gegenüber Syntaxauslassungen und benötigt keine DTD für die Überprüfung der Wohltat.
Omittag
Beide Start -Tags und End -Tags können in einer Dokumentinstanz weggelassen werden, sofern:
- Die Omittag -Funktion ist in der SGML -Erklärung aktiviert.
- Der DTD zeigt an, dass die Tags weggelassen werden dürfen,
- (Für Start -Tags) Das Element ist nicht zugeordnet (nicht erforderlich (
#ERFORDERLICH
) Attribute und - Das Tag kann durch den Kontext eindeutig abgeleitet werden.
Wenn OMittag Ja beispielsweise in der SGML -Deklaration angegeben ist (Aktivierung der Omittag -Funktion), enthält die DTD die folgenden Erklärungen:
Kapitel - - (Titel, Sektion+))> Titel o o (#Pcdata)> Sektion - - (Titel, Unterabschnitt+))>
Dann dieser Auszug:
Einführung in SGMLDie SGML -Erklärung ...
das lässt zwei aus
Tags und zwei Tags, würde ein gültiges Markup darstellen.
Das Auslassen von Tags ist optional - der gleiche Auszug könnte so markiert werden:
Einführung in SGML Die SGML -Erklärung ...
und würde immer noch gültiges Markup darstellen.
HINWEIS: Die Omittag -Funktion hat nichts mit der Markierung von Elementen, deren deklarierter Inhalt ist LEER
wie in der DTD definiert:
Bild - o LEER>
So definierte Elemente haben kein End -Tag, und die Angabe eines in der Dokumentinstanz würde zu einem ungültigen Markup führen. Dies unterscheidet sich syntaktisch von Xml leere Elemente in dieser Hinsicht.
Shortref
Tags können durch die Shortref -Funktion durch Trennzeichen für ein Terser -Markup ersetzt werden. Dieser Markup -Stil ist jetzt mit Wiki Markup, z.B. wobei zwei Gleichzeichen (==) zu Beginn einer Linie das "Kopfstart-Tag" und zwei gleiche Zeichen (==) sind, danach sind die "Überschriften-End-Tag".
Shorttag
SGML -Markup -Sprachen, deren konkrete Syntax die ShortTag -Wertfunktion ermöglicht, benötigen keine Attributwerte, die nur alphanumerische Zeichen enthalten, um in Anführungszeichen eingeschlossen zu werden - entweder doppelt "" "
(Beleuchtet) oder ledig '' '
(Lita) - damit das vorherige Markup -Beispiel geschrieben werden könnte:
Typ =Beispiel> Normalerweise so etwas wie Dies</>
Eine Merkmal von SGML -Markupsprachen ist das "Messenspures leeres Tagging", so dass das leere Endetag >
in
"Erben" seinen Wert vom nächsten vorherigen Vollstart -Tag, das in diesem Beispiel ist
(Mit anderen Worten, es schließt das zuletzt geöffnete Element). Der Ausdruck ist somit äquivalent zu
.
NETZ
Ein weiteres Merkmal ist das NETZ (NULL END TAG) Konstruktion:
, was strukturell äquivalent zu
.
Andere Eigenschaften
Darüber hinaus ermöglicht die Shorttag NetNabling -Funktionsfunktion, die einen leeren Textwert umgeben, aber es verbietet jedoch, vollständige Tags zu verkürzen:
kann geschrieben werden als
woin der erste Schrägstrich ( /) steht für das net-fehlende "Start-Tag Close" (NESTC) und der zweite Schrägstrich steht für das Netz. HINWEIS: XML definiert NESTC mit a /und Netz mit einem > (abgewinkelte Klammer) - daher erscheint das entsprechende Konstrukt in XML als
.Die dritte Funktion ist "Text in derselben Zeile", sodass ein Markup-Element mit einem Zeilenende beendet werden kann. Besonders nützlich für Überschriften und dergleichen, die entweder Shortref- oder DataTAG -Minimierung verwendet werden müssen. Wenn die DTD beispielsweise die folgenden Erklärungen enthält:
Linien (Linie*)> Linie O - (#Pcdata)> Line-Tagc "</line>"> eine Linie "&#Re; &#rs;" Line-Tagc> eine Linie Linie>
(und "&#Re; &#rs;" ist ein kurzer Verweis in der Betonsyntax) und dann:
erste Zeile zweite Zeile ist äquivalent zu:
erste Linie zweite Reihe Formale Charakterisierung
SGML verfügt über viele Funktionen, die sich einer praktischen Beschreibung mit dem beliebten Formal widersetzten Automatenheorie und der Zeitgenosse Parser Technologie der 1980er und 1990er Jahre. Der Standard warnt in Anhang H:
Die SGML Modellgruppe Notation wurde absichtlich so konzipiert, dass sie dem ähneln regulären Ausdruck Notation von Automaten Theorie, weil die Automatenheorie eine theoretische Grundlage für einige Aspekte des Begriffs der Konformität mit einem Inhaltsmodell liefert. Über die allgemeine Anwendbarkeit von Automata auf Inhaltsmodelle sollte keine Annahme getroffen werden.
Ein Bericht über eine frühzeitige Umsetzung eines Parsers für Basic SGML, den Amsterdam SGML Parser,[9] Anmerkungen
Die DTD-Grammatik in SGML muss einem Eindeutigkeitsbegriff entsprechen, der den ll (1) Bedingungen stark ähnelt
und gibt verschiedene Unterschiede an.
Es scheint keine endgültige Klassifizierung von SGML gegen eine bekannte Klasse von zu geben formelle Grammatik. Plausible Klassen können umfassen Bree-Adjoining-Grammatiken und Anpassende Grammatiken.
XML wird als im Allgemeinen als a -antretbar beschrieben wie a Zwei-Stufe Grammatik für nicht validierte XML und a Conway-Stil -Pipeline von Coroutinen (Lexer, Parser, Validator) für gültige XML.[10] Es wird berichtet, dass die SGML -Produktionen im ISO -Standard LL (3) oder LL (4) sind.[11] Es wird berichtet W-Grammatik.[12] Laut einem Papier,[13] und wahrscheinlich bei einem berücksichtigt Informationssatz oder Baum analysieren Ebene eher als einen Charakter oder ein Trennzeichen:
Die Klasse von Dokumenten, die einem bestimmten SGML -Dokument entsprechen Grammatik bildet eine LL (1) Sprache. ... Die SGML -Dokumentgrammatiken selbst sind jedoch keine Grammatiken.
Der SGML -Standard definiert SGML nicht mit formalen Datenstrukturen, wie z. Bäume analysieren; Ein SGML -Dokument besteht jedoch aus a verwurzelte acyclische Graphen (RDAG) von physischen Speichereinheiten, die als "bekannt"Entitäten", das in eine RDAG von Struktureinheiten analysiert wird, die als" Elemente "bekannt sind Entitätsbaum, aber Entitäten können mehrmals erscheinen. Darüber hinaus wird das Strukturdiagramm auch lose als eine charakterisiert ElementbaumAber das ID/IDREF -Markup ermöglicht willkürliche Bögen.
Die Ergebnisse der Parsen können auch als Datenbaum in verschiedenen Notationen verstanden werden. Wo das Dokument der Stammknoten ist und Entitäten in anderen Notationen (Text, Grafiken) untergeordnete Knoten. SGML bietet Vorrichtungen zum Verknüpfen und Annotieren von externen Nicht-SGML-Unternehmen.
Der SGML -Standard beschreibt es in Bezug auf Karten und Erkennungsmodi (S9.6.1). Jede Entität und jedes Element kann eine zugeordnete haben Notation oder deklarierter Inhaltstyp, was die Arten von Referenzen und Tags bestimmt, die in dieser Entität und Element anerkannt werden. Außerdem kann jedes Element eine zugeordnete haben Grenzkarte (und kurze Referenzkarte), was bestimmt, welche Zeichen im Kontext als Grenzwerte behandelt werden. Der SGML -Standard charakterisiert das Parsen als Zustandsmaschine Wechsel zwischen Erkennungsmodi. Während der Parsen gibt es einen Stapel Karten, die die konfigurieren Scanner, während Tokenizer bezieht sich auf die Erkennungsmodi.
Das Parsen beinhaltet das Durchqueren des dynamisch eingereichten Entitätsdiagramms, das Finden/Implizieren von Tags und die Elementstruktur und die Validierung dieser Tags gegen die Grammatik. Ein ungewöhnlicher Aspekt von SGML ist, dass die Grammatik (DTD) beide passiv verwendet wird - zu erkenne lexikalische Strukturen und aktiv - zu generieren Fehlende Strukturen und Tags, die die DTD optional erklärt hat. End- und Start-Tags können weggelassen werden, da sie abgeleitet werden können. Lose kann eine Reihe von Tags nur dann weggelassen werden, wenn es einen einzigen, möglichen Weg in der Grammatik gibt, um sie zu implizieren. Es war diese aktive Verwendung von Grammatiken, die das Parsen von Beton -SGML schwer zu förmlich zu charakterisieren machten.
SGML verwendet den Begriff Validierung sowohl für Anerkennung als auch für Generation. XML verwendet die Grammatik (DTD) nicht, um Trennzeichenkarten zu ändern oder die Parse -Modi zu informieren, und erlaubt nicht Tag -Auslassung; Folglich ist die XML -Validierung von Elementen in dem Sinne nicht aktiv, dass die SGML -Validierung aktiv ist. SGML ohne Ein DTD (z. B. einfaches XML) ist eine Grammatik oder eine Sprache; SGML mit Ein DTD ist ein Metallanguage. SGML mit einer SGML-Erklärung ist vielleicht eine Meta-Metalanguage, da es sich um eine Metallgruppe handelt, deren Deklarationsmechanismus ist eine Metallgruppe.
SGML hat eine abstrakte Syntax, die von vielen möglichen Betonsyntaxen implementiert wird. Dies ist jedoch nicht die gleiche Verwendung wie in einem Zusammenfassung Syntaxbaum und wie in a Betonsyntaxbaum. In der SGML -Verwendung ist eine konkrete Syntax eine Reihe spezifischer Grenzwerte, während die abstrakte Syntax die Namenssatz für die Grenzwerte ist. Das XML Infoset entspricht mehr dem Programmiersprachenbegriff der abstrakten Syntax, die durch eingeführt wurde durch John McCarthy.
Derivate
Xml
Das W3c XML (Extensible Markup Language) ist ein Profil (Teilmenge) von SGML, das die Implementierung des Parsers im Vergleich zu einem vollständigen SGML -Parser, vor allem zur Verwendung im World Wide Web, erleichtert. Zusätzlich zur Deaktivierung vieler SGML -Optionen, die in der Referenzsyntax vorhanden sind (z. B. Ablassen von Tags und verschachtelten Subdokumenten), fügt XML eine Reihe zusätzlicher Einschränkungen für die Arten der SGML -Syntax hinzu. Trotz der Ermöglichung von SGML -verkürzten Tag -Formularen erlaubt XML keine nicht abgestellten Start- oder End -Tags. Es stützte sich auch auf viele der Ergänzungen des WebGML -Anhangs. XML wird derzeit häufiger verwendet als die vollständige SGML. XML hat leicht Internationalisierung bezogen auf Unicode. Anwendungen von XML umfassen Xhtml, XQuery, Xslt, XForms, Xpointer, JSP, SVG, RSS, Atom, XML-RPC, RDF/XML, und SEIFE.
Html
Während HTML (Hyper Text Markup -Sprache) teilweise unabhängig und parallel zu SGML, seinem Schöpfer, entwickelt wurde, wurde Tim Berners-Lee, beabsichtigte es, eine Anwendung von SGML zu sein. Das Design von HTML wurde daher durch SGML -Tagging inspiriert, aber da keine klaren Expansions- und Parsen -Richtlinien festgelegt wurden, sind die meisten tatsächlichen HTML -Dokumente keine gültigen SGML -Dokumente. Später wurde HTML umformuliert (Version 2.0), um eher eine SGML -Anwendung zu sein. Die HTML-Markup-Sprache hat jedoch viele ältere und Ausnahmebehandlung, die sich von den Anforderungen von SGML unterscheiden. HTML 4 ist eine SGML -Anwendung, die sich vollständig an ISO 8879 - SGML entspricht.[14]
Die Charta für die Wiederbelebung des Jahres 2006 der World Wide Web Konsortium Die HTML -Arbeitsgruppe sagt: "Die Gruppe wird nicht davon ausgehen, dass ein SGML -Parser für 'Classic HTML' verwendet wird."[15] Obwohl die HTML -Syntax der SGML -Syntax mit der Standardeinstellung stark ähnelt Hinweis Betonsyntax, HTML5 Verankert jeden Versuch, HTML als SGML -Anwendung zu definieren und ausdrücklich seine eigenen Parsing -Regeln zu definieren.[16] die vorhandenen Implementierungen und Dokumenten besser übereinstimmen. Es definiert jedoch eine Alternative Xhtml Serialisierung, die XML und damit auch SGML entspricht.[17]
OED
Die zweite Ausgabe der Oxford Englisch Wörterbuch (OED) ist vollständig mit einer SGML-basierten Markup-Sprache mit der Markup-basierte Marke gekennzeichnet Lexx Texteditor.[18]
Die dritte Ausgabe ist als XML markiert.
Andere
Andere Dokument-Markup-Sprachen beziehen sich teilweise mit SGML und XML zusammen. Die Z -Format -Markup -Sprache für die Typensetzung und Dokumentation ist ein Beispiel.
Mehrere moderne Programmiersprachen unterstützen Tags als primitive Token -Typen oder unterstützen jetzt Unicode und regulären Ausdruck Musteranpassung. Ein Beispiel ist das Scala -Programmiersprache.
Anwendungen
Mit SGML definierte Dokument -Markup -Sprachen werden vom Standard als "Anwendungen" bezeichnet. Viele Pre-XML-SGML-Anwendungen waren proprietäres Eigentum der Organisationen, die sie entwickelten und daher im World Wide Web nicht verfügbar waren. Die folgende Liste enthält Pre-XML-SGML-Anwendungen.
- Textcodierungsinitiative (TEI) ist ein akademisches Konsortium, das technische Standards für Textdarstellungsanwendungen für digitale Formatträte entwirft, pflegt und entwickelt.
- Dokument ist eine Markup -Sprache, die ursprünglich als SGML -Anwendung erstellt wurde, die für die Autoration technischer Dokumentation entwickelt wurde; Docbook ist derzeit eine XML -Anwendung.
- Cals (Continuous Acquisition and Life Cycle Support) ist eine Initiative des US-Verteidigungsministeriums (DOD) zur elektronischen Erfassung militärischer Dokumente und zur Verknüpfung verwandter Daten und Informationen.
- HyTime Definiert eine Reihe hypertextorientierter Elementtypen, mit denen die Autoren von SGML-Dokumenten Hypertext- und Multimedia-Präsentationen erstellen können.
- Edgar (Elektronische Datenerfassung, Analyse und Abruf) Systemeffekte automatisierte Sammlung, Validierung, Indexierung, Akzeptanz und Weiterleitung von Einsendungen durch Unternehmen und andere, die gesetzlich verpflichtet sind Sec).
- Linuxdoc. Die Dokumentation für Linux -Pakete hat das LinuxDOC SGML DTD und das Docbook XML DTD verwendet.
- AAP DTD ist ein Dokumenttypdefinition zum wissenschaftlich Dokumente, definiert durch die Vereinigung der amerikanischen Verlage.
- ISO 12083, ein Nachfolger von AAP DTP, ist ein internationaler SGML -Standard für den Dokumentenwechsel zwischen Autoren und Verlegern.
- Sgmlguid war eine frühe SGML -Dokumenttypdefinition, die bei erstellt, entwickelt und verwendet wurde Cern.
Open-Source-Implementierungen
Von Bedeutung Open Source Die Implementierungen von SGML haben einbezogen:
- ASP-SGML
- Bogen-SGML, nach Standardverallgemeinerungs -Markup -Sprachnutzern, 1991, c Sprache
- SGMLS, von James Clark, 1993, c Sprache
- Projekt yao, von Yuan-Ze Institute of Technology, Taiwan, mit Charles Goldfarb, 1994, Objekt
- Sp von James Clark, C ++ Sprache
SP und Jade, die zugehörigen DSSL -Prozessoren, werden von der aufrechterhalten Openjade Projekt und sind gemeinsame Teile von Linux -Verteilungen. Ein allgemeines Archiv der SGML -Software und -material Sonnenuntergang. Die ursprüngliche HTML-Parser-Klasse in der Implementierung von Java durch das Sun System ist ein SGML-Parser mit begrenzter Feature unter Verwendung von SGML-Terminologie und -konzepten.
Siehe auch
- Organisation zur Weiterentwicklung strukturierter Informationsstandards (OASIS)
- S-Expression
- DSSSL- a Planen-basierte Verarbeitungssprache ähnlich wie XSL
- Latex
- Liste der Allzweck -Markupsprachen
- Auszeichnungssprache
- SGML -Entität
- HyTime
- Tag -Auslassung
- Xml
Verweise
- ^ a b ISO. "JTC 1/SC 34 - Dokumentbeschreibung und Verarbeitungssprachen". ISO. Abgerufen 2009-12-25.
- ^ ISO JTC1/SC34. "JTC 1/SC 34 - Dokumentbeschreibung und Verarbeitungssprachen". Abgerufen 2009-12-25.
- ^ ISO/IEC 10744- - HyTime
- ^ "ISO/IEC TR 9573" (PDF). ISO. 1991. Abgerufen 5. Dezember 2017.
- ^ Goldfarb, Charles F. (1996). "Die Wurzeln von SGML - eine persönliche Erinnerung". Abgerufen 7. Juli, 2007.
- ^ Goldfarb, Charles F. (1990). Das SGML -Handbuch. ISBN 9780198537373.
- ^ "Begriffe und Definitionen von ISO 8879 Entwurf".
- ^ Wohler, Wayne (21. Juli 1998). "SGML -Erklärungen". Abgerufen 17. August, 2009.
- ^ Egmond (Dezember 1989). "Die Implementierung des Amsterdam SGML Parser" (PDF).
- ^ Carroll, Jeremy J. (26. November 2001). "Coparsing von RDF & XML" (PDF). Hewlett Packard. Abgerufen 9. Oktober, 2009.
- ^ "SGML: Grammatikproduktionen".
- ^ "Re: Andere Whitespace -Probleme waren Re: Whitespace -Regeln (v2)".
- ^ Bruggemann-Klein. "Compiler-Construction-Tools und -Techniken für SGML-Parsers: Schwierigkeiten und Lösungen".
- ^ "HTML 4–4 Konformität: Anforderungen und Empfehlungen". Abgerufen 2009-12-30.
- ^ Lilley, Chris; Berners-Lee, Tim (6. Februar 2009). "HTML Working Group Charter". Abgerufen 19. April, 2007.
- ^ "HTML5 - HTML -Dokumente analysieren". World Wide Web Konsortium. 28. Oktober 2014. Abgerufen 29. Juni, 2015.
- ^ Dubost, Karl (15. Januar 2008). "HTML 5, ein Wortschatz, zwei Serialisierungen". Fragen & Antworten Blog. W3c. Abgerufen 25. Februar, 2009.
- ^ Cowlishaw, M. F. (1987). "Lexx - ein programmierbarer strukturierter Editor". IBM Journal of Research and Development. IBM. 31 (1): 73. doi:10.1147/rd.311.0073.
Externe Links
- Überblick über SGML -Ressourcen Auf der W3C -Website.
- Einführung und Beispiele für Softwaredokumentation in SGML
- Aufzeichnungen des SC34 -Ausschusses, Charles Babbage Institute- Sammlung zur Entwicklung von SGML und andere Standards, die die Entwicklung aktueller XML -Tools beeinflussen; Zu den Dokumenten gehören frühe Entwürfe von SGML -Verwaltungsmaterialien, Dokumentation, Arbeitsgruppenpapieren und Standards für Computersprachen.
- SGML -Syntaxzusammenfassung von Charles Goldfarb
- SGML -Dokument, das Sie mit SGML vorstellt; Einige Gründe, warum SGML wichtig ist
- Die SGML -ErklärungIn SGML und HTML erklärten Martin Bryan (1997) (die ursprüngliche URL ist unterbrochen bei http://www.is-hought.co.uk/book/sgml-4.htm#fig4-2)
- SGML -Erklärungen Wayne Wohler, IBM Corporation, 1994.
- ISO 9069: 1988 - Informationsverarbeitung - SGML -Support -Einrichtungen - SGML -Dokument -Interchange -Format (SDIF)
- ISO/IEC 9070: 1991 - Informationstechnologie - SGML -Support -Einrichtungen - Registrierungsverfahren für öffentliche Textinhaber -Kennungen