HTML (Hypertext Markup Language) a été conçu pour faciliter le transfert de documents Web. À l'inverse, XML a été développé pour assurer l'interopérabilité avec SGML et HTML et faciliter la mise en œuvre.
Tableau de comparaison
Base de comparaison | XML | HTML |
---|---|---|
S'étend à | Langage de balisage extensible | Langage Signalétique Hyper Text |
De base | Fournit un cadre pour la spécification de langages de balisage. | HTML est un langage de balisage prédéfini. |
De construction | Information À condition de | Ne contient pas d'informations structurelles |
Type de langue | Sensible aux majuscules et minuscules | Insensible à la casse |
But de la langue | Transfert d'information | Présentation des données |
les erreurs | Interdit | Les petites erreurs peuvent être ignorées. |
Espace blanc | Peut être conservé. | Ne préserve pas les espaces blancs. |
Balises de fermeture | Obligatoire d'utiliser des balises de fermeture. | Les balises de fermeture sont facultatives. |
Nidification | Doit être bien fait. | Pas beaucoup de valeur. |
Définition de XML
XML (Extensible Markup Language) est un langage qui permet à un utilisateur de définir une représentation de données ou une structure de données dans laquelle des valeurs sont attribuées dans chaque champ de la structure. IBM l’a conçu en tant que GML (Generalized Markup Language) dans les années 1960. Lorsque ISO a adopté le GML d’IBM, il s’appelait SGML (Standard Generalized Markup Language) et constituait le fondement du système de documentation complexe. Le langage XML fournit une plate-forme pour définir les éléments de marquage et générer un langage de marquage personnalisé. En XML, pour créer un langage ou des éléments, il faut suivre un ensemble de règles définies dans le XML. Le document XML comprend des données sous forme de chaînes et du texte entouré de balises de texte. L'unité fondamentale du XML est appelée élément .
XML est un langage de balisage bien formé et valide. Ici, bien formé spécifie que l'analyseur XML ne peut pas transmettre le code s'il est rempli avec des erreurs de syntaxe, de ponctuation et de grammaire. De plus, il n'est valide que tant qu'il est bien formé et valide signifie que la structure de l'élément et le balisage doivent correspondre à un ensemble de règles standard.
Le document XML comprend deux parties: prologue et corps. La partie prologue du XML consiste en métadonnées administratives telles que déclaration XML, instruction de traitement facultative, déclaration de type de document et commentaires. La partie du corps est divisée en deux parties: la structure et le contenu (présent dans le texte en clair).
Définition du HTML
HTML (Hypertext Markup Language) est le langage de balisage pour la construction de pages Web. Les commandes de balisage utilisées dans le contenu Web signifient la structure du document et sa présentation pour le navigateur. Les navigateurs lisent simplement le document contenant le balisage HTML et le rendent à l'écran en examinant les éléments HTML placés dans le document. Un document HTML est considéré comme un fichier texte contenant les informations à publier.
Les instructions intégrées sont connues sous le nom d'éléments qui montrent la structuration et la présentation du document dans le navigateur Web. Ces éléments sont composés de balises à l'intérieur du crochet angulaire qui entoure du texte. Les balises viennent généralement par paire: balises de début et de fin.
Différences clés entre XML et HTML
- XML est un langage de balisage à base de texte doté de la structure auto-descriptive et pouvant définir efficacement un autre langage de balisage. D'autre part, HTML est un langage de balisage prédéfini et a une capacité limitée.
- XML fournit une structuration logique du document tandis que la structure HTML est prédéfinie, où les balises «head» et «body» sont utilisées.
- En ce qui concerne le type de langage, HTML ne respecte pas la casse. Par contre, XML est sensible à la casse.
- HTML a été conçu en mettant l’accent sur les caractéristiques de présentation des données. En revanche, XML est spécifique aux données, le stockage et le transfert des données étant la préoccupation prioritaire.
- XML ne permet pas d'erreur s'il y a des erreurs dans le code, il ne pourrait pas être analysé. Inversement, en HTML, les petites erreurs peuvent être négligées.
- Les espaces en XML sont utilisés pour une utilisation spécifique, car XML considère chaque caractère. Au contraire, HTML peut ignorer les espaces.
- Les balises en XML sont obligatoires pour être fermées, alors qu'en HTML, une balise ouverte peut également fonctionner parfaitement.
- L'imbrication dans XML doit être faite correctement, cela a une grande importance dans la syntaxe XML. Inversement, HTML ne s'intéresse pas beaucoup à l'imbrication.
Conclusion
Les langages de balisage XML et HTML sont liés, le langage HTML étant utilisé pour la présentation des données, alors que XML avait pour objectif principal de stocker et de transférer les données. HTML est un langage simple et prédéfini, tandis que XML est le langage de balisage standard permettant de définir d'autres langages. L'analyse de documents XML est simple et rapide.