Le langage XML et XSL

Le langage XML

Avant de débuter …

Prérequis
Si le langage Html est accessible au plus grand nombre, avec le langage XML vous jouez déjà un peu dans « la cour des grands ». Le XML est de loin plus abstrait et donc plus complexe que le Html. Bien que ce tutorial se limitera à une découverte basique du XML, il est quasi indispensable pour en tirer quelques profits d’avoir :
– une connaissance et une pratique aiguë du langage Html.
– une connaissance et une pratique de la conception de pages Web.
– de bonnes notions de feuilles de style (CSS).
– des notions de Javascript ou de VBscript.
Pas que quoi fouetter un chat sur le plan esthétique… Le XML n’est que de l’information encodée entre des balises. Il faudra d’autres éléments, comme par exemple un fichier XSL, pour que le navigateur puisse « comprendre » vos balises et afficher ce fichier sous une forme plus conviviale. D’où notre titre : XML plus XSL ou XML + XSL.
Les limites et les objectifs
Le XML est un langage de professionnels de la conception de sites et ne sera que très rarement utilisé par les amateurs, même éclairés, de la publication sur le Web auxquels s’adresse ce site. Que ces amateurs soient cependant rassurés, pour eux le Html a encore de beaux jours devant lui…

Le langage XML

Le SGML pour Standard Generalized Markup Language est un langage normalisé pour la génération de langages de balises. Cette norme internationale [ISO8879] pour décrire la structure et le contenu de différents types de documents électroniques remonte à la nuit des temps de l’informatique et d’Internet. Ce langage très professionnel a la particularité d’être très concis et très abstrait. En conséquence, il n’est que très difficilement utilisable par le commun des mortels. Sa descendance est pourtant assez nombreuse et vous ne pouvez ne pas connaître un de ses enfants qui est un langage de balises utilisé pour la publication sur le Web : le HTML HyperText Markup Language.

Le XML

Le XML pour eXtensible Markup Language est donc un langage de balises comme le Html mais il est extensible, évolutif. En XML, les balises ne sont pas prédéfinies. C’est vous qui devez ou pouvez définir vos propres balises.
Et c’est là le problème ! Si les braves navigateurs n’avaient plus de difficultés pour afficher les balises prédéfinies du Html comme les <H1>, <BR> ou autres <TABLE>, que doivent-ils faire avec vos balises <ok> ou <new> ? Le XML a comme vocation de décrire de l’information et pas d’afficher celle-ci. Ainsi le XML pourtant créé en 1999, est resté durant près de deux ans, un concept plutôt abstrait et théorique faute de moyens fiables pour en afficher le résultat. Avec le développement de nouvelles techniques comme le XSL, il est devenu possible de percevoir concrètement les énormes potentialités de ce nouveau langage.

Le XML et le HTML

Le HTML et le XML ne sont pas comparables
Lorsqu’on étudie les moyens de publication sur le Web, on est inévitablement tenté de faire une comparaison entre le HTML et le XML. Au contraire de ce qui a déjà été écrit par ailleurs, le XML n’est pas le successeur du Html. Le XML n’est pas le futur du Html. Le XML n’est pas le remplaçant du Html.
Une seule similitude : le SGML
Le XML et le HTML sont deux langages distincts !
Le seul point commun entre le HTML et le XML est qu’ils sont issus tous deux de la même « mère » soit le SGML Standardized Generalised Markup Language qui est le langage de référence en milieu professionnel pour tout ce qui concerne la gestion électronique des documents. Ils sont donc, tous deux, des langages de balises [Markup Language]. Ils ont également des caractéristiques communes héritées du SGML qui sont de transporter sur le Web des données en mode texte [plain text], compatibles avec n’importe quelle plateforme logicielle.

Lire sur cLicours.com :  Cours pdf création d’un document XML valide

La syntaxe du XML

Le XML impose des règles de syntaxe très spécifiques par rapport au Html. En outre, on retrouvera ces mêmes règles de syntaxe dans tous les langages dérivés du XML comme le XHTML ou le WML par exemple.
° Le XML est un langage de balises [Markup Language].
Mais au contraire du Html où les balises sont définies, vous devez inventer vos balises. Rappelezvous, le XML est eXtensible. Il faut donc écrire soi-même le nom des balises utilisées.
Il y a quelques règles pour la composition des noms (mais elle ne dérouteront pas les habitués du Javascript) :
− Les noms peuvent contenir des lettres, des chiffres ou d’autres caractères.
− Les noms ne peuvent débuter par un nombre ou un signe de ponctuation.
− Les noms ne peuvent commencer par les lettres xml (ou XML ou Xml…).
− Les noms ne peuvent contenir des espaces.
− La longueur des noms est libre mais on conseille de rester raisonnable.
− On évitera certains signes qui pourraient selon les logiciels, prêter à confusion comme
« -« , « ; », « . », « <« , « > », etc.
− Les caractères spéciaux pour nous francophones comme é, à, ê, ï, ù sont à priori permis mais pourraient être mal interprétés par certains programmes.

Un premier document XML

Voici un premier document XML.
Rien de bien compliqué mais ce document sera étoffé en cours d’étude.
<?xml version= »1.0″ encoding= »ISO-8859-1″?>
La déclaration <?xml version= »1.0″?> indique au navigateur que ce qui suit est un document XML selon sa version 1.0. Vous remarquerez que cette balise ne comporte pas de signe de fermeture car cette balise n’est pas encore du XML.
On en profite généralement pour notifier le « character set » qui indique à l’interpréteur XML [Parser] le jeu de caractères à utiliser. Le jeu de caractères « ISO-8859-1 » a, pour nous francophones, l’avantage d’accepter la plupart des lettres avec des accents. Mais il existe d’autres jeux de caractères comme UTF-8 ou UTF-16 plutôt destinés aux anglo-saxons car ils ne reprennent pas les accents.
<racine>
L’élément racine indispensable au XML. Vous pouvez utiliser, à votre convenance, n’importe quel nom à l’intérieur de cette balise de racine.
… suite du document XML …
Votre document XML proprement dit, qui respectera bien entendu scrupuleusement la syntaxe du XML (« bien formé »).
</racine>
Le document XML se termine obligatoirement à la fermeture de la balise de racine.

Le langage XML et XSL

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.