XML – ćwiczenia 10: XSLT (3)

Jeszcze o serializacji

Procesor XSLT może, ale nie musi, udostępniać funkcjonalność serializacji – zamiany wynikowego drzewa na ciąg bajtów. Wpływ na sposób serializacji mają parametry serializacji, które można ustawiać:

Pełny opis elementów output i result-document w rekomendacji. Poniżej opis niektórych aspektów serializacji.

Wersja XML lub HTML

Parametr version służy do określenia wersji standardu XML (dla metody XML i XHTML) lub HTML (dla metody HTML).

Deklaracja DOCTYPE

Parametry doctype-public i doctype-system służą do umieszczenia w wyniku deklaracji DOCTYPE. Mają znaczenie przy metodach serializacji XML, XHTML i HTML. Należy ich używać, aby wynik był walidującym się HTML bądź XHTML.

Lista deklaracji DOCTYPE W3C.

Przykład 1.

Deklaracja output dla XHTML 1.1 (z domyślnym zestawem modułów).

<xsl:output method="xhtml" version="1.0" encoding="utf-8"
	doctype-public="-//W3C//DTD XHTML 1.1//EN"
	doctype-system="http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd"/>

Efekt w dokumencie

<!DOCTYPE html
  PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">

Zadanie 1.

Do arkusza z poprzednich zajęć (np. z zadania o rozdziałach lub przykładowego o studentach) dodaj informację o wersji i DOCTYPE właściwy dla HTML 4.01.

Sekcje CDATA

Parametr serializacji cdata-section-elements może zawierać (rozdzielone spacjami) nazwy elementów wyniku, których zawartość tekstowa ma być umieszczona w sekcjach CDATA.

Jeśli umieszczenie całego tekstu w jednej sekcji jest niemożliwe, może powstać kilka sekcji.

Zadanie 2.

W arkuszu z poprzednich zajęć wymuś używanie sekcji CDATA. Na przykład dla arkusza o rozdziałach zrób to dla elementu p.

Mapowanie znaków

W XSLT 2.0 istnieje mechanizm do zastępowania na wyjściu wskazanych znaków innymi napisami. Można zastąpić jedynie znaki z węzłów tekstowych i wartości atrybutów (a nie np. nazw elementów).

Napis wstawiany w miejsce znaku nie jest już w żaden sposób przetwarzany. Wynikowy dokument może więc być niepoprawny składniowo (gdy wstawiany napis zawiera znaki specjalne).

Mechanizm ten nie pozwala na stosowanie różnych character maps w różnych fragmentach dokumentu. W takich sytuacjach przydatna może być instrukcja analyze-string. Uwaga, instrukcja analyze-string działa w warstwie logicznej, podczas gdy mapowanie znaków tylko podczas serializacji.

Przykład 2.

Plik: charmaps1.xsl.

Kopiuje dowolny dokument XML. Przy serializacji zastępuje „polskie znaki” łacińskimi odpowiednikami.

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output method="xml" encoding="ascii" use-character-maps="polskie_na_ascii"/>
  
  <xsl:character-map name="polskie_na_ascii">
  	<xsl:output-character character="Ą" string="A"/>
  	<xsl:output-character character="Ć" string="C"/>
  	<!-- ... -->
  	<xsl:output-character character="ź" string="z"/>
  	<xsl:output-character character="ż" string="z"/>
  </xsl:character-map>
  
  <xsl:template match="/">
  	<xsl:copy-of select="."/>
  </xsl:template>
</xsl:stylesheet>

Pomijanie niepotrzebnych deklaracji przestrzeni nazw

Dla metod serializacji XML i XHTML, do wyniku zapisywane są deklaracje wszystkich przestrzeni nazw obowiązujących w elementach, które mają trafić do wyniku. Powoduje to niepotrzebne dodawanie do wyniku deklaracji przestrzeni nazw XML Schema, funkcji XPath i innych.

Aby tego uniknąć, można wykorzystać atrybut exclude-result-prefixes. W atrybucie tym można umieścić:

  • listę rozdzielonych spacjami prefiksów (związanych z przestrzeniami nazw, których nie chcemy wypisywać), dodatkowo na liście może znajdować się napis #default odnoszący się do domyślnej w danym miejscu przestrzeni nazw;
  • napis #all, oznaczający wszystkie przestrzenie nazw obowiązujące w danym miejscu.

Atrybut exclude-result-prefixes może wystąpić:

  • w każdym elemencie XSLT, bez prefiksu xsl,
  • w każdym elemencie wynikowym, z prefiksem xsl (lub innym wskazującym na przestrzeń nazw XSLT),

„Wyłączenie” przestrzeni nazw obowiązuje w całym poddrzewie elementu w którym występuje atrybut exclude-result-prefixes. To rozwiązanie nie gwarantuje, że deklaracja przestrzeni nazw nie pojawi się w wyniku. W szczególności deklaracja pojawi się, jeżeli jakiś element lub atrybut wyniku należy do danej przestrzeni nazw.

Zadanie 3.

Weź arkusz XSLT 2.0, który zawiera deklarację przestrzeni nazw (np. XML Schema) i postaraj się, aby wynik przekształcenia nie zawierał deklaracji tej przestrzeni nazw.

XSLT wynikiem przekształcenia XSTL

XSLT jest też XML-em, a więc może być wyprodukowany jako wynik XSLT. Trzeba zrobić coś, żeby odróżnić elementy XSLT, ktróre mają być interpretowane teraz, od elementów XSLT, które mają być wynikiem transformacji. Umożliwia to deklaracja namespace-alias i specjalna przestrzeń nazw http://www.w3.org/1999/XSL/TransformAlias.

Przykład 3.

Przykład z rekomendacji.

<xsl:stylesheet  version="1.0"
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
  xmlns:fo="http://www.w3.org/1999/XSL/Format"
  xmlns:axsl="http://www.w3.org/1999/XSL/TransformAlias">

  <xsl:namespace-alias stylesheet-prefix="axsl" result-prefix="xsl"/>
	
  <xsl:template match="/">
    <axsl:stylesheet>
    <xsl:apply-templates/>
    </axsl:stylesheet>
  </xsl:template>
		
  <xsl:template match="block">
    <axsl:template match="{.}">
    <fo:block><axsl:apply-templates/></fo:block>
    </axsl:template>
  </xsl:template>
</xsl:stylesheet>

Zadanie 4.

Baza danych eksportuje dane (pojedyncze tabele) w postaci XML. Każdy wiersz wyniku jest umieszczony w elemencie wiersz, a poszczególne pola w wierszu mają nazwy takie jak kolumny tabeli. Przykłady dokumentów: tabela1.xml tabela1a.xml tabela2.xml.

W dokumentach takich jak schemat1.xml i schemat2.xml (DTD) opisane są „schematy” tabeli wraz z metadanymi do wykorzystania przy prezentacji (etykiety kolumn, czy pokazywać kolumnę, czy i jak sortować po podanej kolumnie, sortujemy w takiej kolejności, w jakiej podano kolumny).

Należy napisać arkusz XSLT, który na podstawie schematu tabeli utworzy w wyniku arkusz XSLT, służący do prezentacji tabel zgodnych z tym schematem. Wynikowy arkusz powinien prezentować tabele w postaci tabel HTML, uwzględniając dodatkowe informacje podane w schemacie.

Debugging

Instrukcja message służy do wypisywania informacji o przebiegu transformacji na dodatkowe wyjście (zależne od implementacji).

Element message może posiadać atrybut select lub zawartość, tak jak w przypadku zmiennych. Atrybut terminate równy yes spowoduje przerwanie przekształcenia, gdy obliczenie dojdzie do tej instrukcji.

O czym nie było

XSLT (zwłaszcza w wersji 2.0) to dość rozbudowany standard i na ćwiczeniach nie zmieściły się pewne tematy. Oto niektóre z nich:

  1. Niezbyt głęboko omówiliśmy sprawę przestrzeni nazw. Kopiowanie węzłów przestrzeni nazw do wyniku jest ważną częścią procesu przetwarzania. W różnych miejscach arkusza różne znaczenie mają nazwy bez prefiksów.
  2. Wybieranie elementu po kluczu.
  3. Numerowanie.

Valid XHTML 1.1Valid CSS