XML – die Schalt­zentrale für die Anforderungen der digitalisierten Welt: Das ist die Welt von X1‑Publishing.

Die Welt ist digital geworden, auch und gerade, was die Welt des Publishing angeht:
Informationen werden digital verarbeitet, ausgewertet, gespeichert, indiziert, publiziert, durchsucht... und die Grundlage ist XML.

Auf diesem Standard basieren viele Datenformate, die aus der täglichen Arbeit bekannt sind:

  • Microsoft (Texte/Tabellen)
  • Open Office (Texte/Tabellen)
  • InDesign (Satzdokumente)
  • E-Books (epub)
  Abbildung Jürgen Efferz

Jürgen Efferz
Inhaber X1-Publishing
j.efferz@x1publishing.com

 

Der Bereich Publishing hat sich entsprechend über die Jahre mit verändert.

Es geht nicht mehr "nur" darum, PDF-Dateien zu erzeugen, um sie zu drucken. Es geht darum, über Daten zu verfügen, mit denen sich weitere Medien bestücken lassen: Datenbanken, Websites, E-Books...

Auch wenn XML ein technisches Gebiet ist: Eine Geheimwissenschaft ist es nicht. Ich stelle Ihnen gerne meine mehr als 20jährige Erfahrung im Bereich der sog. "strukturierten Daten" zur Verfügung:

MEINE ANGEBOTE

Analysieren

Wenn Sie für Ihre Informations- bzw. Publishing-Prozesse ...

  • einen XML-Workflow aufstellen wollen ...
  • einen existierenden XML-Workflow hinsichtlich Produktionssicherheit prüfen  wollen ...
  • einen Überblick über Publishing-bezogene Systeme und Werkzeuge haben wollen ...

 ... sollten wir miteinander sprechen.

Definieren

XML bedeutet strukturierte Daten; strukturierte Daten bedeutet Regelhaftigkeit.
Das muss definiert sein.

Ich unterstütze Sie ‒ beratend oder ganz praktisch ‒ dabei, diese Regeln zu definieren.
Wichtig ist in jedem Fall, diese Regeln aus Ihren Anforderungen und vorhandenen Publikationen & Informationen abzuleiten.

  • Wollen Sie Ihre eigenen Strukturen definieren ...
  • ... oder auf vorhandene Strukturmodelle zurückgreifen (DocBook, DITA, TEI...)?
  • Müssen die vorhandene Strukturen evtl. noch angereichert  werden, damit die Produktion reibungslos funktioniert?
  • Gibt es spezielle Anforderungen für die verschiedenen Ausgabeformate (PDF, Web, E-Book...)?

Editieren

XML ‒ gut und schön.

Aber:

  • Welche Erfassungstools gibt es?
  • Wo soll erfasst werden (lokal oder webbasiert)?
  • Wie lassen sie sich bedienen?
  • Wie lassen sie sich für Ihre Autoren anpassen?

Konvertieren

  • Wie kommen Sie von ‒ sagen wir: MS Word oder Excel ‒ zu XML?
  • Wie extrahieren Sie Daten aus Datenbanken, ERP-Systemen oder auch aus InDesign-Satzdokumenten als XML?
  • Kurz gesagt: Wie bekommen Sie die Daten in Ihre vorgegebene Strukturdefinition  (DTD/Schema) hinein?

Transformieren

  • Ist das XML für Ihre Produktion geeignet oder muss es für die Ausgabetools noch in eine andere (z.B. XHTML/ePub) ‒ möglicherweise flachere (→InDesign) ‒ Struktur umgewandelt werden?
  • Welche Medien sollen bestückt werden? Benötigt jedes Medium eine eigene XML-Variante, die aus den Stammdaten abzuleiten ist?
  • XML als Basis für E-Books: Was ist zu beachten, was geht, was geht nicht?
  • Müssen noch zusätzliche Strukturen eingefügt, Reihenfolgen geändert, Attribute zu Elementen umgewandelt werden?

Empfehlen

Ich empfehle Partner, die zu Ihren Informationsprozessen passen.

Beispielsweise,

  • um XML zu editieren,
  • oder aus Datenbanken zu selektieren,
  • oder von Word nach XML und zurück zu konvertieren,
  • Daten aus PDF-Dateien zu extrahieren
  • oder ein CMS-System zwecks Datenorganisation zu finden.

Produzieren

Ich arbeite mit mehreren Werkzeugen und Systemen und liefere die Ergebnisse, die Sie benötigen.:

  • XML, das Ihre Experten weiterverwenden und in Ihre Prozesse integrieren,
  • druckfertige PDF-Dateien (Bücher, Kataloge), oder auch
  • geprüfte und barrierefreie ePubs
  Logo X1-Publishing   Stadtbibliothek Stuttgart  

XML FORMATIEREN

XML ist nicht gleich XML. Und Satzformatierer, die XML importieren und verarbeiten können,
können nicht jede strukturelle Gegebenheit auswerten. Oder stellen spezifische Anforderungen.

UltraXML™

Seit etlichen Jahren auf dem Markt, und leider (und völlig zu Unrecht) noch immer wenig bekannt: UltraXML™, ein auf Verarbeitung von XML-Daten spezialisiertes Satzprogramm:

  • Importieren Sie DTD und XML beliebiger Strukturierungstiefe
  • Definieren Sie Ihre Formatierungen direkt am Bildschirm unter WYSIWYG-Bedingungen
  • Editieren Sie das XML, wenn nötig
  • Exportieren Sie die Änderungen (strukturell + inhaltlich)
  • Automatisieren Sie die PDF-Produktion mit Hilfe der integrierten Scriptsprache
  • ... und alles ohne Zusatzmodul, Konvertierungen oder Transformation

InDesign

InDesign und XML ‒ eine Verbindung der speziellen Art. Und das bedeutet:

  • Das IDML-Format basiert vollständig auf XML.
  • Trennung zwischen XML-Struktur und Formatierungen;
  • Transformation des XML im Vorfeld in aller Regel sinnvoll;
  • automatisierte Verarbeitung bei entsprechender Vorbereitung, in den meisten Fällen nur über geeignetes Plugin realisierbar;
  • "InDesign Is Not an XML Authoring Tool" (Dorothy J. Hoskins: XML and InDesign, O'Reilly 2013, S. 75)...
    ... folglich:
  • "round tripping" und Validierung ist nicht oder nur mit erheblichem Aufwand möglich.
  • Dafür aber: Hohe Flexibilität und Variabilität bei der Gestaltung

3B2/APP

3B2 war jahrelang das umfangreichste Satzprogramm für den PC ‒ und das erste, mit dem strukturierte Daten (SGML, später XML) für die Satzproduktion verarbeitet werden konnten.

Wenn Sie noch 3B2 im Einsatz haben und die Daten in ein "korrektes" XML überführen möchten, helfe ich Ihnen gerne.

Genauso, wie ich Ihnen noch Support für 3B2 bis einschließlich Version 6 geben kann.

  Logo X1-Publishing   Stadtbibliothek Stuttgart  

XML PUBLIZIEREN

Die "Gretchenfrage" lautet: Wollen Sie automatisch oder automatisiert publizieren?

Spätestens hier scheiden sich die Geister, mit welchen Produktionsinstrumenten Sie arbeiten sollten.

Automatisch

Automatische  Print-/PDF-Produktion bedeutet in der Regel

  • cloud- oder serverbasierter Datenfluss, sei es inhouse oder zum/vom Dienstleister
  • hohe Flexibilität in Sachen Produktionszyklus
  • automatische Erstellung von Extrakten/Teilpublikationen
  • lohnender Einsatz nur bei periodischen Publikationen,
  • mögliche Einbußen in puncto Typographie oder Umbruch, je nachdem, welche Satzsoftware als Formatierer eingesetzt wird,
  • dafür aber: relativ hohe Kosten bei der Entwicklung der Formatierung, vor allem der "letzten 1 bis 2%".

Die Ausgabequalität hängt ab

  • von der Qualität der XML-Strukturen und
  • von der Flexibilität der verwendeten Satzsoftware,
    z.B. in Bezug auf
    • lebende Kolumnentitel
    • Fußnoten
    • Tabellen
    • Umbruchmechanismen
    • Register und Verzeichnisse
    • Flexibilität der Seitengestaltung

Automatisiert

Automatisierte  Print-/PDF-Produktion heißt, bei geeigneten Publikationen den Automatismus so weit zu treiben, wie es technisch und finanziell Sinn macht.
Und den verbleibenden – und möglichst kleinen – Rest interaktiv zu erledigen.

Dann nämlich,

  • wenn es zu viele Ausnahmen in der Gestaltung gibt,
  • wenn sich die Gestaltungs- oder Umbruchregeln nicht aus dem XML ableiten lassen,
  • wenn sich inhaltliche "last-minute-Korrekturen" während der Produktion nicht vermeiden lassen,
  • wenn der Umbruch durch das geschulte Auge eines Anwenders beeinflusst und nicht durch die Software geregelt werden soll oder kann,
  • wenn eventuelle Fehler direkt auf dem Bildschirm bereinigt werden sollen.

Ein wichtiger Gesichtspunkt dabei: Bleibt das XML bei Eingriffen valide oder nicht?
Und gibt es Bedienungshilfen, die die nötigen Korrekturen einfacher und sicherer machen?

  Logo X1-Publishing   Stadtbibliothek Stuttgart  

XML ZUM SPRECHEN BRINGEN / BARRIEREFREIHEIT

Barrierefreie PDF-Dateien  sind das eine, Sprachausgabe  das andere.
Beides ist ‒ jedenfalls vernünftiger Weise ‒ nur auf Basis von XML möglich.

Barrierefreies PDF

Barrierefreie PDFs  sind – eigentlich – ein Widerspruch in sich selbst. Aber in Zeiten, in denen das PDF sich vom starren, abgeschlossenen Dateiformat zum interaktiven Medienformat gemausert hat, sind auch hier die Ansprüche gewachsen.

Zum Beispiel, für Sehbehinderte entsprechende Hilfen im PDF zur Verfügung zu stellen. Und zwar auf der Basis von, nicht zu vergessen: EU-Normen, die dies in Zukunft für elektronische Medien vorschreiben.

Die Frage ist nur:

  • Kann dies bereits im Verlauf der PDF-Produktion "in einem Rutsch" automatisch erledigt werden?
  • Oder muss die PDF-Datei im Nachhinein barrierefrei gemacht werden?

Sprachausgabe/TTS

"Text To Speech": Sprachausgabe-Programme gibt es genügend.

Vor allem aber ungenügende, wenn es darum geht, Blinden auf speziellen, bildschirmlosen Abspielgeräten die Texte zur Verfügung zu stellen.

Hier sollte das Wiedergabetool unterscheiden können, ob z.B. der Ausdruck "2 g" die zweifache Erdbeschleunigung oder zwei Gramm Zucker meint.

Mit entsprechender, struktureller Anreicherung des XML kann der Inhalt an DAISY (Digital Accessible Information SYstem) übergeben und korrekt wiedergegeben werden.