XUGS 29: Chance für Verlage ‒ KI-Agents und warum XML der Schlüssel ist

Ein KI-generiertes Bild mit einem orangen Octopus, der eine Brille trägt.

Wir laden hiermit herzlich alle Interessierten zur nächsten Veranstaltung der XML User Group Stuttgart ein, welche am

Mittwoch, den 30. April 2025
von 18:00 Uhr bis 20:00 Uhr
in den Räumen des MSH Medien System Haus
im Pressehaus Stuttgart (6. Stock, Anfahrtsbeschreibung hier)
Plieninger Str. 150, Stuttgart-Möhringen

stattfinden wird. Dies wird die erste Präsenzveranstaltung der XUGS seit Corona sein. Wir hoffen auf viele persönliche Kontakte vor Ort. (Und wer über den Fachvortrag hinaus gerne noch etwas weiter netzwerken möchte: Wir werden auch nach einer Möglichkeit suchen, wo wir nach dem Ende des offiziellen Teils noch auf ein Getränk oder einen Snack einkehren können.)

Nun aber endlich zum Inhalt: Wir freuen uns, dass Manuel Montera Pineda, Geschäftsführer von data2type in Heidelberg und Vater des XML-Periodensystems uns über seine Erfahrungen an der Schnittstelle von XML und Künstlicher Intelligenz berichten wird. Hier sein Ankündigungstext:

Im Fokus steht die Rolle strukturierter Inhalte für KI-Systeme – insbesondere für Retrieval-Augmented-Generation (RAG). In vielen aktuellen Projekten zeigt sich deutlich: Die Qualität von KI-Antworten hängt entscheidend davon ab, wie strukturiert die zugrunde liegenden Inhalte sind.

Doch während viele Anbieter nach wie vor auf PDF setzen, ist dieses Format faktisch nicht strukturiert. Üblicherweise wird daraus Plain Text extrahiert und in sogenannte Chunks zerlegt – dabei gehen jedoch zentrale Informationen verloren: Verweise, Tabellen, Hierarchien, semantische Markierungen. Die Auswirkungen auf die Antwortqualität sind erheblich.

Im Vortrag zeige ich, warum es XML braucht, um wirklich medienneutral – oder besser gesagt LLM-neutral – zu publizieren. Denn ohne Struktur keine Kontexttiefe, keine Nachvollziehbarkeit und keine Präzision. Die Lösung ist – wie so oft – XML. Und XSLT wird dabei zur Schlüsseltechnologie, um Inhalte gezielt in KI-fähige Formate zu überführen.

Kurz gesagt: Die Zukunft braucht neue Formate für Chunks – und XML ist der Ausgangspunkt dafür.

Die Chance für Verlage: Qualität statt geplapper.

XUGS 27: Qualitätssicherung von XML-Workflows mit XProc-Pipelines

Die XUGS lädt für den 20.09.2023 zu einem Online-Vortrag über qualitätskritische XML-Workflows mit Hilfe von XProc-3-Pipelines ein.

XProc-Logo (Fisch)

Ausgangspunkt der beiden Referenten Achim Berndzen und Thorsten Rohm sind Pipelines, welche auf Batchskripten und XSLT basieren und XML-Ausgaben in hoher Qualität erzeugen. Einige Qualitäts-Eigenschaften wurden jedoch noch nicht automatisch sichergestellt und wurden von den beiden sukzessive hinzugefügt, um ein noch höheres Maß an Qualitätssicherung zu erreichen.

Achim Berndzen wird zunächst eine kurze allgemeine Einführung in XProc geben. Anschließend zeigen die beiden Referenten ihre erweiterten QS-Maßnahmen wie etwa die Validierung von Ergebnissen, die Überprüfung von Links auf Grafikdateien und die proaktive Sicherstellung von validen Transformationsergebnissen. Sie zeigen an diesen konkreten Beispielen, wie XProc 3.0 verwendet wurde, um die Pipeline zu verbessern, Abhängigkeiten zu verringern und summarische Logdateien zu generieren.

Der Vortrag wird auf Deutsch gehalten, die dabei verwendeten Folien werden allerdings in englischer Sprache gezeigt.

Der Vortrag wird via GoToMeeting übertragen, die Einwahldaten finden sich unten, eine vorherige Anmeldung ist nicht erforderlich.

Die Referenten

Achim Berndzen

Achim Berndzen erwarb einen M.A. in Philosophie an der Universität Aachen und hat mehr als zwanzig Jahre Lehrerfahrung in Kommunikationstrainings. Im Jahr 2014 gründete er <xml-project/>. Er ist der Entwickler von MorganaXProc, einem voll standardkonformen XProc-Prozessor mit einem Schwerpunkt auf Konfigurierbarkeit und Erweiterbarkeit.

Thorsten Rohm

Thorsten Rohm begann 1997 mit SGML-Anwendungen für die Druckausgabe und das elektronische Publizieren zu arbeiten. Er war in der Druckvorstufe für verschiedene juristische Fachverlage in den Bereichen Datenstrukturierung, -konvertierung und -anreicherung tätig. Seit 2002 beschäftigt er sich mit XML, XSLT, XSL-FO und dem Antenna House Formatter, sowie weiteren XML-Technologien.

2009 wechselte er zur Thieme Compliance GmbH, wo er nun als Head of Content Architecture & Management tätig ist. Gemeinsam mit seinem Team konzentriert er sich auf die Weiterentwicklung des XML-Content und stellt dessen Single-Source-Fähigkeit sicher. Die Hauptaufgabe liegt dabei in der Entwicklung und Pflege von Publishing-Pipelines für die voll- oder hochautomatisierte Ausgabe in unterschiedlichsten Medienformen. Einen weiteren Schwerpunkt stellt die Qualitätssicherung mittels Schematron sowie die Entwicklung und Pflege von Qualitätssicherungs-Pipelines dar, beispielsweise um neue Stylesheet-Versionen zu testen und Regressionen auszuschließen.

Er liebt alles, was mit Markup zu tun hat, und ist sehr am Austausch mit der XML-Community interessiert.

Einwahldaten

XUGS 27: QS mit XProc-Pipelines
20.09.2023, 18:30–19:30 Uhr (Europe/Amsterdam)

Nehmen Sie an diesem Meeting per Computer, Tablet oder Smartphone teil.
https://meet.goto.com/868222853

Sie können sich auch über ein Telefon einwählen.
Zugangscode: 868-222-853
Germany: +49 721 9881 4161

Installieren Sie jetzt die App, damit Sie für Ihr erstes Meeting bereit sind:
https://meet.goto.com/install

Nachlese zu #XUGS24: Webinar und DocBook

Teilnehmerliste

Am vergangenen Mittwoch, den 22. April 2020, fand #XUGS24 in Form eines Online-Webinars statt. Das war eine aus der Corona-Kontaktbeschränkungsnot geborene Idee, ein bereits geplantes Treffen doch noch stattfinden zu lassen, auch wenn es nicht in den Räumen der Hochschule der Medien in Stuttgart stattfinden konnte.
Im Orga-Team der XUGS herrschte einerseits ein bisschen Skepsis, ob XUGS-Treffen funktionieren können, ohne sich von Angesicht zu Angesicht begegnen zu können, andererseits aber auch die Lust, sich auf ein Wagnis des Neuen mal einzulassen. Im Nachhinein können wir froh sein, das Treffen zum Thema DocBook in dieser Form durchgeführt zu haben, das Feedback vor allem der überregionalen Teilnehmenden war durchweg positiv.
Doch eine positive Überraschung erwartete uns gleich zu Beginn. Neben den beiden angekündigten Praxisberichten aus dem DocBook-Umfeld kam aus der Teilnehmerrunde das spontane Angebot eines dritten solchen Berichts. Vielen Dank an den XMLArbyter Thomas Meinike für den Vorschlag und die Präsentation!

Technische Dokumentation für das parsX-Framework

Quellenarbeit an der Doku des parsX-Frameworks

Den Aufschlag machte Tobias Fischer von der pagina GmbH Publikationstechnologien in Tübingen. Er zeigte einen klassischen Anwendungsfall von DocBook, nämlich die technische Dokumentation für das parsX-Framework, einem kommerziellen Toolpaket zur Arbeit mit dem Open-Source-Dokumentformat parsX. Seine Live-Präsentation zeigte das Authoring der Inhalte im oXygen XML-Editor,  die Konfiguration des Ausgabeszenarios durch Setzen von Parametern und durch Hinterlegung eigener CSS-Regeln und die eigentliche Transformation der DocBook-Quelldateien in statisches HTML. Fischer betonte die einfache Anpassbarkeit, die geringen Anforderungen an den Webserver beim Ausspielen des generierten HTMLs und der komfortablen Navigation und Durchsuchbarkeit der Seite, die mit Hilfe des von Synchrosoft entwickelten Frameworks Oxygen WebHelp erzeugt wurde.

Akademisches Schrifttum mit DocBook

Erste Orientierung in DocBook

Ich selbst zeigte anschließend die Anwendung von DocBook zur Auszeichnung und Ausgabe einer akademischen Abschlussarbeit. Typische Elemente, die für eine solche Publikation nötig sind, wurden kurz angerissen: Verwaltung von Bibliografien und Glossaren, Erstellen eines Registers, Einbettung mathematischer Formeln. Anschließend präsentierte ich in einem einfachen Beispiel die Anpassung des DocBook-Schemas und des DocBook-XSL, um im Text einige Variablen zu setzen, die erst zum Rendering-Zeitpunkt befüllt werden. Die Folien zum Vortrag stehen hier auf der Seite zum Download bereit [PDF]. Außerdem ist das gesamte Projekt (Oxygen-Projektdatei, XML-Quelldaten, Anpassungen, Folien) in GitHub zum Herunterladen und Nachvollziehen erhältlich. Herzlichen Dank auch an dieser Stelle noch einmal an Gerrit Imsieke von le-tex publishing services für die ursprüngliche Inspiration (siehe Folien).

Teilnehmerliste

Studentisches Projekt zur Ausgabe mobiler Dokumentationen

In der spontan aufgenommenen dritten Präsentation stellte uns Dr. Thomas Meinike von der Hochschule Merseburg ein Projekt vor, in dem er mit Studierenden eine mobile Dokumentationsapplikation mit jQuery mobile aufgebaut und als Quellformat DocBook genutzt hat. Ein Bericht zu dem Projekt ist auf der Website der Hochschule verfügbar. Besonders interessant war dabei, dass in diesem Projekt nicht auf den im Oxygen Editor eingebauten XSL-Stylesheets aus dem Umfeld der DocBook-Community aufgesetzt wurde, sondern die XSL-Transformationen von der Pike auf von den Studierenden entwickelt wurden und damit gezeigt werden konnte, wie weit man schon mit 500 Zeilen XSLT-Code kommt.
Thomas Meinike hat auf seiner Website nicht nur eine kurze Nachricht zur XUGS24 veröffentlicht, sondern seinen Teil auch mitgeschnitten und online bereitgestellt, so dass man ihn sich nachträglich jederzeit noch einmal ansehen kann. Vielen Dank auch dafür!

Abschlussdiskussion

Teilnehmerliste
Abschlussdiskussion

Im Feedback der Teilnehmenden ist das Veranstaltungsformat gut angekommen. Die Befürchtung, dass inzwischen aufgrund wochenlanger Homeoffice-Arbeit eine gewisse Telekonferenz-Müdigkeit eingetreten sei, wurde nicht bestätigt. Auch die Kombination von drei „mittellangen“ Vorträgen mit Praxisbeispielen wurde positiv genannt. Beim Ausblick in die Zukunft wurde als spannendes Thema mehrfach DITA genannt, aber auch EPUB. Insbesondere die überregional Teilnehmenden waren froh, auf dem Online-Wege überhaupt an der Veranstaltung partizipieren zu können. Im Chatfenster der Veranstaltung stellte Markus Müller-Trabucchi von der XML-User-Group Berlin (XUGBER) in Aussicht, dass es dort möglicherweise demnächst mit einem ähnlichen Format weitergehen könnte. Wir freuen uns drauf!

Mehr Feedback?

Im Zuge der DSGVO-Diskussionen haben wir die Kommentarfunktion hier im XUGS-Blog abgeschaltet. Ihr könnt uns für Rückfragen oder Feedback aber per E-Mail an info(at)xugs.de erreichen und findet uns auf Twitter (@xugstuttgart) oder Xing (Gruppe XML User Group Stuttgart).

Sommer xugs 14: Lessons Learned

Erfahrungsaustausch aus dem Arbeitsalltag nach dem Motto
“Gestern war ein guter Tag, heute war ein lehrreicher Tag.”
Hierbei können neben technischen Abenteuern auch Erfahrungen mit Changemanagement und anderen aktuellen Themen ‘mitgebracht’ werden.
Mutige vor!
Je unterschiedlicher die Themen, desto interessanter wird der Abend!
Nach der Diskussionsrunde gehen wir wie immer zum gemütlichen Beisammensein ins Columbus.
Mi, 15.07.2015 – 18.30 Uhr
Hochschule der Medien, Raum 204
Nobelstraße 10
70569 Stuttgart Vaihingen

xugs@akep13

die #xugs bekommt die Gelegenheit, auf der diesjährigen AKEP Jahresveranstaltung #akep13 am Mi, 19.06.2013 in Berlin am Nachmittag von 14:00 bis 17:00 Uhr die Subkonferenz XUGS meets AKEP (http://www.akep-jahrestagung.de) zu gestalten.
Welche Verlagskollegen haben Interesse, einen Vortrag zu halten, eine XML-Lösung vorzustellen oder über eigene Erfahrungen beim Einsatz von XML im Verlag zu berichten ? Gerne darf es auch ein Vortrag sein, den wir in einem xugs-Treffen in Stuttgart schon gehört haben.
Optimal wäre es, wenn sich drei Referenten finden. Zeitlicher Rahmen ist eine Dreiviertel Stunde. Und außer Ruhm und Ehre bekommen die Referenten die Tickets kostenfrei.
Da wir noch einen knappen Monat Zeit für die Planung haben, freuen wir uns
auf baldige und zahlreiche Vorschläge !
Herzliche Grüße,
das Organisatorenteam
Fritz Hieble
Katharina Kimmerle
Ursula Raithelhuber