Nachlese XUGS 28: Octopus-Framework

Am gestrigen 10. April 2024 hat uns Manuel Montera Pineda von data2type das neue Octopus-Framework zum Konvertieren und Anreichern von Dokumenten vorgestellt. Die aktuell bereits mögliche Ausführung von ca. 500 Konvertierungsstrecken mit unterschiedlichen Ein- und Ausgabeformaten soll in den kommenden Monaten und Jahren auf deutlich über 1000 anwachsen. Als Eingabeformate kommen nicht nur bereits getaggte Dokumente in Frage, sondern auch unstrukturiertere Inhalte wie etwa aus PDF-Dateien.

Manuel Montero Pineda stößt die Octopus-Transformation einer PDF-Datei der Bundesregierung auf der Kommandozeile an

Neben dem Taggen von typischen Textbereichen wie Überschriften, Absätzen, Tabellen und Fußnoten werden auch interne Verweise erkannt und verlinkt und Grafiken als solche übernommen und eingebettet. Octopus lässt sich sowohl über eine Kommandozeile bedienen als auch – zukünftig – über einen Webservice anstoßen. Außerdem hat Manuel Montero auch schon eine KI-gestützte Chat-Schnittstelle präsentieren können, welche ausschließlich mit dem kuratierten Schulungsmaterial von data2type gefüttert wurde und somit auch qualitative Antworten rund um alle X-Technologien liefert.

Eine Octopus-Ausgabe (PDF nach DocBook)

Weitere Infos zum Nachlesen über octopus gibt’s auf der datat2type-Homepage unter https://www.data2type.de/software/octopus-xml-framework; für die Freundinnen und Freunde des persönlichen Austauschs per Webkonferenz gibt es außerdem gute Nachrichten: XUGS 28 war nur der Auftakt einer ganzen Vortragsserie. Der nächste Termin, in dem es um die Eingabeformate gehen wird, welche Octopus verarbeiten kann, wird am 29.04.2024 von 18-19 Uhr stattfinden, zwei weitere Termine sind geplant. Nähere Infos dazu finden sich auf der data2type-Homepage.

Und last but not least wurde die gestrige Sitzung aufgezeichnet und kann hier angeschaut werden:

https://drive.google.com/file/d/1uyIBliHGAme6uJ0or5F4hz47iKtQez78/view

Folien zu XUGS 27: Qualitätssicherung von XML-Workflows mit XProc-Pipelines

Zum Vortrag von Achim Berndzen und Thorsten Rohm über Qualitätssicherung in XML-Workflows mit XProc-Pipelines stellen wir hier die Folien und das verwandte Paper von der MarkupUK-Konferenz bereit. Vielen Dank an die beiden Referenten!

Nachlese XUGS 26: Manuel Montero Pineda über DITA-LT

Im Online-Vortrag „DITA LT-Framework geht neue Wege“ berichtete uns Manuel Montero Pineda am Mittwoch, den 24. Februar 2021 von einem bei data2type entwickelten XML-Framework für die Aufbereitung und Verarbeitung von Lerninhalten und -materialien. Neben üblichen und erwartbaren Transformationsszenarien (PDF, EPUB, HTML, Word) erfuhren die Zuhörerinnen und Zuhörer insbesondere vom QTI-Format zur Verwaltung und Darstellung von Lernfragen und von flexiblen Möglichkeiten der effizienten Pflege von Fragevarianten.

Zu beeindruckten wusste Manuel Montero Pineda darüber hinaus mit seinen anekdotischen Randbemerkungen wie etwa derjenigen, dass bei data2type die aus vielen tausende Seiten bestehende Homepage jede Nacht neu automatisch verlinkt wird.

Besonders spannend war auch der Ansatz, sich bei der Modellierung von Lerninhalten am Vorbild der objektorientierten Programmierung zu orientieren und daraus ein Konzept für objektorientiertes Publizieren abzuleiten – ein auf Basis der DITA-Architektur ebenso naheliegender wie praktischer Ansatz.

Den über 70 Teilnehmenden und allen weiteren Interessierten stellen wir hier die Vortragsfolien zum Download bereit:

Sommer XUGS 11

Ratgeber E-Books bei TRIAS: attraktiv, wirtschaftlich und automatisiert.
Claudia Güner, Thieme Verlag.
Ein Blick hinter die Kulissen des Prozesses wie E-Books (pdf und ePubs) bei TRIAS in Redaktion und Herstellung erstellt werden.
Nach Vortrag und Diskussion gehen wir wie immer ins Columbus und hoffen, dass wir bei sommerlichen Temperaturen den Abend draußen im schönen Biergarten genießen können.
am Mittwoch, 13.08.2014
um 18.30 Uhr
an der Hochschule der Medien in Stuttgart-Vaihingen
Nobelstraße 10
Raum 204

4. XUGS-Treffen: 27.02.2013 18.30 Uhr HdM: ePUB

Ort: Hochschule der Medien Stuttgart, Nobelstraße 10,  70569 Stuttgart
27.02.2013 um 18.30 Uhr im Raum 204
Thema: ePUB (und KF8)

  1. Bericht von der XML.Prague 2013
  2. Flowable, fixed – oder beides? Adaptives Layout bei E-Books.
    CSS-Dehnungsübungen mit Dr. Wang / Hüthig-Jehle-Rehm
  3. Qualitätssicherung in der E-Book-Prozesskette;Tobias Fischer und Markus Henninger von pagina unterbreiten Vorschäge was ein gutes epub aus technischer Sicht eigentlich sein könnte.

Vorträge 3. XUGS-Treffen – Word ist doch schon XML – oder?

xugs3_1
Ein Nachtrag zum 3. XUGS-Treffen in an der Hochschule der Medien Stuttgart. Es war mit 41 Teilnehmern wieder gut besucht. Auffallend ist der hohe Anteil von herstellenden Kollegen. Neu auch zwei Vetreter der technischen Dokumentation, die auch die Kommunikation in Richtung tekom fördern werden.
Statt einen Vortrag hatten wir dieses mal drei Vorträge á 20 Minuten, also ein Hauch von Science-Slam – ich mag das Genre.
Hier die Folien, bzw. Abstracts (PDF):

3. XUGS-Treffen: Word ist doch schon XML, oder?

am Do, 25.10.1012 um 18 Uhr
in Raum 204 an der HdM in Stuttgart Vaihingen.
Anschließend treffen wir uns im Columbus.
Wir freuen uns auf drei spannende Kurz-Vorträge zum Thema Word und XML:
Thomas Connertz, Leiter Content Management, Georg Thieme Verlag KG; Ulrich Stühlen, Stühlen Satz & EDV:
1. Von MS Word 2010 nach XML
Herr Connertz und Herr Stühlen stellen vor, wie Manuskripte beim Thieme Verlag in Word aufbereitet und nach XML konvertiert werden, und welche Schwierigkeiten dabei auftreten.
Hendrik Case, Senior-Software-Entwickler abavo GmbH:
2. Inside-WordML (= Microsoft Office Open XML = OOXML)
ein OOXML-Struktur Crashkurs u.a. erfolgt mittels XMLSpy ein Blick in die OOXML-Struktur auf “besondere Elemente” aus 3 Jahren WordML Projekt- und Transformationserfahrung
Manuel Montero Pineda, Geschäftsführer data2type:
3. Wordkonvertierung mit AntillesXML
Der kostenlose XML- Werkzeugkasten AntillesXML wurde von data2type GmbH
gemeinsam mit der Hochschule der Medien Stuttgart entwickelt.
Er verfügt u.a. über einen eingebauten Word zu XML Konverter, der einen
generischen Ansatz verfolgt und aus jeder beliebigen Word-Datei eine
wohlgeformte XML-Datei erzeugt, die als Ausgangsbasis für eine weitere
Konvertierung in Richtung valide XML-Datei genommen werden kann.