DE FR IT

ODT, ODP (ODF)

Allgemeine Informationen

Titel OpenDocument Text, OpenDocument Presentation
Kategorie Textformate
Abkürzung ODT, ODP
Dateiendung .odt, .odp
Mime Type application/vnd.oasis.opendocument.text, application/vnd.oasis.opendocument.presentation [1]
Pronom PUID mt/135 für .odf;
fmt/136; fmt/290; fmt/291; fmt/1756 für .odt
fmt/138; fmt/292; fmt/293; fmt/1754 für .odp
Version aktuelle Version: 1.3 (2021 / OASIS) [2]
vorhergehende Versionen:
1.2 (2011 / OASIS und ISO/IEC 26300) [3] [4] [5] [6]
1.1 (2006 / OASIS)
1.0 (2005 / OASIS und ISO/IEC 26300)

   

Beschreibung [7] [8]

Die Formate ODT (OpenDocument Text) und ODP (OpenDocument Presentation) basieren auf dem Format ODF. ODF ist ein Office-Format, das auf dem Dateiformat des Open-Source-Office Pakets OpenOffice.org und damit auf XML beruht. Die neuste Version ist im Standard ODF 1.3 spezifiziert. [2]. Ebenfalls auf ODF basiert das Format ODS (Open Document Spreadsheet).

Technischer Hintergrund

Ein ODT oder ODP-Dokument ist ein ZIP-Ordner in der Struktur eines Java-Archivs. Es enthält also eine Manifest-Datei mit Metadaten und verschiedenen Dateien, in denen der Dokumentinhalt, eingebundene Objekte und weitere Metadaten abgelegt sind. Inhalt, Struktur und Layout des Dokuments sind dabei in XML-Dateien gespeichert. Die Struktur von ODT und ODP-Dokumenten lässt sich daher erschliessen, indem man diese mit einem ZIP-Programm öffnet.

Die Beschreibung und Bewertung berücksichtigt nur ODT (.odt) und ODP (.odp). Auf die Vorlagen-Formate (.ott und .otp) wird nicht eingegangen, da diese schlechter abschneiden. Die Debatte über Vor- und Nachteile von ODT und ODP wird immer auch mit Blick auf DOCX und PPTX (respektive OOXML) geführt. Die Bewertung nimmt gelegentlich darauf Bezug.

    

Bewertung

Offenheit: 4
Das Format ist seit 2005 ein OASIS-Standard respektive seit 2006 als ISO/IEC 26300 öffentlich publiziert. Ebenfalls offengelegt und frei zugänglich ist der ZIP-Komprimierungsalgorithmus. (http://www.info-zip.org/)

Lizenzfreiheit: 3
Sun/Oracle hat 2005 seine Patente auf Open Office zur freien Nutzung freigegeben. [9]
Die Im Unterschied zum Format gelten bei den Fonts deutlich länger gültige Urheberrechte. Deshalb sind nicht alle bei ODT/ODP verwendeten Schriften lizenzfrei (z.B. Arial von Microsoft), was bei der späteren Verwendung zu Problemen mit den Rechten führen könnte. [10]

Verbreitung: 2
Das Format ist noch wenig verbreitet. Eine Zeit lang wurde ODT/ODP im staatlichen Bereich gefördert aber es fand dennoch in vielen Fällen eine Rückkehr zu DOCX/PPTX statt. [7] So teilt auf Nachfrage das Landesarchiv Baden-Württemberg mit, dass auf Landesebene MS-Office eingesetzt wird. Die von der Stadt München vorangetriebene Umstellung auf ODT/ODP (LiMux-Projekt) wurde aufgegeben. Eine grobe Analyse (siehe Abbildung 1) bestätigt, dass die Bedeutung von ODF bei öffentlich zugänglichen Dokumenten gering geblieben ist.

Funktionalitaet: 1
ODT/ODP kann zwar alle vorstellbaren signifikanten Eigenschaften von Textdokumenten repräsentieren, aber die für die Archivierung zentrale signifikante Eigenschaft bei Textdokumenten ist nicht abgedeckt. Wie in den Abschnitten ausführlich 3.2-3.6 dargelegt wird, weist ODT/ODP bezüglich Konvertierung und Funktionalitätserhaltung einige Mängel auf.

Problematisch ist u.a. die Darstellungserhaltung von Dokumenten bei der Konvertierung als auch bei verschiedenen Viewern. Die Ursache ist in folgenden Funktionalitäten zu suchen:

  • Automatisches Update bei Zeit und Datumsfelder.
  • Einbettung
    • Schriften konnten nicht eingebettet werden (Format, Lizenzrechtlich)
    • Eingebettete Objekte (u.a. Audio, Video) werden nicht verarbeitet.

Weitere problematische Punkte hinsichtlich der Funktionalitätserhaltung sind:

  • Schreibschutz und Verschlüsselung.
  • Digitale Signatur
  • Makros

Implementierung: 4
ODT/ODP ist das native Format der Open-Source-Anwendung OpenOffice und ihrer Derivate (LibreOffice, OnlyOffice u.a.). Auch Microsoft Office sowie weitere Produkte können Dokumente in ODT/ODP nativ erzeugen.

Speicherdichte: 3
Durch den Einsatz von ZIP-Komprimierung wird eine relativ hohe Speicherdichte erreicht.

Verifizierbarkeit: 3
Die Erkennung ist nicht nur durch die Extension, sondern auch über die entsprechende Bytesequenz möglich. Es existiert ein Validator [11]. Ein weiterer befindet sich in Entwicklung [12]. Einige Textverarbeitungsprogramme speichern jedoch defaultmässig ODT/ODP-Files, welche nicht vollständig der Spezifikation entsprechen und somit vom Validator nicht als valide erkannt werden.

Best Practice: 1
DasFormat wurde Anfang der 2000-Jahre in verschiedenen Ländern staatlich für die Verwendung bei Behörden und in der Verwaltung gefördert. Die Verbreitung ist jedoch gering geblieben. In den Archiven ist das Format noch nicht angekommen. Es wird von archivischen Institutionen auch nur sehr beschränkt für die Langzeitarchivierung empfohlen (siehe u.a. [13])

Perspektive: 2
Die Perspektiven für die Verbreitung von ODT/ODP sind schlecht. Trotz staatlicher Unterstützung konnte sich das Format nicht durchsetzen. In mehreren Fällen wurde DOCX/PPTX nach dem Abbruch von Projekten zur Umstellung auf ODT/ODP wiedereingeführt (u.a. LiMux-Projekt der Stadt München). Eine Analyse über den Zeitraum von 2013-2023 der über das Internet öffentlich zugänglichen Dokumente im deutschsprachigen Raum zeigt zudem keine wachsende Verbreitung. (siehe Abbildung 1)

Formatklasse: B
Obwohl es seit 2005 existiert, ist es nach wie vor nicht verbreitet.

   

Analyse

Felder

Archivisch schwierig zu handhaben, ist der Umgang mit jenen Feldern in ODT und ODP, welche ein automatisches Update anbieten. Wie bei DOCX besteht die Möglichkeit, Datums- und Zeitfelder automatisch aufzudatieren, wenn das Dokument geöffnet wird. Wird daher ein Dokument mit aktiviertem, automatischem Update abgeliefert und anschliessend durch das Archiv geöffnet, so wird das Originaldatum überschrieben. Dies ist archivisch unerwünscht.

Einbettung

Fonts/Schriften

Die Einbettung von Fonts ist nicht im Standard beschrieben. Falls eine in einem ODT/ODP-Dokument verwendete Schrift auf einem Betriebssystem nicht vorhanden ist, muss die Schrift in der Datei eingebettet sein. Nur so wird das Dokument richtig dargestellt. [14]

Das Tool LibreOffice bietet seit Version 4.1 (2013) die Einbettung von Schriften an, sofern diese in Regular, Italic, Bold oder Bold Italic sind und deren Flags Embedding zulassen. [15] Die meisten anderen Tools lassen Embedding nicht zu. Bei der Konvertierung von und zu ODT/ODP kann die Schrifteinbettung verloren gehen. Es ist daher wahrscheinlich, dass die Darstellung einer abgelieferten ODT/ODP-Datei beeinträchtigt sein wird, wenn in der Datei nicht nur Standardschriften verwendet wurden.

Farbraum

Soweit an den Tools Libre Office und Open Office geprüft werden konnte, verwenden die Tools für ODT/ODP nur RGB als Farbraum. Die Einbettung anderer Farbräume spielt daher keine Rolle.

Objekte

Medienobjekte (Bilder, Audio, Video u.a.) können direkt oder mittels Link (z.B. YouTube-Kanal) in ODT/ODP eingebettet werden. Jedoch ist z.B. das Tool Libre Office diesbezüglich beschränkter als Windows Word, da weniger Formate akzeptiert werden. Bei eingebetteten Objekten und Schriften kann es daher je nach verwendetem Tool zu eingeschränkter Darstellung oder, im Falle einer Konvertierung, sogar zu einem Informationsverlust kommen.

Verschlüsselung

Die vorhandene Schreibschutz- und vor allem die Verschlüsselungs-Option ist aus archivischer Sicht problematisch. Fehlt in letzterem Falle bei der Ablieferung das Passwort, so bedeutet dies für das Archiv Mehraufwand durch den Einsatz von Entschlüsselungssoftware oder gar den archivischen Verlust des Dokumentes.

Digitale Signatur

Bei einer Konvertierung von oder zu ODT/ODP-Dateien gehen digitalen Signaturen verloren. Ein vereinheitlichter archivischer Umgang mit digitalen Signaturen ist aktuell Thema im KOST-Projekt 22-041. [16]

Verbreitung

ODT/ODP-Formate sind aktuell als digitales Distributionsformat von öffentlich zugänglichen Dokumenten wenig verbreitet. In ihrer Häufigkeit unterscheiden sie sich zu Adobe- und Windowsformate um Grössenordnungen (siehe Abbildung 1).

Image

Abbildung 1: Logarithmische Darstellung der Anzahl auffindbarer Dokumente auf Google Search mit Erweiterung docx, doc, odt, pdf und mit Suchbegriff "und". z.B.: filetype:pdf und

Funktionen

ODT/ODP verfügt wie DOCX/PPTX über die Möglichkeit, Makros einzubinden. Diese gehen bei einer Konvertierung entweder verloren oder können zu einer Fehlermeldung beim konvertierten Dokument führen. z.B. wenn ein ODT/ODP mit Makro in ein DOCX konvertiert und mit dem Tool Microsoft Word geöffnet wird.

Eine vollständige, teilweise aber veraltete, Liste der (In-)Kompatibilität zwischen ODT und DOCX findet sich unter [17].

   

Fazit

ODT/ODP-Dokumente sind nicht eindeutig visuell reproduzierbar. ODT ist ein akzeptables Office-Datenformat, taugt jedoch vor allem wegen der nicht eingebetteten Elemente und der Makros nicht als Archivformat für Textdaten. Im digitalen Archiv sollten ausschliesslich Daten und keine Programmcodes gehalten werden.

   

Referenzen

IOpen Document Format for Office Applications (OpenDocument) Version 1.3 Part 1-4
https://docs.oasis-open.org/office/OpenDocument/

Open Document Format for Office Applications (OpenDocument) Version 1.0-1.2 Part 1-4
https://docs.oasis-open.org/office/

   

Literatur

[1]      Internet Assigned Numbers Authority, «Media Types», 2023 
https://www.iana.org/assignments/media-types/media-types.xhtml

[2]     I. Vignoli, «ODF 1.3 is an OASIS Standard», The Document Foundation, 2021 
https://blog.documentfoundation.org/blog/2021/06/23/odf-1-3-is-an-oasis-standardhttp://docs.oasis-open.org/office/OpenDocument/v1.3

[3]     OASIS Open Document Format for Office Applications TC, «Open Document Format for Office», OASIS, 2011

[4]     ISO/IEC, «ISO/IEC 26300-1:2015», 2020 
https://www.iso.org/standard/66363.html

[5]     ISO International Organization for Standardization, «Publicly Available Standards», ISO,
https://standards.iso.org/ittf/PubliclyAvailableStandards/index.html

[6]     ISO, «ISO/IEC TR 29166:2011», 2021 
https://www.iso.org/standard/45245.html

[7]     Wikipedia http://en, «OpenDocument», 2023 
https://de.wikipedia.org/wiki/OpenDocument

[8]     Apache Open Office, «Apache Open Office», 2023
https://de.openoffice.org

[9]     Sun, «Sun OpenDocument Patent Statement, submitted by Sun Microsystems, Inc., September 29, 2005», Oasis Open, 2005 
https://www.oasis-open.org/committees/office/ipr.php

[10]    Wikipedia, «Core fonts for the Web», 2023 
https://en.wikipedia.org/wiki/Core_fonts_for_the_Web

[11]    ODF Toolkit, «ODF VALIDATOR», 2023 
https://odftoolkit.org/conformance/ODFValidator.html

[12]   OpenPreserve, «Open Document Format (ODF) Validation», 2023 
https://github.com/openpreserve/odf-validator

[13]   ETH-Bibliothek, «File formats for archiving», 
https://documentation.library.ethz.ch/display/DD/File+formats+for+archiving

[14]   I. Vignoli, «LibreOffice Tips & Tricks: Replacing Microsoft Fonts», 2020 
https://blog.documentfoundation.org/blog/2020/09/08/libreoffice-tt-replacing-microsoft-fonts

[15]   Libre Office, «Font Embedding», 2023 
https://help.libreoffice.org/latest/lo/text/shared/01/prop_font_embed.html

[16]   KOST-CECO, «22-041 Digitale Signaturen», 2022 
https://kost-ceco.ch/cms/22-041-digitalesignaturen_de.html

[17]   Microsoft, «Unterschiede zwischen dem OpenDocument-Textformat (ODT) und dem Word-Format (DOCX)», 2015 
https://support.microsoft.com/de-de/office/unterschiede-zwischen-dem-opendocument-textformat-odt-und-dem-word-format-docx-d9d51a92-56d1-4794-8b68-5efb57aebfdc

   

Katalog archivischer Dateiformate Version 7.0, Juni 2024