Welches DMS ist das richtige für mich?

Ich muss zugeben, dass ich es mir leichter vorgestellt habe zu diesem Punkt zu kommen…

Was meine ich damit?

Nun, ich habe mir im Internet/Youtube/TikTok verschiedene Optionen für ein freeware Dokumenten Management System (DMS) angesehen und viele Vergleiche und Empfehlungen gesehen. Am Ende ist so, dass ich bei der Wahl im Hinterkopf behalte, dass ich mich für einen langen Zeitraum festlege.

Das fühlt sich für mich so ähnlich an, wie das Festlegen auf ein Fotoentwicklungs-/management-Programm.

Lightroom, Darktables, Rawtherapee, Digikam und Shotwell sind alles super Programme für die Entwicklung und das Management von Fotos aus einem digitalen Fotoapparat. Doch mit welchen werde ich die nächste Wochen, Monate, Jahre oder gar Jahrzehnte zufrieden sein??

Genau diese Fragen wuseln mir ebenso bei meinem wunsch DMS durch den Kopf.

Im Gegensatz zum Fototool habe ich hier leider keine Erfahrungen, um eine emotionale Entscheidung aus dem Bauch heraus treffen zu können. Also werde ich meine Bedürfnisse so gut wie mir möglich zu Papier/Web zu bringen, um sie dann zum Klassifizieren und Bewerten der drei für mich augenscheinlich möglichen Tools zu nutzen. Klar werde ich während des Formulierens und Testens dazu lernen und die Kriterien ggf. überarbeiten müssen. Ebenso ist es natürlich immer möglich, dass ich schlicht und einfach die Anleitung nicht richtig lese oder mich zu blöd anstelle, um ein Feature zu aktivieren. Wenn das so ist und es ggf. zu schwer verständlich für mich ist oder eben halt zu komplex ist, da kann daraus eine negative Bewertung folgen, die für jemanden anderen Falsch ist. Ich freue mich übrigens immer auf Kommentare und die damit verbundenen Hinweise, wie etwas besser geht. 😉

Keep it human, keep it simple. 😀

Aber hey, war es nicht schon öfter so, das wir er das Cabrio geil fanden und dann am Ende doch in einem Kombi landeten? 😉

Okay, was sind meine Anforderungen an das Tool?

Nun, wie gesagt alles durch meine Brille gesehen, also bezieht sich alles stark auf meinen Anwendungsfall. Jeder mag da bei der Betrachtung zu anderen Ergebnissen kommen und eine gänzlich andere Entscheidung treffen.

Ich hab in den letzten 30 Jahren bei verschiedensten IT-Dienstleistern und Herstellern gearbeitet und viel, wirklich viel Papier schwarz gemacht. Ich möchte also in der Lage sein diesen alten und die neu hinzu kommenden Unterlagen mit Tags zu versehen. Eine virtuelle Ordner-/Archivstruktur wäre wohl für eine Orientierung in den Unterlagen nicht schlecht. Ich hätte gerne, dass alle Formate der Unterlagen unterstützt werden oder zumindest die wesentlichen. Eine einfach und komplexe Stichwortsuche in den Unterlagen hätte ich gerne ebenso. Vielleicht sogar etwas KI, welche nach Filterregeln automatische Taggings setzt. Eine automatische Erkennung der Firma/Korrespondenten fände ich sehr schön, da ich mir eine gewissen Vorsortierung erhoffe.

Ein Importverzeichnis, welches eigenständig in zeitlichen Intervallen nach neuen Unterlagen durchsucht wird wäre ganz nett. Vielleicht ein Import aus den Anhängen meiner Emails könnte ein Gewinn sein. Da ich single User bin, interessiert mich eine Sharing der Unterlagen mit anderen Nutzern nicht. Toll wäre die Möglichkeit, das die Unterlagen von einem Scanner Importiert werden können und in dem Zuge auch gleich mittels einer OCR für die Stichwortsuche aufbereitet werden. Die Daten sollen möglichst per Webinterface abgerufen werden können und dazu wäre eine Android/iPhone-App auch ganz nett, für den Import/Export/Suche unterwegs.

Je länger ich auf meinem Anwendungsfall herum Denke, um so länger wird das Pflichtenheft.. (ist ja wie im Business)

Wie machen wir Berater das dann normalerweise? Wir wandeln so ein Pflichtenheft in ein Tabelle mit verschieden stark bewerteten Kriterien und einigen Pflichtfeldern um. Genau das werde ich dann mal bauen um die drei optionalen Protagonisten bewerten zu können. Denn an solche Felder lassen sich prima Bewertungskriterien, wie Punkte oder Prozente, hängen. Damit das ganze nicht in einer endlos langen und schwer zu übersehenden Tabelle endet, werde ich die Kriterien aufsplitten.

1. Unterstütze File-Formate

Wenn ich so in meine Ordner sehe, dann lächeln mich da die üblichen verdächtigen File-Formate an. Wie habe ich die Übersicht für mich erstellt, in einer Bash und dann mittels folgenden Befehls sortieren lassen.

find . -type f -printf '%f\n' | sed -r -n 's/.+(\..*)$/\1/p' | sort | uniq -c

Einige Dateiformate haben für mich einen höheren Stellenwert als andere (Support mit 50 Punkten bewertet). Bei einigen wäre es schön, wenn sie das DMS unterstützen würde (Support mit 25 Punkten bewertet) und einige sind nur der Vollständigkeit aufgeführt (1 Punkt). Die maximal zu erzielende Punktzahl ist 759.

Wie gesagt, es mag sich jeder bei der Suche nach dem für ihn sinnvollen DMS Gedanken um sein eigenes Datei-Ökosystem machen und zu einer gänzlich anderen Bewertung kommen. Für mich sind da 11 File-Formate, welche am meistens nutze. Für diese Dateitypen liegt Richtschnur mit dem Support bei 550 Punkten.

Für den Dateitypentest habe ich 82 Dateien (386,5MiB) mit mindestens 2 unterschiedlichen Dateien pro Typ zusammen gesucht, um auch eine gewissen Streuung hinsichtlich Größe und Komplexität abzubilden.


ExtensionFileformatPunkteDocspellPaperless-NGXMayan-EDMS
.txt / .logASCII Text File50505050
.pdfPDF File50505050
.pptPowerPoint 97–20035000 (50 optional Tika)50
.pptxPowerPoint 2007–3655000 (50 optional Tika)0
.potxPowerPoint 2007–365 Dokumentvorlage 1001
.ppsPowerPoint 97–2003 AutoStart1001
.odpODF-Präsentation2500 (25 optional Tika)25
.docWord 97–20035000 (50 optional Tika)50
.docxWord 2007–3655000 (50 optional Tika)50
.dotWord 97–2003 Dokumentvorlage 1001
.dotxWord 2007–365 Dokumentvorlage1001
.odtODF-Textdokument2500 (25 optional Tika)25
.xlsExcel 97–20035000 (50 optional Tika)50
.xlsxExcel 2007–3655000 (50 optional Tika)50
.csvComma Separated Values50505050
.odsODF-Tabellendokument250025
.vsdVisio 2003-2010 Zeichnung25000
.vsdxVisio Zeichnung25000
.vssVisio 2003-2030 Schablone1000
.bmpWindows BMP Bild1011
.jpgJPEG Bild50505050
.tiffTIFF Bild1111
.pngPNG Bild50505050
.gifGIF Bild1011
.epubElectronic Publication25000
.rtfRich Text Format250025
.mobiMobipocket eBook file25000
.htmlHypertext Markup Language File1100
Punktesummemax. 759252253 / (optional Tika 603)607
Fileformat- Vergleichstabelle

Kurzes Fazit:

Bei den File-Formaten hat ganz klar Mayan-EDMS mit Boardmitteln die Nase vorne, laut Dokumentation kann jedoch Paperless-NGX durch Einbindung der Tika Software wohl aufschließen. Abgeschlagen dümpelt hier Docspell herum. Für meinen Anwendungsfall ist das ein über deutlicher Indikator für die Nutzung von Mayan-EDMS oder Paperless-NGX mit Tika Software, wenn sich in den nächsten Testfeldern keine groben Schnitzer ergeben.

2. Stichwortsuche

Okay alle drei DMS haben die Dateien mehr oder minder gut verdaut. Zum Vergleich der Stichwortsuche in den Dokumenten, werde ich mich auf die PDF Dateien beschränken, da hier alle DMS denn gleichen Zustand erreicht haben sollten. Dieser sollte also neben dem Ablegen der Dokumente jedes Dokument durch eine Texterkennung (OCR) gelaufen sein und die Wörter indiziert worden sein.

Was mich interessiert ist dabei ob das DMS mit Boardmitteln, einmal die Suche nach einem einfachen Begriff/Suchwort und wenn möglich nach mehreren komplexen Suchwortkombinationen. Ich bewerte dabei die jede der möglich Such-Optionen als essentiell (Support mit 50 Punkten bewertet), da ja ggf. alle Kombinationen zur Reduktion des Ergebnisses notwendig ist oder sein kann.

Such-OperatorPunkteDocspellPaperless-NGXMayan-EDMS
simple50505050
a & b (and)500 (nur mit SOLR)5050
a | b (or)500 (nur mit SOLR)5050
a & -b (and not)500 (nur mit SOLR)5050
a & -b & -c (and not and not)500 (nur mit SOLR)5050
a & b | c & d (and or and)500 (nur mit SOLR)5050
Punktesummemax. 30050300300
Suchoperatoren-Vergleichstabelle

Kurzes-Fazit:

Docspell selber bietet nur eine einfache Suche mit Boardmitteln, für eine komplexere Suche ist zwingend Apache SOLR notwendig, was nach meiner Meinung das Setup komplexer, fehleranfälliger und wartungsintensiver gestaltet. Paperless-NGX nutzt für die Suche die Whoosh-Language und ist damit für alle denkbaren Suchanfragen meiner Meinung nach sehr gut aufgestellt. Bei Mayan wird vom genutzten Django-Framework das DjangoSearchBackend genutzt und wie Paperless-NGX ebenso sehr gut aufgestellt für einfache und komplexe Suchanfragen.

3. Dokumentenart/type

Mit dem Blick in die Arten von Dokumenten die sich bei mir so angesammelt haben hätte ich dieses gerne als festes Kriterium beim Einchecken eines Dokumentes in das DMS. Was meine ich mit Dokumentenart? Ich verstehe unter Dokumentenart eine feste Klassifizierung nach Konzept, Dokumentation, Präsentation, Brief, Rechnung, Stundenzettel, Blaupause, Planung oder ähnlichem, um damit wiederum im späteren Suchprozeß die Summe der zu durchsuchenden Dokumente zu reduzieren. Klar ließe sich das auch mit einem Taggig bewerkstelligen, doch ich denke eine feste Dokumentenart bringt eine bessere/saubere Strukturierung in das DMS. Da mir dieses Wichtig erscheint, vergebe ich für diese DMS Funktion wiederum 50 Punkte bei bestehendem Support und weitere 50, wenn die Klassifizierung automatisch möglich – mir also Zeit erspart.

DokumentenartPunkteDocspellPaperless-NGXMayan-EDMS
initial manuell zuweisbar5050 (über Metadata Customfield)50 (über Document Types)50 (über DokumentenTypen
initial automatische Zuweisung möglich500 (ggf. externe NLP)50 (über Document Types –> Matching algorithm)0 (ggf. über Workflow)
manuelle Änderung später möglich5050 (über Metadata Customfield)50 (über Document Types)50 (über Type change)
automatische Änderung später möglich50000
Punktesummemax. 200100150100
Dokumentenart-Vergleichstest

Kurzes-Fazit:

Docspell kennt Dokumententype nicht, jedoch läßt sich über das Customfield in den Metadaten etwas vergleichbares einrichten.

Mayan-EDMS zeigt sich hier sehr aufgeräumt. Die Document Types lassen sich manuell initial Zuweisen und später ändern. Gegebenenfalls ist eine automatische Zuweisung per Workflow realisierbar, jedoch ist mir hier das Konzept der Workflows nicht verständlich geworden.

In dieser Disziplin glänzt Paperless-NGX. Einfach und intuitiv lassen sich in Paperless-NGX die Document Types initial manuell und automatisch Zuweisen, mit einem sehr großen Radius an Optionen. Eine manuelle Änderung des Document Types ist in Paperless-NGX ebenso später manuell möglich.

4. Schränke/Ordner/Cabinets

Mein bisheriges Archivierungskonzept von Dokumenten basierte, wie sich leicht erahnen läßt, auf der Ordnerstruktur des Filesystems. Die Dokumente liegen dort also in einer mehr oder minder nach Kunden, Jahren und Projekten verschachtelten Struktur. Dieses Modell würde ich gerne ebenso im DMS abbilden können. Ob ich es später nutzen werde ist dabei für diesen Test erst einmal nebensächlich, denn ich erhoffe mir natürlich von der Anwendung eines DMS, dass ich dieses starre Setup nicht mehr benötige. Ich hätte gerne ein Verzeichnis pro Kunde (Support mit 50 Punkten bewertet) und darin gerne noch eine weitere Odernertiefe (Support mit 50 Punkten bewertet), wenn möglich natürlich noch weitere 2-3 Tiefen (Support mit 25 Punkten bewertet).

OrdnertiefePunkteDocspellPaperless-NGXMayan-EDMS
Primär Ordner5050050
Sekundär Ordner500050
Multilevel Ordner250025
Punktesummemax. 125500125
Schränke/Ordner-Vergleichstest

Kurzes-Fazit:

Paperless-NGX bietet keine Ordner/Folder Struktur. Docspell beherrscht einen primären Ordner, aber keine weitere Ordnertiefe. Mayan-EDMS spielt hier sein volles Potential aus, mit Multilevel-Ordner Struktur, sowie dem ein- und auschecken aus diesen Ordnern. Ein Dokument kann hier zusätzlich auch in verschiedenen Ordnern gleichzeitig sein.

5. Kunden/Ansprechpartner

Ein Dokument wird ja für einen bestimmten Kunden im Auftrag angefertigt und da existiert dann ggf. auch ein Ansprechpartner für das entsprechende Projekt, diese beiden Felder hätte ich gerne gerne Ebenso als Kriterien zur Einschränkung der Suche in dem Dokumentenzoo. (Support mit 50 Punkten bewertet)

Kunde/AnsprecpartnerPunkteDocspellPaperless-NGXMayan-EDMS
Kundenzuweisung505000 (lässt sich jedoch ggf. über die Ordner abbilden)
Ansprechpartner5050500 (lässt sich jedoch ggf. über die Ordner abbilden)
Punktesummemax. 100100500
Kunde/Ansprechpartner-Vergleichstest

Kurzes-Fazit:

Hier hat Docspell die Nase vorne und bietet sowohl Kunden als auch Ansprechpartner an. Paperless-NGX ist die Zuweisung eines Korrespondenten möglich, jedoch nicht einer Firma. Bei Mayan-EDMS ist dieses nicht vorgesehen, ließe sich aber alternativ über die Ordnerstruktur abbilden.

6. Tagging

Das Tagging sollte in keinem der DMS ein Problem darstellen, hier erwarte ich das multiple Taggings möglich sind und auch in die Suche einbezogen werden können. (Support mit 50 Punkten bewertet)

TaggingPunkteDocspellPaperless-NGXMayan-EDMS
manuell einfaches Tagging50505050
manuell multiple Taggings50505050
automatisches Tagging5050 (auf Basis der bestehenden Taggings ist unter Collective-Settings ein zyklischer Tagging-Lauf definierbar) 50 (bei Dokumentenzugang -> Matching algorithm)0
Punktesummemax. 100150150100
Tagging-Vergleichstest

Kurzes-Fazit:

Hier spielt Paperless-NGX alle Trümpfe aus, eine intuitiver Umgang mit den Taggings, sowie eine automatische Zuweisung bei Dokumentenneuzugang mit Matching Algorithmus. Sehr ansprechend. Docspell bietet einen gänzlich anderen Zugang zum automatischen Tagging, in dem es auf Basis von KI die bestehenden Taggings nimmt und diese als Filter in zyklischen Tagging-Läufen auf andere Dokumente projiziert. Ich muss zugeben, dass dieses Konzept modern ist aber bei mir auf Skeptsis stößt. Mayan bietet am Ende natürlich ebenso Taggings, allerdings ist eine automatische Zuweisung nicht zu finden und die Taggings müssen vor der Anwendung definiert werden.

7. Zyklischer Import aus einem Verzeichnis

Die Dokumente lassen sich natürlich immer über die Weboberfläche in die DMS laden, jedoch sind Scanner häufig so ausgelegt, dass sie ihren Content auf einen Share legen wollen. Von diesem Share aus sollte sinnvollerweise ein zyklischer Import von Dokumenten ist das DMS hinein möglich sein. Dieser Support ist für mich su Fundamental, dass es hier 100 Punkte gibt.

File ImportPunkteDocspellPaperless-NGXMayan-EDMS
zyklischer Import100100 (über Docspell CLI (DSC))100 (PAPERLESS_CONSUMPTION_DIR=path)100 (Watch Folder)
Punktesummemax. 100100100100
Zyklischer Import-Vergleichstest

Kurzes-Fazit:

Ein No-Brainer, das Ergebnis deckt sich mit meiner Erwartungshaltung.

8. Zugriff aufs DMS

Entscheidend für die Nutzung des DMS ist natürlich die DMS Oberfläche. Hier wäre eine App fürs Mobil natürlich schon. Allerdings finde ich eine responsive Weboberfläche eine App gleichwertig, wenn sie die nötige „Flupptizität“ hat. Der Zugriff soll einfach, intuitiv und spaß bereiten. Ich weiß, dass diese Eigenschaften sehr von der persönlichen Wahrnehmung und Vorlieben abhängig sind. (Support mit 50 Punkten bewertet)

ZugriffsoptionenPunkteDocspellPaperless-NGXMayan-EDMS
Mobile App5050500
Responsivenes Weboberfläche50505050
Responsivenes Mobil50505050
Responsivenes Pad50505050
Punktesummemax. 200200200150
Zugriffs-Vergleichtest

Kurzes-Fazit:

Ein No-Brainer die Weboberflächen reagieren im Jahre 2022 allesamt responsive auf die Auflösung und den Typ des WebClients , das Ergebnis deckt sich mit meiner Erwartungshaltung. Allerdings staune ich etwas das es beim Mayan-EDMS keine Mobile App gibt, hier haben die jüngeren Protagonisten die Nase vorn.

9. Auswertung und Gesamtergebnis

Um es kurz zu machen, zu erst einmal die Übersicht der Protagonisten und ihre jeweiligen Punktstände in der Übersichtstabelle.

KategoriePunkteDocspellPaperless-NGXMayan-EDMS
Fileformatmax. 759252253 / (optional Tika 603)607
Such-Operatormax. 30050300300
Dokumentenart/typemax. 200100150100
Ordnertiefemax. 125500125
Kunde/Ansprechpartnermax. 100100500
Taggingmax. 100150150100
Batch Importmax. 100100100100
DMS Accessmax. 200200200150
Gesamtpunktzahlmax. 188410021203 / (optional Tika 1553)1482
Übersichtstabelle

Fazit:

Docspell erscheint mir noch etwas Roh, also zur Zeit in einer nicht produktive nutzbaren Fassung. Mit einiger Entwicklungsreife wird es sicherlich zu einem sehr gut nutzbaren DMS heran wachsen.

Paperless-NGX ist von der Handhabung her eigentlich das richtig für mich, allerdings stehen dem der Boardmittelumfang der Dateiformate entgegen. Mit Boardmitteln wird mein Bedarf nicht gedeckt. Ich werde wohl oder übel noch ein Schleife mit Tika dran hängen.

Mayan-EDMS ist vom Dateiumfang her ganz klar mein Favorit. Nur merkt man diesem DMS an, dass es eigentlich für eine wesentlich größere Umgebung a’la Enterprise Company gedacht ist. An allen Ecken und Enden blinkt die Securitydenke eines CISOs durch.

Sollte sich die Dateiformat-Stuation mit Tika bei Paperless-NGX signifikant verbessern werde ich eine Fußnote nachreichen und berichten.

Das könnte dich auch interessieren …

4 Antworten

  1. Michael sagt:

    Hallo Eric,

    danke für deine Überlegungen.

    Meinst Du Mayan-EDM hat genügend Anwender über dauerhaft zu überleben?
    Wie würdest Du bei einem Projekteinbruch vorgehen, wie kommst Du an die Daten?
    Mayan-EDM erscheint zwar reizvoll, aber wenige Anwender, Entwickler und es zickte bei mir teilweise.

    Mein Favorit ist zur Zeit wieder paperless-ngx
    Da gibt es vermutlich die meisten Anwender.

    Obwohl, eigentlich habe noch gar nicht so richtig angefangen, weil ich mich
    nicht entscheiden kann.

    VG
    Michael

    • Eric Sobian sagt:

      Hallo Michael,

      auf der Website von Mayan-EDMS werben sie mit großen Kunden.
      Allerdings bin ich da immer etwas skeptisch, bin ja selber bei einem IT-Dienstleister
      und da wird ggf. aus einer Präsentation schon mal ein Usecase. 😉
      Ich muss zugeben, dass mir das Mayan-EDMS interessant erscheint (gerade wegen der vielen unterstützten Filetypen),
      jedoch ist Paperless-NGX wesentlich intuitiver. Genau aus diesem Grund werde ich noch
      eine Runde drehen und Paperless-NGX mit Tika-Server und Gotenberg-Server untersetzen,
      um dann ggf. nochmal die Filetype-Anzahl bei Paperless-NGX nach oben zu treiben – damit es meinen Bedarf erfüllt.
      In jedem Fall, werde ich darüber berichten. 🙂

      Wenn ich mir die Anzahl der Entwickler auf Github bei den Projekten ansehe (paperess-ngx: 51 / mayan-edms 54 / docspell 24) und deren aktivitätet, dann bleiben wieder paperless-ngx und mayan-edms auf dem Treppchen.

      Ich schau mal, was der Tika- und Gotenberg-Server mit Paperless-ngx machen und dann wird noch mal gerechnet. 😉

      Danke für deinen Input!!

      VG, Eric

  2. Eike sagt:

    Hallo Eric, schöne Zusammenstellung! Ich wollte gerne ein paar Kleinigkeiten bzgl. Docspell erwähnen.

    Es werden mehr Dateitypen unterstützt als aufgelistet, z.B. doc, docx, xls und die opendocument Pendants (odt etc) – steht irgendwo auf der Seite glaube ich.

    Den Dokumententyp würde man eher über einen Tag lösen, der in eine Gruppe „Dokumententyp“ organisert ist. Damit wird es auch meistens korrekt automatisch erkannt und kann selbstverständlich manuell korrigiert werden. Aber ist natürlich komplett dem Benutzer überlassen, wie die Features verwendet werden.

    Eine komplexere Volltextsuche geht nicht nur via SOLR, sondern auch mittels PostgreSQL (was sowieso als DB empfohlen wäre). Das wäre also eine Möglichkeit ohne die zusätzliche SOLR Komponente. SOLR hat aber mehr Features und ist evtl. schneller bei größeren Datenmengen – wie immer gibt es Vor- und Nachteile.

    Das war’s auch schon 🙂 VG Eike

    • Eric Sobian sagt:

      Hallo Eike,

      ich danke dir für dein Feedback!
      Bei Docspell tut sich noch sehr viel,
      alleine zwischen meinem Test (v0.37) und last Stable (v0.38) hat sich ja auf GitHub einiges getan.
      Ich vermute du bist Eikek von Github und hast selber mit über 1.800 Commits
      eine super heftige Entwicklungsarbeit an DocSpell geleistet.

      Mir liegt es völlig fern negativ über DocSpell zu sprechen,
      im Gegenteil ich bin hoch erfreut über eure Entwicklung bei DocSpell.
      Und möchte mich bei dir/euch für die Entwicklungsarbeit bedanken,
      denn wie schnelllebig ist heute die Zeit und wie einfach
      ist der Wechsel von einem DMS zum anderen…

      Ich hab mit meinem Test eine Momentaufnahme gemacht,
      welche sich ja jederzeit ändern kann. 😉

      Macht weiter so und viele Grüße, Eric

Schreibe einen Kommentar zu Eike Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert