{"id":1543,"date":"2022-06-20T22:11:46","date_gmt":"2022-06-20T21:11:46","guid":{"rendered":"https:\/\/www.fotoandnet.de\/wp\/?p=1543"},"modified":"2022-06-20T22:11:48","modified_gmt":"2022-06-20T21:11:48","slug":"docspell-auf-ubuntu-22-04lts-installieren","status":"publish","type":"post","link":"http:\/\/www.fotoandnet.de\/wp\/?p=1543","title":{"rendered":"Docspell auf Ubuntu 22.04lts installieren"},"content":{"rendered":"\n<p>Nach dem ich mir Paperless-NGX angesehen habe und mir der Umfang an supporteten Dokumenten durch das DMS nicht ausreichte sehe ich mir in diesem Beitrag das DMS Docspell an. Es scheint durch seine Nutzung von Tools im Umfeld eine gr\u00f6\u00dfere Anzahl von Dokumententypen zu unterst\u00fctzen. Wenn ich mich richtig orientiert habe besteht das Docspell Framework aus folgenden Komponenten.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"576\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-framework-1-1024x576.jpg\" alt=\"\" class=\"wp-image-1552\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-framework-1-1024x576.jpg 1024w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-framework-1-300x169.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-framework-1-768x432.jpg 768w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-framework-1.jpg 1058w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Etwas verwundert es mich, dass Unoconv genutzt wird da das auf Github als &#8222;deprecated&#8220; deklariert ist. Wir werden sehen, in wie Weit das relevant ist. <\/p>\n\n\n\n<p>Nachdem ich mir dazu auf YT einige echt gute Beitr\u00e4ge von <a href=\"https:\/\/youtu.be\/UwdcFr7mXaI\" target=\"_blank\" rel=\"noreferrer noopener\">Christian Zengel<\/a> angesehen habe, will ich mir mal eine VitualBox bauen um mir selbst eine Meinung zu dem Thema bilden zu k\u00f6nnen.<\/p>\n\n\n\n<p>Ich habe mir f\u00fcr solche Zwecke eine standard Ubuntu22.04lts Server aus Ausgangspunkt aufgesetzt und den Klone ich dann je nachdem, was ich testen\/probieren m\u00f6chte.<\/p>\n\n\n\n<p>Die <a href=\"https:\/\/docspell.org\/docs\/install\/prereq\/\">Prerequisites<\/a> auf der <a href=\"https:\/\/docspell.org\/\">Docspell Website<\/a> sind schon sehr umfangreich, also zerlegen wir das mal wie immer in handliche Portionen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1. Update des Ubuntu Server 22.04lts<\/h2>\n\n\n\n<p>Zu erst einmal machen wir einen Update des Ubuntu Servers, um ein saubere Ausgangssituation zu haben.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo apt-get update\nuser@2204lts:~$ sudo apt-get upgrade\nuser@2204lts:~$ sudo reboot\n\n\n<\/code><\/pre>\n\n\n\n<h2 class=\"wp-block-heading\">2. Postgre-SQL Datenbank installieren<\/h2>\n\n\n\n<p>In diesem Abschnitt geht es um die Installation und Konfiguration einer lokalen PostgreSQL-Datenbank.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>sudo apt install -y postgresql\n<\/code><\/pre>\n\n\n\n<p>Sobald PostgreSQL installiert ist, starten wir den Dienst und aktivieren Sie ihn f\u00fcr die Ausf\u00fchrung beim Booten:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>Wie bei Paperless-ngx konnte ich auch bei Docspell kein Requirement zur Version der Postgre-SQL Datenbank finden, aber ich vermute \u201clatest and greatest\u201d kann nicht schaden. Sehen wir uns mal an, welche Version wir von Postgre-SQL erwischt haben.\n<\/code><\/pre>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ psql -V\npsql (PostgreSQL) 14.3 (Ubuntu 14.3-0ubuntu0.22.04.1)\n<\/code><\/pre>\n\n\n\n<p><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">3. Erstellung der Portgre-SQL Datenbank f\u00fcr Docspell<\/h2>\n\n\n\n<p>Wir m\u00fcssen zumindest eine Datenbank f\u00fcr Docspell erstellen und ihr einen Benutzernamen und ein Passwort f\u00fcr die Authentifizierung zuweisen. Rufen wir zun\u00e4chst die PostgreSQL-Shell als Postgres-Systembenutzer auf.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo -u postgres psql\ncould not change directory to \"\/home\/user\": Permission denied\npsql (14.3 (Ubuntu 14.3-0ubuntu0.22.04.1))\nType \"help\" for help.\n\npostgres=# \n<\/code><\/pre>\n\n\n\n<p>Geben wir in der Shell die folgenden Befehle ein, um die Datenbank und den Benutzer (die Rolle) anzulegen, und ersetzen Sie das Passwort durch Ihren eigenen Wert:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>postgres=# CREATE DATABASE docspell;\nCREATE DATABASE\npostgres=# CREATE USER docspell WITH PASSWORD 'docspell';\nCREATE ROLE\npostgres=# GRANT ALL PRIVILEGES ON DATABASE docspell to docspell;\nGRANT\npostgres=# \n<\/code><\/pre>\n\n\n\n<p>Wenn ihr das macht verwendet bitte ein sichere Passwort!<\/p>\n\n\n\n<p>Verwende nicht das Passwort aus dem Beispiel. W\u00e4hlen ein sicheres, zuf\u00e4lliges Passwort, um eine sichere Datenbankauthentifizierung f\u00fcr deine Paperless-ngx Installation zu gew\u00e4hrleisten.<\/p>\n\n\n\n<p>Wenn du fertig bist, gib <mark><mark style=\"background-color:#abb8c3\" class=\"has-inline-color\">\\q<\/mark><\/mark> ein, um die PostgreSQL-Shell zu beenden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">4. \u00dcberpr\u00fcfen des Postgre-SQL Datenbankstatus<\/h2>\n\n\n\n<p>Wir k\u00f6nnen \u00fcberpr\u00fcfen, ob die Authentifizierung funktioniert, indem Sie den Befehl psql ausf\u00fchren und den konfigurierten Benutzernamen und das Passwort \u00fcbergeben. (Ersetzen Sie localhost durch Ihren Datenbankserver, wenn Sie eine Remote-Datenbank verwenden).<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ psql --username docspell --host localhost\nPassword for user docspell: \npsql (14.3 (Ubuntu 14.3-0ubuntu0.22.04.1))\nSSL connection (protocol: TLSv1.3, cipher: TLS_AES_256_GCM_SHA384, bits: 256, compression: off)\nType \"help\" for help.\n\ndocspell=&gt; \\conninfo\nYou are connected to database \"docspell\" as user \"docspell\" on host \"localhost\" (address \"127.0.0.1\") at port \"5432\".\nSSL connection (protocol: TLSv1.3, cipher: TLS_AES_256_GCM_SHA384, bits: 256, compression: off)\ndocspell=&gt; \\q\nuser@2204lts:~$ \n<\/code><\/pre>\n\n\n\n<p>Wenn die Verbindung erfolgreich war, wird nach der Passwort Eingabeaufforderung der Postgre-SQL Prompt <mark style=\"background-color:#abb8c3\" class=\"has-inline-color\">docspell=&gt;<\/mark> angezeigt. Geben Sie <mark><mark style=\"background-color:#abb8c3\" class=\"has-inline-color\">\\conninfo<\/mark><\/mark> ein, um Ihre Verbindung zu best\u00e4tigen und anschlie\u00dfend geben Sie <mark><mark style=\"background-color:#abb8c3\" class=\"has-inline-color\">\\q<\/mark><\/mark> ein, um die Verbindung zu beenden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">5. Tesseract Installation<\/h2>\n\n\n\n<p>Die hereinkommenden Dokumente, Zeichnungen, Grafiken werden bei docspell durch die OCR Software Tesseract analysiert. Laut PreRequisites wird Version 3 oder 4 erwartet. Meine Dokumente sind aus den Deutsch- und Englisch-Raum, weshalb ich gleich die passenden OCR Module mit installiere.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo apt-get install tesseract-ocr tesseract-ocr-frk tesseract-ocr-deu tesseract-ocr-eng \nReading package lists... Done\nBuilding dependency tree... Done\nReading state information... Done\nDie folgenden zus\u00e4tzlichen Pakete werden installiert:\n  fontconfig fontconfig-config fonts-dejavu-core libcairo2 libdatrie1 libdeflate0 libfontconfig1 libgif7 libgomp1 libgraphite2-3\n  libharfbuzz0b libjbig0 libjpeg-turbo8 libjpeg8 liblept5 libopenjp2-7 libpango-1.0-0 libpangocairo-1.0-0 libpangoft2-1.0-0\n  libpixman-1-0 libtesseract4 libthai-data libthai0 libtiff5 libwebp7 libwebpmux3 libxcb-render0 libxcb-shm0 libxrender1\n  tesseract-ocr-osd\nDie folgenden NEUEN Pakete werden installiert:\n&lt;snip&gt;<\/code><\/pre>\n\n\n\n<p>Bevor wir fortfahren, vergewissern wir uns, dass die installierte Version von Tesseract mindestens v4.0.0 ist:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ tesseract --version\ntesseract 4.1.1\n leptonica-1.82.0\n  libgif 5.1.9 : libjpeg 8d (libjpeg-turbo 2.1.1) : libpng 1.6.37 : libtiff 4.3.0 : zlib 1.2.11 : libwebp 1.2.2 : libopenjp2 2.4.0\n Found AVX2\n Found AVX\n Found SSE\n Found libarchive 3.6.0 zlib\/1.2.11 liblzma\/5.2.5 bz2lib\/1.0.8 liblz4\/1.9.3 libzstd\/1.4.8\nuser@2204lts:~$ \n<\/code><\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\"><\/pre>\n\n\n\n<p>Das sieht gut aus, im verwendeten Ubuntu 22.04lts ist zur Zeit Tesseract Version 4.1.1 am Start.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">6. OpenJDK Installation<\/h2>\n\n\n\n<p>Da ich nicht unter Java entwickele reicht mir der OpenJDK aus. Ich hoffe, dass das Docspell genauso sieht. Pr\u00fcfen wir kurz, ob Ubuntu Server 22.04lts nicht irgend ein Java Paket mit installiert hat.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ java -version\nCommand 'java' not found, but can be installed with:\nsudo apt install openjdk-11-jre-headless  # version 11.0.15+10-0ubuntu0.22.04.1, or\nsudo apt install default-jre              # version 2:1.11-72build2\nsudo apt install openjdk-17-jre-headless  # version 17.0.3+7-0ubuntu0.22.04.1\nsudo apt install openjdk-18-jre-headless  # version 18~36ea-1\nsudo apt install openjdk-8-jre-headless   # version 8u312-b07-0ubuntu1\n<\/code><\/pre>\n\n\n\n<p>Also es sieht nicht danach aus, also installieren wir OpenJDK-18 ohne die Entwicklerumgebung und ohne GUI.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo apt-get install openjdk-18-jdk-headless\nReading package lists... Done\nBuilding dependency tree... Done\nReading state information... Done\nDie folgenden zus\u00e4tzlichen Pakete werden installiert:\n  alsa-topology-conf alsa-ucm-conf ca-certificates-java java-common libasound2 libasound2-data libavahi-client3\n  libavahi-common-data libavahi-common3 libcups2 liblcms2-2 libpcsclite1 openjdk-18-jre-headless\nVorgeschlagene Pakete:\n&lt;snip&gt;\n<\/code><\/pre>\n\n\n\n<p>Eine kurzer Check, was wir jetzt als Java haben:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ java -version\nopenjdk version \"18-ea\" 2022-03-22\nOpenJDK Runtime Environment (build 18-ea+36-Ubuntu-1)\nOpenJDK 64-Bit Server VM (build 18-ea+36-Ubuntu-1, mixed mode, sharing)\n<\/code><\/pre>\n\n\n\n<p>Wir werden sehen, ob das Docspell reicht oder wir etwas hinterer schieben m\u00fcssen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">7. Ghostscript Installation<\/h2>\n\n\n\n<p>Auch f\u00fcr Ghostscript wird keine erwartete Versionsnummer vorgegeben, dem entsprechend nehmen wir einfach das aktuelle aus dem Ubuntu Repository und installieren es.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo apt-get install ghostscript\nReading package lists... Done\nBuilding dependency tree... Done\nReading state information... Done\nDie folgenden zus\u00e4tzlichen Pakete werden installiert:\n  fonts-droid-fallback fonts-noto-mono fonts-urw-base35 libgs9 libgs9-common libidn12 libijs-0.35 libjbig2dec0 libpaper-utils\n  libpaper1 poppler-data\n<\/code><\/pre>\n\n\n\n<p>Ein kurzer Check auch hier, was wir als Ghostscript installiert haben:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ gs --help\nGPL Ghostscript 9.55.0 (2021-09-27)\nCopyright (C) 2021 Artifex Software, Inc.  All rights reserved.\n<\/code><\/pre>\n\n\n\n<p>Version 9.55.0 aus dem Jahre 2021. Wir werden auch hier sehen, ob das Docspell reicht.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">8. Unpaper Installieren<\/h2>\n\n\n\n<p>So wie ich das in den PreRequisites lese, handelt es sich hier um ein Tool, was das OCR Ergebnis von Tesseract verbessern soll und da ja besser immer angestrebt wird, installieren wir das mal mit. Laut <mark style=\"background-color:#abb8c3\" class=\"has-inline-color\">apt-cache search unpaper<\/mark> handelt es sich um ein &#8222;Werkzeug zum Nachbearbeiten von eingescannten Seiten&#8220;.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo apt-get install unpaper\n&#091;sudo] password for user: \nReading package lists... Done\nBuilding dependency tree... Done\nReading state information... Done\nDie folgenden zus\u00e4tzlichen Pakete werden installiert:\n  i965-va-driver intel-media-va-driver libaacs0 libaom3 libavcodec58 libavformat58 libavutil56 libbdplus0 libbluray2\n  libcairo-gobject2 libchromaprint1 libcodec2-1.0 libdav1d5 libdrm-amdgpu1 libdrm-intel1 libdrm-nouveau2 libdrm-radeon1\n  libgdk-pixbuf-2.0-0 libgdk-pixbuf2.0-bin libgdk-pixbuf2.0-common libgme0 libgsm1 libigdgmm12 libllvm13 libmfx1 libmp3lame0\n  libmpg123-0 libnorm1 libogg0 libopenmpt0 libopus0 libpciaccess0 libpgm-5.3-0 librabbitmq4 librsvg2-2 librsvg2-common libshine3\n  libsnappy1v5 libsoxr0 libspeex1 libsrt1.4-gnutls libssh-gcrypt-4 libswresample3 libtheora0 libtwolame0 libudfread0 libva-drm2\n  libva-x11-2 libva2 libvdpau1 libvorbis0a libvorbisenc2 libvorbisfile3 libvpx7 libx11-xcb1 libx264-163 libx265-199 libxcb-dri2-0\n  libxcb-dri3-0 libxcb-present0 libxcb-sync1 libxcb-xfixes0 libxfixes3 libxshmfence1 libxvidcore4 libzmq5 libzvbi-common libzvbi0\n  mesa-va-drivers mesa-vdpau-drivers ocl-icd-libopencl1 va-driver-all vdpau-driver-all\n&lt;snip&gt;\n<\/code><\/pre>\n\n\n\n<p>Pr\u00fcfen wir einmal, ob es l\u00e4uft und in welcher Version unpaper installiert wurde. Hier schweigen sich die PreRequisites leider auch dar\u00fcber aus, welche Version ben\u00f6tigt oder gew\u00fcnscht wird.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ unpaper --help\nunpaper 6.1\nLicense GPLv2: GNU GPL version 2.\nThis is free software: you are free to change and redistribute it.\nThere is NO WARRANTY, to the extent permitted by law.\n\nUsage: unpaper &#091;options] &lt;input-file(s)&gt; &lt;output-file(s)&gt;\n\nFilenames may contain a formatting placeholder starting with '%%' to insert a\npage counter for multi-page processing. E.g.: 'scan%%03d.pbm' to process files\nscan001.pbm, scan002.pbm, scan003.pbm etc.\n\nSee 'man unpaper' for options details\nReport bugs at https:\/\/github.com\/Flameeyes\/unpaper\/issues\n\nuser@2204lts:~$<\/code><\/pre>\n\n\n\n<p>Okay, unpaper springt an und sagt es hat den Versionsstand 6.1<\/p>\n\n\n\n<p><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">9. Unoconv Installieren<\/h2>\n\n\n\n<p>Jetzt ist das Tool unoconv dran, welches <a href=\"https:\/\/github.com\/unoconv\/unoconv\">laut Github seit 2017<\/a> nicht mehr weiter entwickelt oder gebugfixt wird. Auf Github ist der letzte Versionstand die 0.8.2. Das sch\u00f6ne an Ubuntu ist ja, das es gerne mal hoffnungslos veraltete Software im Repository hat.. (seufz)<\/p>\n\n\n\n<p> Aber sei es drum, ich m\u00f6chte mir in diesem Artiekl nur einen ersten Eindruck von Docspell verschaffen und kann mir dann sp\u00e4ter ggf. Gedanken um diesen alten Schinken machen.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo apt-get install unoconv\nReading package lists... Done\nBuilding dependency tree... Done\nReading state information... Done\nDie folgenden zus\u00e4tzlichen Pakete werden installiert:\n  adwaita-icon-theme at-spi2-core cpp cpp-11 dconf-gsettings-backend dconf-service dictionaries-common emacsen-common\n  fonts-liberation2 fonts-opensymbol gcc-11-base gsettings-desktop-schemas gstreamer1.0-plugins-base gtk-update-icon-cache\n  hicolor-icon-theme humanity-icon-theme hunspell-en-us libabsl20210324 libabw-0.1-1 libatk-bridge2.0-0 libatk1.0-0 libatk1.0-data\n  libatspi2.0-0 libauthen-sasl-perl libboost-filesystem1.74.0 libboost-iostreams1.74.0 libboost-locale1.74.0 libboost-thread1.74.0\n  libcdparanoia0 libcdr-0.1-1 libclone-perl libclucene-contribs1v5 libclucene-core1v5 libcolamd2 libcolord2 libdata-dump-perl\n  libdconf1 libe-book-0.1-1 libencode-locale-perl libeot0 libepoxy0 libepubgen-0.1-1 libetonyek-0.1-1 libexttextcat-2.0-0\n  libexttextcat-data libfile-basedir-perl libfile-desktopentry-perl libfile-listing-perl libfile-mimeinfo-perl libfont-afm-perl\n  libfontenc1 libfreehand-0.1-1 libgl1 libgl1-amber-dri libgl1-mesa-dri libglapi-mesa libglvnd0 libglx-mesa0 libglx0 libgpgmepp6\n  libgstreamer-plugins-base1.0-0 libgtk-3-0 libgtk-3-bin libgtk-3-common libgtkd-3-0 libharfbuzz-icu0 libhtml-form-perl\n  libhtml-format-perl libhtml-parser-perl libhtml-tagset-perl libhtml-tree-perl libhttp-cookies-perl libhttp-daemon-perl\n  libhttp-date-perl libhttp-message-perl libhttp-negotiate-perl libhunspell-1.7-0 libhyphen0 libice6 libio-html-perl\n  libio-socket-ssl-perl libio-stringy-perl libipc-system-simple-perl libisl23 liblangtag-common liblangtag1 libllvm11 libltdl7\n  liblwp-mediatypes-perl liblwp-protocol-https-perl libmailtools-perl libmhash2 libmpc3 libmspub-0.1-1 libmwaw-0.3-3\n  libmythes-1.2-0 libnet-dbus-perl libnet-http-perl libnet-smtp-ssl-perl libnet-ssleay-perl libodfgen-0.1-1 liborc-0.4-0\n  liborcus-0.17-0 liborcus-parser-0.17-0 libpagemaker-0.0-0 libphobos2-ldc-shared98 libpoppler118 libraptor2-0 librasqal3 librdf0\n  libreoffice-base-core libreoffice-calc libreoffice-common libreoffice-core libreoffice-draw libreoffice-impress libreoffice-math\n  libreoffice-style-colibre libreoffice-writer librevenge-0.0-0 libsm6 libsuitesparseconfig5 libtie-ixhash-perl libtimedate-perl\n  libtry-tiny-perl libuno-cppu3 libuno-cppuhelpergcc3-3 libuno-purpenvhelpergcc3-3 libuno-sal3 libuno-salhelpergcc3-3 liburi-perl\n  libvisio-0.1-1 libvisual-0.4-0 libvte-2.91-0 libvte-2.91-common libvted-3-0 libvulkan1 libwayland-client0 libwayland-cursor0\n  libwayland-egl1 libwpd-0.10-10 libwpg-0.3-3 libwps-0.4-4 libwww-perl libwww-robotrules-perl libx11-protocol-perl libxaw7\n  libxcb-glx0 libxcb-randr0 libxcb-shape0 libxcomposite1 libxcursor1 libxdamage1 libxft2 libxi6 libxinerama1 libxkbcommon0\n  libxkbfile1 libxml-parser-perl libxml-twig-perl libxml-xpathengine-perl libxmlsec1-nss libxmu6 libxpm4 libxrandr2 libxt6\n  libxtst6 libxv1 libxxf86dga1 libxxf86vm1 libyajl2 lp-solve mesa-vulkan-drivers perl-openssl-defaults python3-uno\n  session-migration tilix tilix-common ubuntu-mono uno-libs-private ure x11-common x11-utils x11-xserver-utils xdg-utils\nVorgeschlagene Pakete:\n&lt;snip&gt;<\/code><\/pre>\n\n\n\n<p>Dieses kleine Tool scheint doch recht bed\u00fcrftige bei der Menge der von ihm gew\u00fcnschten Pakete zu sein. Mal abgesehen von seinem Status Deprecated scheint es das Tool zu sein, welches alle Dokumente, welche nicht durch den OCR Wolf gedreht werden in ein verarbeitbares Format wandelt. Ich denke, dass es genau dieses Dingelchen ist, was bei Paperless-NGX fehlt, um alle m\u00f6glichen Arten von Dokumenten erst zu Wandeln und dann zu Verarbeiten. Pr\u00fcfen wir also kurz nach, welche Deprecated-Version wir uns eingetreten haben:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ unoconv --version\n\/usr\/bin\/unoconv:19: DeprecationWarning: The distutils package is deprecated and slated for removal in Python 3.12. Use setuptools or check PEP 632 for potential alternatives\n  from distutils.version import LooseVersion\nunoconv 0.7\nWritten by Dag Wieers &lt;dag@wieers.com&gt;\nHomepage at http:\/\/dag.wieers.com\/home-made\/unoconv\/\n\nplatform posix\/linux\npython 3.10.4 (main, Apr  2 2022, 09:04:19) &#091;GCC 11.2.0]\nLibreOffice 7.3.3.2\n<\/code><\/pre>\n\n\n\n<p>M\u00f6glicherweise ist der Unoserver im Folgenden ein Kandidat als Nachfolger f\u00fcr dieses Tool..<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">10. WKHTMLTOPDF Installieren<\/h2>\n\n\n\n<p>Nach so ein Tool, bei dem ich vermute, dass es die Artenvielfalt der von Docspell supporteten Filetypes erh\u00f6hen d\u00fcrfte. Dann wollen wir das mal installieren.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo apt-get install wkhtmltopdf\n&#091;sudo] password for user: \nReading package lists... Done\nBuilding dependency tree... Done\nReading state information... Done\nDie folgenden zus\u00e4tzlichen Pakete werden installiert:\n  avahi-daemon geoclue-2.0 glib-networking glib-networking-common glib-networking-services iio-sensor-proxy libavahi-core7\n  libavahi-glib1 libdaemon0 libdouble-conversion3 libegl-mesa0 libegl1 libgbm1 libinput-bin libinput10 libmd4c0 libmtdev1\n  libnl-route-3-200 libnotify4 libnss-mdns libpcre2-16-0 libproxy1v5 libqt5core5a libqt5dbus5 libqt5gui5 libqt5network5\n  libqt5positioning5 libqt5printsupport5 libqt5qml5 libqt5qmlmodels5 libqt5quick5 libqt5sensors5 libqt5svg5 libqt5webchannel5\n  libqt5webkit5 libqt5widgets5 libsoup2.4-1 libsoup2.4-common libwacom-bin libwacom-common libwacom9 libwayland-server0 libwoff1\n  libxcb-icccm4 libxcb-image0 libxcb-keysyms1 libxcb-render-util0 libxcb-util1 libxcb-xinerama0 libxcb-xinput0 libxcb-xkb1\n  libxfont2 libxkbcommon-x11-0 qt5-gtk-platformtheme qttranslations5-l10n wpasupplicant x11-xkb-utils xfonts-base xfonts-encodings\n  xfonts-utils xnest xserver-common\n&lt;snip&gt;<\/code><\/pre>\n\n\n\n<p>Oh man, das Tool bringt einen XServer mit. Genau das, was man auf einem Headless Server haben m\u00f6chte&#8230; (seufz)<\/p>\n\n\n\n<p>Pr\u00fcfen wir mal den Versionsstand, auch wenn die PreRquisites hier ja auch keine Forderung stellen.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ wkhtmltopdf --help\nName:\n  wkhtmltopdf 0.12.6\n\nSynopsis:\n  wkhtmltopdf &#091;GLOBAL OPTION]... &#091;OBJECT]... &lt;output file&gt;\n<\/code><\/pre>\n\n\n\n<p>Der Stand der Version ist 0.12.6, was sich mit dem <a href=\"https:\/\/github.com\/wkhtmltopdf\/wkhtmltopdf\">Stand auf Github<\/a> zumindest deckt.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">11. OCRmyPDF Installieren<\/h2>\n\n\n\n<p>Bei dem Tool brauche ich glaube nicht zu erw\u00e4hnen, dass es keine Forderung zum Versionsstand gibt.. Also installieren wir es flott.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo apt-get install ocrmypdf\nReading package lists... Done\nBuilding dependency tree... Done\nReading state information... Done\nDie folgenden zus\u00e4tzlichen Pakete werden installiert:\n  bzip2 icc-profiles-free libimagequant0 libqpdf28 libraqm0 libwebpdemux2 mailcap mime-support pngquant python3-bs4\n  python3-coloredlogs python3-html5lib python3-humanfriendly python3-img2pdf python3-lxml python3-olefile python3-packaging\n  python3-pdfminer python3-pikepdf python3-pil python3-pluggy python3-renderpm python3-reportlab python3-reportlab-accel\n  python3-soupsieve python3-tqdm python3-webencodings\n&lt;snip&gt;<\/code><\/pre>\n\n\n\n<p>Zumindest fri\u00dft dieses Tool nicht unendlich viel Speicherplatz auf der Festplatte. Schauen wir uns den Versionsstand an.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ ocrmypdf --version\n13.4.0+dfsg\n<\/code><\/pre>\n\n\n\n<p>Zumindest eine 13 als Major-Release, was mir zwar auch nichts sagt, aber so what&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">12. SOLR Installieren<\/h2>\n\n\n\n<p>Fehlt mir als letzte PreRequisite noch die SOLR Searchengine. Laut Website ben\u00f6tigt diese mindestens Java Version 11, was bereits gegeben ist. Dann werden wir diese mal herunter laden und zwar am besten nach \/opt.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:\/opt$ sudo wget https:\/\/archive.apache.org\/dist\/solr\/solr\/9.0.0\/solr-9.0.0.tgz \n&#091;sudo] password for user: \n--2022-06-08 06:55:06--  https:\/\/archive.apache.org\/dist\/solr\/solr\/9.0.0\/solr-9.0.0.tgz\nResolving archive.apache.org (archive.apache.org)... 2a01:4f8:172:2ec5::2, 138.201.131.134\nConnecting to archive.apache.org (archive.apache.org)|2a01:4f8:172:2ec5::2|:443... connected.\nHTTP request sent, awaiting response... 200 OK\nLength: 223857836 (213M) &#091;application\/x-gzip]\nSaving to: \u2018solr-9.0.0.tgz\u2019\n\nsolr-9.0.0.tgz                   100%&#091;==========================================================&gt;] 213,49M  4,72MB\/s    in 53s     \n\n2022-06-08 06:56:00 (4,00 MB\/s) - \u2018solr-9.0.0.tgz\u2019 saved &#091;223857836\/223857836]\n\nuser@2204lts:\/opt$ \n<\/code><\/pre>\n\n\n\n<p>In \/opt werden wir es auch gleich auspacken.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:\/opt$ sudo tar xzfv solr-9.0.0.tgz\nsolr-9.0.0\/\nsolr-9.0.0\/LICENSE.txt\nsolr-9.0.0\/NOTICE.txt\nsolr-9.0.0\/CHANGES.txt\nsolr-9.0.0\/README.md\nsolr-9.0.0\/bin\/\nsolr-9.0.0\/bin\/install_solr_service.sh\nsolr-9.0.0\/bin\/oom_solr.sh\nsolr-9.0.0\/bin\/post\nsolr-9.0.0\/bin\/postlogs\nsolr-9.0.0\/bin\/solr\nsolr-9.0.0\/bin\/solr.cmd\nsolr-9.0.0\/bin\/solr.in.cmd\nsolr-9.0.0\/bin\/solr.in.sh\nsolr-9.0.0\/bin\/init.d\/\nsolr-9.0.0\/bin\/init.d\/solr\n&lt;snip&gt;<\/code><\/pre>\n\n\n\n<p>Das ist ja ein ziemliches Unget\u00fcm, dieses Solr. Aber daf\u00fcr hat es laut Wiki eine eigene Installationsroutine, welche wir gleich mal nutzen werden.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:\/opt\/solr-9.0.0\/bin$ sudo bash .\/install_solr_service.sh \/opt\/solr-9.0.0.tgz\nid: \u2018solr\u2019: no such user\nCreating new user: solr\nAdding system user `solr' (UID 116) ...\nAdding new group `solr' (GID 123) ...\nAdding new user `solr' (UID 116) with group `solr' ...\nCreating home directory `\/var\/solr' ...\n\nWARNING: \/opt\/solr-9.0.0 already exists! Skipping extract ...\n\n\nInstalling symlink \/opt\/solr -&gt; \/opt\/solr-9.0.0 ...\n\n\nInstalling \/etc\/init.d\/solr script ...\n\n\nInstalling \/etc\/default\/solr.in.sh ...\n\nService solr installed.\nCustomize Solr startup configuration in \/etc\/default\/solr.in.sh\n\u25cf solr.service - LSB: Controls Apache Solr as a Service\n     Loaded: loaded (\/etc\/init.d\/solr; generated)\n     Active: active (exited) since Wed 2022-06-08 07:12:28 UTC; 5s ago\n       Docs: man:systemd-sysv-generator(8)\n    Process: 1399 ExecStart=\/etc\/init.d\/solr start (code=exited, status=0\/SUCCESS)\n        CPU: 11ms\n\nJun 08 07:12:23 2204lts systemd&#091;1]: Starting LSB: Controls Apache Solr as a Service...\nJun 08 07:12:23 2204lts su&#091;1401]: (to solr) root on none\nJun 08 07:12:23 2204lts su&#091;1401]: pam_unix(su-l:session): session opened for user solr(uid=116) by (uid=0)\nJun 08 07:12:28 2204lts solr&#091;1465]: Started Solr server on port 8983 (pid=1461). Happy searching!\nJun 08 07:12:28 2204lts systemd&#091;1]: Started LSB: Controls Apache Solr as a Service.\nuser@2204lts:\/opt\/solr-9.0.0\/bin$ \n<\/code><\/pre>\n\n\n\n<p>Das Script l\u00e4uft ohne zu meckern. Noch ein kurzer Check, ob SOLR eine Socket ghe\u00f6ffnet hat. Mist, ich hatte vergessen die Net-Tools zu installieren. Dann hole ich das eben schnell nach und sehe dann nach dem von dem Install-Script angebenen Port 8983. <\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:\/opt\/solr-9.0.0\/bin$ sudo apt-get install net-tools\nReading package lists... Done\nBuilding dependency tree... Done\nReading state information... Done\nDie folgenden NEUEN Pakete werden installiert:\n  net-tools\n0 aktualisiert, 1 neu installiert, 0 zu entfernen und 3 nicht aktualisiert.\nEs m\u00fcssen 204 kB an Archiven heruntergeladen werden.\nNach dieser Operation werden 819 kB Plattenplatz zus\u00e4tzlich benutzt.\nHolen:1 http:\/\/de.archive.ubuntu.com\/ubuntu jammy\/main amd64 net-tools amd64 1.60+git20181103.0eebece-1ubuntu5 &#091;204 kB]\nEs wurden 204 kB in 0s geholt (1.011 kB\/s).\nVormals nicht ausgew\u00e4hltes Paket net-tools wird gew\u00e4hlt.\n(Lese Datenbank ... 136361 Dateien und Verzeichnisse sind derzeit installiert.)\nVorbereitung zum Entpacken von ...\/net-tools_1.60+git20181103.0eebece-1ubuntu5_amd64.deb ...\n&lt;snip&gt;\n\n\nuser@2204lts:\/opt\/solr-9.0.0\/bin$ netstat -tunelp | grep 8983\n(Not all processes could be identified, non-owned process info\n will not be shown, you would have to be root to see it all.)\ntcp6       0      0 127.0.0.1:8983          :::*                    LISTEN      116        24402      -                   \nuser@2204lts:\/opt\/solr-9.0.0\/bin$\n\nuser@2204lts:\/opt\/solr-9.0.0\/bin$ sudo systemctl status solr\n\u25cf solr.service - LSB: Controls Apache Solr as a Service\n     Loaded: loaded (\/etc\/init.d\/solr; generated)\n     Active: active (exited) since Wed 2022-06-08 07:12:28 UTC; 5min ago\n       Docs: man:systemd-sysv-generator(8)\n    Process: 1399 ExecStart=\/etc\/init.d\/solr start (code=exited, status=0\/SUCCESS)\n        CPU: 11ms\n\nJun 08 07:12:23 2204lts systemd&#091;1]: Starting LSB: Controls Apache Solr as a Service...\nJun 08 07:12:23 2204lts su&#091;1401]: (to solr) root on none\nJun 08 07:12:23 2204lts su&#091;1401]: pam_unix(su-l:session): session opened for user solr(uid=116) by (uid=0)\nJun 08 07:12:28 2204lts solr&#091;1465]: Started Solr server on port 8983 (pid=1461). Happy searching!\nJun 08 07:12:28 2204lts systemd&#091;1]: Started LSB: Controls Apache Solr as a Service.\nuser@2204lts:\/opt\/solr-9.0.0\/bin$ \n\n<\/code><\/pre>\n\n\n\n<p>Der Solr-Service l\u00e4uft, sicherheitshalber geben ich nochmal hinein ins System zum Starten nach reboot.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:\/opt\/solr-9.0.0\/bin$ sudo systemctl enable solr\nsolr.service is not a native service, redirecting to systemd-sysv-install.\nExecuting: \/lib\/systemd\/systemd-sysv-install enable solr\nuser@2204lts:\/opt\/solr-9.0.0\/bin$ \n<\/code><\/pre>\n\n\n\n<p>Diese Meldung sagt mir als Nutzer von systemctl jetzt nicht soviel, aber nach einem Reboot ist der Solr-Service auf Port 8983 ohne mein zu tun wieder da. Das Install-Script scheint alles richtig gemacht zu haben.<\/p>\n\n\n\n<p>Pr\u00fcfen wir, ob auf Port8983 auch wirklich ein SOLR Server antwortet. Das macht er intern:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ wget 127.0.0.1:8983\/solr\n--2022-06-10 14:29:25--  http:\/\/127.0.0.1:8983\/solr\nConnecting to 127.0.0.1:8983... connected.\nHTTP request sent, awaiting response... 302 Found\nLocation: http:\/\/127.0.0.1:8983\/solr\/ &#091;following]\n--2022-06-10 14:29:25--  http:\/\/127.0.0.1:8983\/solr\/\nReusing existing connection to 127.0.0.1:8983.\nHTTP request sent, awaiting response... 200 OK\nLength: unspecified &#091;text\/html]\nSaving to: \u2018solr\u2019\n\nsolr                                        &#091; &lt;=&gt;                                                                           ]  15,86K  --.-KB\/s    in 0s      \n\n2022-06-10 14:29:25 (163 MB\/s) - \u2018solr\u2019 saved &#091;16242]\n\nuser@2204lts:~$ \n<\/code><\/pre>\n\n\n\n<p>Doch leider will er von extern nicht anworten. Mal in den Configs suchen, an welcher Stellschraube man hier drehen muss. Ich hab es gefunden, es ist in der Solr Config Datei \/etc\/default\/solr.in.sh das Feld SOLR_JETTY_HOST, welches man \u00e4ndern muss. Da ich in meinem Testfall keine gro\u00dfen Sicherheitsbedenken einplanen muss, mach ich den Solr Server einfach komplett auf mit:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code># Sets the network interface the Solr binds to. To prevent administrators from\n# accidentally exposing Solr more widely than intended, this defaults to 127.0.0.1.\n# Administrators should think carefully about their deployment environment and\n# set this value as narrowly as required before going to production. In\n# environments where security is not a concern, 0.0.0.0 can be used to allow\n# Solr to accept connections on all network interfaces.\nSOLR_JETTY_HOST=\"0.0.0.0\"\n<\/code><\/pre>\n\n\n\n<p>Und siehe da, schon antwortet der Solr Server auf Anfragen von au\u00dfen mit einem Webinterface.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"976\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/SOLR-Webpage-1024x976.jpg\" alt=\"\" class=\"wp-image-1573\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/SOLR-Webpage-1024x976.jpg 1024w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/SOLR-Webpage-300x286.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/SOLR-Webpage-768x732.jpg 768w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/SOLR-Webpage.jpg 1279w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">13. Docspell Installieren<\/h2>\n\n\n\n<p>Nach dem wir uns also m\u00e4chtig durch die Prerequisites geq\u00e4ult haben kommt jetzt endlich die Installation von Docspell. Dieses scheint aus zwei Paketen zu bestehen, dem Docspell-Restserver und dem Docspell-Joex. Mein bedarf an Sourcecode kompilieren h\u00e4lt sich nach dem Vorlauf in Grenzen, also nehme ich die .Deb Pakete direkt vom Github und hoffe, dass diese laufen. Na dnan holen wir uns die Software mal ins \/opt Verzeichnis.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ cd \/opt\/\nuser@2204lts:\/opt$ sudo wget https:\/\/github.com\/eikek\/docspell\/releases\/download\/v0.37.0\/docspell-joex_0.37.0_all.deb\n&#091;sudo] password for user: \n--2022-06-11 10:52:41--  https:\/\/github.com\/eikek\/docspell\/releases\/download\/v0.37.0\/docspell-joex_0.37.0_all.deb\nResolving github.com (github.com)... 140.82.121.3\nConnecting to github.com (github.com)|140.82.121.3|:443... connected.\n&lt;snip&gt;\nHTTP request sent, awaiting response... 200 OK\nLength: 404633792 (386M) &#091;application\/octet-stream]\nSaving to: \u2018docspell-joex_0.37.0_all.deb\u2019\n\ndocspell-joex_0.37.0_all.deb            100%&#091;==============================================================================&gt;] 385,89M  11,4MB\/s    in 21s     \n\n2022-06-11 10:53:03 (18,1 MB\/s) - \u2018docspell-joex_0.37.0_all.deb\u2019 saved &#091;404633792\/404633792]\n\nuser@2204lts:\/opt$ sudo wget https:\/\/github.com\/eikek\/docspell\/releases\/download\/v0.37.0\/docspell-restserver_0.37.0_all.deb\n--2022-06-11 10:53:17--  https:\/\/github.com\/eikek\/docspell\/releases\/download\/v0.37.0\/docspell-restserver_0.37.0_all.deb\nResolving github.com (github.com)... 140.82.121.3\nConnecting to github.com (github.com)|140.82.121.3|:443... connected.\n&lt;snip&gt;\nLength: 134246592 (128M) &#091;application\/octet-stream]\nSaving to: \u2018docspell-restserver_0.37.0_all.deb\u2019\n\ndocspell-restserver_0.37.0_all.deb      100%&#091;==============================================================================&gt;] 128,03M  7,57MB\/s    in 9,0s    \n\n2022-06-11 10:53:27 (14,2 MB\/s) - \u2018docspell-restserver_0.37.0_all.deb\u2019 saved &#091;134246592\/134246592]\n\nuser@2204lts:\/opt$\nuser@2204lts:\/opt$ ls -la\ntotal 744888\ndrwxr-xr-x  3 root root      4096 Jun 11 10:53 .\ndrwxr-xr-x 19 root root      4096 Apr 24 10:30 ..\n-rw-r--r--  1 root root 404633792 Jun  4 21:27 docspell-joex_0.37.0_all.deb\n-rw-r--r--  1 root root 134246592 Jun  4 21:27 docspell-restserver_0.37.0_all.deb\nlrwxrwxrwx  1 root root        15 Jun  8 07:12 solr -&gt; \/opt\/solr-9.0.0\ndrwxr-xr-x 10 root root      4096 Mai  4 23:00 solr-9.0.0\n-rw-r--r--  1 root root 223857836 Mai  5 07:00 solr-9.0.0.tgz\nuser@2204lts:\/opt$ \n<\/code><\/pre>\n\n\n\n<p>Das abholen vom Github prima geklappt. All fingers crossed, dass die Installation jetzt auch so gut l\u00e4uft.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:\/opt$ sudo dpkg -i docspell-joex_0.37.0_all.deb docspell-restserver_0.37.0_all.deb\nVormals nicht ausgew\u00e4hltes Paket docspell-joex wird gew\u00e4hlt.\n(Lese Datenbank ... 136410 Dateien und Verzeichnisse sind derzeit installiert.)\nVorbereitung zum Entpacken von docspell-joex_0.37.0_all.deb ...\nEntpacken von docspell-joex (0.37.0) ...\nVormals nicht ausgew\u00e4hltes Paket docspell-restserver wird gew\u00e4hlt.\nVorbereitung zum Entpacken von docspell-restserver_0.37.0_all.deb ...\nEntpacken von docspell-restserver (0.37.0) ...\ndocspell-joex (0.37.0) wird eingerichtet ...\nCreating system group: docspell\nCreating system user: docspell in docspell with docspell-joex daemon-user and shell \/bin\/false\nCreated symlink \/etc\/systemd\/system\/multi-user.target.wants\/docspell-joex.service \u2192 \/lib\/systemd\/system\/docspell-joex.service.\ndocspell-restserver (0.37.0) wird eingerichtet ...\nCreated symlink \/etc\/systemd\/system\/multi-user.target.wants\/docspell-restserver.service \u2192 \/lib\/systemd\/system\/docspell-restserver.service.\nuser@2204lts:\/opt$ \n<\/code><\/pre>\n\n\n\n<p>Die Installg\u00f6tter sind mir heute offensichtlich hold! Lief ohne zu mucken. Jetzt bin ich gespannt, wie die Konfiguration von dem beiden Pakten abl\u00e4uft. Sehen wir mal vorsichtig ins \/etc Verzeichnis, ob die Pakete vielleicht eine Beispiel-Konfig mit bringen.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:\/opt$ ls -la \/etc\/doc*\nlrwxrwxrwx 1 root root 29 Jun  4 21:27 \/etc\/docspell-joex -&gt; \/usr\/share\/docspell-joex\/conf\nlrwxrwxrwx 1 root root 35 Jun  4 21:26 \/etc\/docspell-restserver -&gt; \/usr\/share\/docspell-restserver\/conf\n\nuser@2204lts:\/opt$ ls -la \/etc\/docspell-joex\/\ntotal 40\ndrwxr-xr-x 2 root root  4096 Jun 11 10:55 .\ndrwxr-xr-x 5 root root  4096 Jun 11 10:55 ..\n-rw-r--r-- 1 root root 29944 Jun  4 21:08 docspell-joex.conf\n\nuser@2204lts:\/opt$ ls -la \/etc\/docspell-restserver\/\ntotal 28\ndrwxr-xr-x 2 root root  4096 Jun 11 10:55 .\ndrwxr-xr-x 5 root root  4096 Jun 11 10:55 ..\n-rw-r--r-- 1 root root 19058 Jun  4 21:08 docspell-server.conf\nuser@2204lts:\/opt$ \n<\/code><\/pre>\n\n\n\n<p>So idt es, beide bringen Examples mit. Nun steigt die Hoffnung, das die auch schon gut bef\u00fcllt sind. M;ein Hoffnung wird nicht entt\u00e4uscht, da beide Konfigs sehr gut dokumentiert und bef\u00fcllt sind.<\/p>\n\n\n\n<p>Tragen wir zu erst einmal unsere lokale Postgre-SQL Datenbank beim Docspell-Joex ein.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo nano \/etc\/docspell-joex\/docspell-joex.conf\n\n  jdbc {\n\n    # The JDBC url to the database. By default a H2 file-based\n    # database is configured. You can provide a postgresql or mariadb\n    # connection here. When using H2 use the PostgreSQL compatibility\n    # mode and AUTO_SERVER feature.\n    #url = \"jdbc:h2:\/\/\"${java.io.tmpdir}\"\/docspell-demo.db;MODE=PostgreSQL;DATABASE_TO_LOWER=TRUE;AUTO_SERVER=TRUE\"\n\n    # The database user.\n    #user = \"sa\"\n\n    # The database password.\n    #password = \"\"\n    url = \"jdbc:postgresql:\/\/localhost:5432\/docspell\"\n    user = \"docspell\"\n    password = \"docspell\"\n }\n<\/code><\/pre>\n\n\n\n<p>Das Selbe machen wir auch beim Docspell-Restserver.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo nano \/etc\/docspell-restserver\/docspell-server.conf\n\n    # Configuration for PostgreSQL backend\n    postgresql = {\n      # Whether to use the default database, only works if it is\n      # postgresql\n      use-default-connection = true\n\n      # The database connection.\n      jdbc {\n        url = \"jdbc:postgresql:\/\/localhostr:5432\/docspell\"\n        user = \"docspell\"\n        password = \"docspell\"\n      }\n\n<\/code><\/pre>\n\n\n\n<p>Komsicherweise ist die vordefinierte H2 Datenbank auch drinn, welche wir dann mal auskommentieren. Raus damit..<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>    # The database connection.\n    #jdbc {\n      # The JDBC url to the database. By default a H2 file-based\n      # database is configured. You can provide a postgresql or\n      # mariadb connection here. When using H2 use the PostgreSQL\n      # compatibility mode and AUTO_SERVER feature.\n      #url = \"jdbc:h2:\/\/\"${java.io.tmpdir}\"\/docspell-demo.db;MODE=PostgreSQL;DATABASE_TO_LOWER=TRUE;AUTO_SERVER=TRUE\"\n\n      # The database user.\n      #user = \"sa\"\n\n      # The database password.\n      #password = \"\"\n    #}\n\n\n<\/code><\/pre>\n\n\n\n<p>So die Konfigs sehen nach meiner Meinung, bezogen auf Postgre-SQL, gut aus. Schauen wir uns mal den Service Status vom Docspell-Restserver an:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo systemctl status docspell-restserver.service\n\u25cf docspell-restserver.service - Docspell Rest server\n     Loaded: loaded (\/lib\/systemd\/system\/docspell-restserver.service; enabled; vendor preset: enabled)\n     Active: active (running) since Sat 2022-06-11 11:47:54 UTC; 6min ago\n    Process: 707 ExecStartPre=\/bin\/mkdir -p \/run\/docspell-restserver (code=exited, status=0\/SUCCESS)\n    Process: 724 ExecStartPre=\/bin\/chown docspell:docspell \/run\/docspell-restserver (code=exited, status=0\/SUCCESS)\n    Process: 726 ExecStartPre=\/bin\/chmod 755 \/run\/docspell-restserver (code=exited, status=0\/SUCCESS)\n   Main PID: 732 (java)\n      Tasks: 44 (limit: 9410)\n     Memory: 291.8M\n        CPU: 20.538s\n     CGroup: \/system.slice\/docspell-restserver.service\n             \u2514\u2500732 java -Dconfig.file=\/usr\/share\/docspell-restserver\/bin\/..\/conf\/docspell-server.conf -cp \/usr\/share\/docspell-restserver\/lib\/com.github.eikek.&gt;\n\nJun 11 11:48:04 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:03:0037 &#091;io-comp...] &#091;INFO ] org.flywaydb.core.internal.command.DbMigrate - Migrating schem&gt;\nJun 11 11:48:04 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:04:0000 &#091;io-comp...] &#091;INFO ] org.flywaydb.core.internal.command.DbMigrate - Migrating schem&gt;\nJun 11 11:48:04 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:04:0001 &#091;io-comp...] &#091;INFO ] org.flywaydb.core.internal.command.DbMigrate - Migrating schem&gt;\nJun 11 11:48:04 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:04:0002 &#091;io-comp...] &#091;INFO ] org.flywaydb.core.internal.command.DbMigrate - Successfully ap&gt;\nJun 11 11:48:04 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:04:0003 &#091;io-comp...] &#091;INFO ] docspell.backend.ops.ONode.register:52 - Registering node rest1\nJun 11 11:48:05 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:05:0000 &#091;io-comp...] &#091;INFO ] docspell.notification.api.EventExchange.consume:48 - Starting &gt;\nJun 11 11:48:05 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:05:0000 &#091;io-comp...] &#091;INFO ] docspell.pubsub.naive.NaivePubSub.subscribe:89 - Adding subscr&gt;\nJun 11 11:48:05 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:05:0001 &#091;io-comp...] &#091;INFO ] docspell.pubsub.naive.NaivePubSub.subscribe:89 - Adding subscr&gt;\nJun 11 11:48:05 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:05:0000 &#091;io-comp...] &#091;INFO ] org.http4s.blaze.channel.nio1.NIO1SocketServerGroup - Service &gt;\nJun 11 11:48:05 2204lts docspell-restserver&#091;732]: 2022.06.11 11:48:04:0004 &#091;io-comp...] &#091;INFO ] org.http4s.blaze.server.BlazeServerBuilder - http4s v0.23.12 o&gt;\nlines 1-23\/23 (END)\n\n<\/code><\/pre>\n\n\n\n<p>Scheint zu laufen und irgend etwas mit der Datenbank zu machen(???). Wie gehts dem Docspell-Joex Service:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ sudo systemctl status docspell-joex.service \n\u25cf docspell-joex.service - Docspell Joex\n     Loaded: loaded (\/lib\/systemd\/system\/docspell-joex.service; enabled; vendor preset: enabled)\n     Active: active (running) since Sat 2022-06-11 11:53:06 UTC; 2min 55s ago\n    Process: 1854 ExecStartPre=\/bin\/mkdir -p \/run\/docspell-joex (code=exited, status=0\/SUCCESS)\n    Process: 1855 ExecStartPre=\/bin\/chown docspell:docspell \/run\/docspell-joex (code=exited, status=0\/SUCCESS)\n    Process: 1856 ExecStartPre=\/bin\/chmod 755 \/run\/docspell-joex (code=exited, status=0\/SUCCESS)\n   Main PID: 1857 (java)\n      Tasks: 41 (limit: 9410)\n     Memory: 251.4M\n        CPU: 16.140s\n     CGroup: \/system.slice\/docspell-joex.service\n             \u2514\u25001857 java -Dconfig.file=\/usr\/share\/docspell-joex\/bin\/..\/conf\/docspell-joex.conf -cp \/usr\/share\/docspell-joex\/lib\/com.github.eikek.docspell-joex&gt;\n\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:13:0002 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.LogSink.logInternal:41 - &gt;&gt;&gt; 2022-06-11T11:&gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:12:0001 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.LogSink.logInternal:41 - &gt;&gt;&gt; 2022-06-11T11:&gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:12:0003 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.LogSink.logInternal:41 - &gt;&gt;&gt; 2022-06-11T11:&gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:12:0004 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.SchedulerImpl.wrapTask:270 - Job execution &gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:13:0000 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.LogSink.logInternal:41 - &gt;&gt;&gt; 2022-06-11T11:&gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:12:0002 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.LogSink.logInternal:41 - &gt;&gt;&gt; 2022-06-11T11:&gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:13:0001 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.LogSink.logInternal:41 - &gt;&gt;&gt; 2022-06-11T11:&gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:12:0003 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.SchedulerImpl.wrapTask:270 - Job execution &gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:13:0003 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.LogSink.logInternal:41 - &gt;&gt;&gt; 2022-06-11T11:&gt;\nJun 11 11:53:13 2204lts docspell-joex&#091;1857]: 2022.06.11 11:53:13:0004 &#091;io-comp...] &#091;INFO ] docspell.scheduler.impl.LogSink.logInternal:41 - &gt;&gt;&gt; 2022-06-11T11:&gt;\nlines 1-23\/23 (END)\n<\/code><\/pre>\n\n\n\n<p>Ist ebenfalls UP and RUNNING. Klopfen wir mal von innen an dem HTTP Port 7880 mit \/app an.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>user@2204lts:~$ wget http:\/\/localhost:7880\/app\n--2022-06-11 11:57:10--  http:\/\/localhost:7880\/app\nResolving localhost (localhost)... 127.0.0.1\nConnecting to localhost (localhost)|127.0.0.1|:7880... connected.\nHTTP request sent, awaiting response... 200 OK\nLength: 4658 (4,5K) &#091;text\/html]\nSaving to: \u2018app\u2019\n\napp                                     100%&#091;==============================================================================&gt;]   4,55K  --.-KB\/s    in 0s      \n\n2022-06-11 11:57:11 (562 MB\/s) - \u2018app\u2019 saved &#091;4658\/4658]\n\n\nuser@2204lts:~$ ls -la\ntotal 72\ndrwxr-x--- 5 user user  4096 Jun 11 11:57 .\ndrwxr-xr-x 3 root root  4096 Apr 24 10:31 ..\n-rw-rw-r-- 1 user user  4658 Jun 11 11:57 app\n<\/code><\/pre>\n\n\n\n<p>Ja, da ist jemand zu Hause und antwortet auch. Kurzer Test von Au\u00dfen.. nat\u00fcrlich macht keiner das T\u00fcrchen auf. Also auf in die Konfig vom Docspell-Joex. Hier bringt ein drehen an der Base-RL nix. Was k\u00f6nnte es denn sonst noch so sein?? M\u00f6glicherweise die bindings {}. Also drehen wir mal daran und gucken, ob dann anspringt. Zu erst in der Konfiguration vom Docspell-Joex, welche unter folgendem Pfad zu finden ist: \/etc\/docspell-joex\/docspell-joex.conf<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>  bind {\n#    address = \"localhost\"\n    address = \"0.0.0.0\"\n    port = 7878\n  }\n<\/code><\/pre>\n\n\n\n<p>Und dann noch die Konfiguration vom Docspell-Restserver, welche unter folgendem Pfad zu finden ist: \/etc\/docspell-restserver\/docspell-server.conf<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>  bind {\n#    address = \"localhost\"\n    address = \"0.0.0.0\"\n    port = 7880\n  }\n<\/code><\/pre>\n\n\n\n<p>Jetzt sollten die beiden Services auch von Au\u00dfen zu erreichen sein. Testen wir das mal mit dem 7880 Socket.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"980\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-webpage-1024x980.jpg\" alt=\"\" class=\"wp-image-1582\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-webpage-1024x980.jpg 1024w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-webpage-300x287.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-webpage-768x735.jpg 768w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-webpage.jpg 1277w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Eureka!! Der Websever ist am Start! Dann wollen wir mal einen neuen User Anlegen, zum Testen nehme ich<br>Collective ID: docspell <br>User: docspell<br>Password: docspell<\/figcaption><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"516\" height=\"619\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-sign-in.jpg\" alt=\"\" class=\"wp-image-1584\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-sign-in.jpg 516w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-sign-in-250x300.jpg 250w\" sizes=\"auto, (max-width: 516px) 100vw, 516px\" \/><\/figure>\n\n\n\n<p>Und mach anschlie\u00dfend den Login mit diesen Credentionalls&#8230;<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"376\" height=\"531\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell_1st-login.jpg\" alt=\"\" class=\"wp-image-1585\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell_1st-login.jpg 376w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell_1st-login-212x300.jpg 212w\" sizes=\"auto, (max-width: 376px) 100vw, 376px\" \/><\/figure>\n\n\n\n<p>Und siehe da, das Docspell Dashboard meldet sich wie erh\u00f6fft.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"982\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-dashboard-1024x982.jpg\" alt=\"\" class=\"wp-image-1586\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-dashboard-1024x982.jpg 1024w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-dashboard-300x288.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-dashboard-768x736.jpg 768w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/docspell-dashboard.jpg 1277w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Das macht doch einen sehr aufger\u00e4umten Eindruck. Dann werden wir ihm doch gleich mal ein paar Pdfs und PPtx zum verarbeiten hineinwerfen und sehen, was Docspell daraus macht.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"488\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import-1024x488.jpg\" alt=\"\" class=\"wp-image-1588\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import-1024x488.jpg 1024w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import-300x143.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import-768x366.jpg 768w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import-1536x732.jpg 1536w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import-2048x976.jpg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Nach dem Clicken auf Submit legt Docspell nun los. Zu erkennen ist dieses an der R\u00fcckmeldung.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"489\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_submit-1024x489.jpg\" alt=\"\" class=\"wp-image-1590\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_submit-1024x489.jpg 1024w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_submit-300x143.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_submit-768x367.jpg 768w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_submit-1536x733.jpg 1536w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_submit-2048x978.jpg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Und anschlie\u00dfend an Processing.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"489\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_processing-1024x489.jpg\" alt=\"\" class=\"wp-image-1591\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_processing-1024x489.jpg 1024w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_processing-300x143.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_processing-768x367.jpg 768w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_processing-1536x733.jpg 1536w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/1st_import_processing-2048x978.jpg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Irgendwo scheint es jetzt aber noch zu klemmen. Die zu importierenden Dateien h\u00e4ngen jetzt seit 15 Minuten in der Processing Queue werden nicht weniger&#8230;<\/p>\n\n\n\n<p>Nach einiger Suche in der Dokumentation und anschlie\u00dfend in den Configs stellte sich heraus, das Solr nicht sauber als Backend eingebunden war und nun alles l\u00e4uft.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">14. Erstes Fazit<\/h2>\n\n\n\n<p>Ich habe Docspell mall 99 PDF Files f\u00fcr den Import angeboten. Diese werden \u00fcber alle vier CPUs der VM importiert in worklich flottem Tempo. Von den nun 16GByte f\u00fcr die VM werden dabei 6GByte genutzt und 10GByte bleiben verf\u00fcgbar.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"511\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/Docspell-Cpuload_99files-1024x511.jpg\" alt=\"\" class=\"wp-image-1596\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/Docspell-Cpuload_99files-1024x511.jpg 1024w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/Docspell-Cpuload_99files-300x150.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/Docspell-Cpuload_99files-768x383.jpg 768w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/Docspell-Cpuload_99files.jpg 1058w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Von den im Feature-Guide als supporteten Filetypes habe ich mal die f\u00fcr mich g\u00e4ngigen \u00fcberpr\u00fcft und ja, diese werden zum einen Supportet und damit sauber importiert.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"905\" height=\"454\" src=\"https:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/filetype-feature.jpg\" alt=\"\" class=\"wp-image-1597\" srcset=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/filetype-feature.jpg 905w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/filetype-feature-300x150.jpg 300w, http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/06\/filetype-feature-768x385.jpg 768w\" sizes=\"auto, (max-width: 905px) 100vw, 905px\" \/><\/figure>\n\n\n\n<p>Die von mir am meistens genutzten Standard-Typen liefen ohne Probleme: <\/p>\n\n\n\n<p>doc\/x + xls\/x+ pdf + odt + ods + txt + jpg + png + html<\/p>\n\n\n\n<p>Positiv zu erw\u00e4hnen ist die autemberaubt schnelle Context-Suche mittels Solr, das Ding zieht mal richtig die Wurst vom Teller!<\/p>\n\n\n\n<p>Ich werde in der n\u00e4chsten Zeit noch einmal Docspell und Paperless-ngx einem detaillierten Stresstest unterziehen und berichten, bevor ich einen Schritt weiter gehe und mal meinen gesamten Papierberg auf das m\u00f6gliche Tool der Wahl werfe.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Nach dem ich mir Paperless-NGX angesehen habe und mir der Umfang an supporteten Dokumenten durch das DMS nicht ausreichte sehe ich mir in diesem Beitrag das DMS Docspell an. Es scheint durch seine Nutzung&#46;&#46;&#46;<\/p>\n","protected":false},"author":2,"featured_media":1545,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[88,86,87,84],"class_list":["post-1543","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-linux","tag-22-04lts","tag-docspell","tag-document-management-system","tag-ubuntu"],"_links":{"self":[{"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/posts\/1543","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=1543"}],"version-history":[{"count":39,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/posts\/1543\/revisions"}],"predecessor-version":[{"id":1598,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/posts\/1543\/revisions\/1598"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/media\/1545"}],"wp:attachment":[{"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=1543"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=1543"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=1543"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}