{"id":1965,"date":"2022-11-20T17:33:05","date_gmt":"2022-11-20T15:33:05","guid":{"rendered":"https:\/\/www.fotoandnet.de\/wp\/?p=1965"},"modified":"2022-11-20T17:33:06","modified_gmt":"2022-11-20T15:33:06","slug":"paperless-ngx-whoosh-sheet-cheat","status":"publish","type":"post","link":"http:\/\/www.fotoandnet.de\/wp\/?p=1965","title":{"rendered":"Paperless-NGX \/ Whoosh Sheet Cheat"},"content":{"rendered":"\n<p>Nachdem in nun mehr als 3000 Dokumente auf mein Paperless-NGX migriert habe, kommen die ersten Erkenntnisse im Suchalgorithmus. Diese habe ich mal zusammengefasst und hier als PDF zum Downloaden bereitgestellt:<\/p>\n\n\n\n<div class=\"wp-block-file\"><a id=\"wp-block-file--media-1b78bad9-f575-408e-a20d-a7dcde8dc0bb\" href=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/11\/20221120_Paperless-NGX_Cheat_Sheet.pdf\">20221120_Paperless-NGX_Cheat_Sheet<\/a><a href=\"http:\/\/www.fotoandnet.de\/wp\/wp-content\/uploads\/2022\/11\/20221120_Paperless-NGX_Cheat_Sheet.pdf\" class=\"wp-block-file__button wp-element-button\" download aria-describedby=\"wp-block-file--media-1b78bad9-f575-408e-a20d-a7dcde8dc0bb\">Herunterladen<\/a><\/div>\n\n\n\n<p>Normalerweise nutze ich die erweiterte Suche in den Dokumenten, da sich damit sehr pr\u00e4zise steuern l\u00e4\u00dft, was ich als Ergebnis erhalte. <\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Suchfelder<\/h2>\n\n\n\n<p>Beim Studieren der <a rel=\"noreferrer noopener\" href=\"https:\/\/paperless-ngx.readthedocs.io\/en\/latest\/index.html\" target=\"_blank\">Paperless-NGX<\/a> oder <a rel=\"noreferrer noopener\" href=\"https:\/\/whoosh.readthedocs.io\/en\/latest\/querylang.html\" target=\"_blank\">Python Whoosh<\/a> Anleitung habe ich mir folgende Suchfelder notiert, mit welchen ich am meisten zu meinen Ergebnissen komme.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Feld<\/th><th>Beispiel Suchbegriff<\/th><\/tr><\/thead><tbody><tr><td>Titel<\/td><td>(title:*konzept*)<\/td><\/tr><tr><td>Dokumenttyp<\/td><td>(type:<em>satzung<\/em>)<\/td><\/tr><tr><td>Tags<\/td><td>(tag:ipv6)<\/td><\/tr><tr><td>Korrespondent<\/td><td>(correspondent:&#8220;RIPE NCC&#8220;)<\/td><\/tr><tr><td>Ausgestellt am<\/td><td>(created:[2021 to 2022])<br>(created:[last tuesday to today])<\/td><\/tr><tr><td>Hinzugef\u00fcgt am<\/td><td>(added:[-2year to now])<br>(added:[-1month to now])<\/td><\/tr><tr><td>Inhalt<\/td><td>(content:adressplan)<br>(content:Rechnung)<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\">Suchfelder<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Datumsfelder<\/h2>\n\n\n\n<p>Bei den Datumsfelder merkt man ganz klar, dass hier keine Programmierer mit einem Metrischen-System im Kopf tippen. \ud83d\ude09 Es f\u00fchrt in weiten Teilen f\u00fcr Zeitr\u00e4ume kein Weg an der Nutzung des Imperialen-Systems vorbei&#8230; seufz. Allerdings sind auch gen\u00fcgend metrische Optionen vorhanden, so dass man sich nicht den Hals bricht.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Zeitraum \/ Datum<\/th><th>Beispiel Suchbegriff<\/th><\/tr><\/thead><tbody><tr><td>genau 12.09.2005<\/td><td>20050912<\/td><\/tr><tr><td>genau 12.09.2005<\/td><td>2005 sept 12th<\/td><\/tr><tr><td>genau 23.06.1978<\/td><td>june 23 1978<\/td><\/tr><tr><td>im Monat Juli 1985<\/td><td>july 1985<\/td><\/tr><tr><td>an einem 12 September<\/td><td>sep 12<\/td><\/tr><tr><td>Heute<\/td><td>today<\/td><\/tr><tr><td>Gestern<\/td><td>yesterday<\/td><\/tr><tr><td>Morgen<\/td><td>tomorrow<\/td><\/tr><tr><td>Jetzt<\/td><td>now<\/td><\/tr><tr><td>n\u00e4chsten Freitag<\/td><td>next friday<\/td><\/tr><tr><td>letzten Dienstag<\/td><td>last tuesday<\/td><\/tr><tr><td>um 5:00 Uhr<\/td><td>5am<\/td><\/tr><tr><td>um 10:25:54 Uhr<\/td><td>10:25:54<\/td><\/tr><tr><td>um 23:12 Uhr<\/td><td>23:12<\/td><\/tr><tr><td>um 20:00 Uhr<\/td><td>8 PM<\/td><\/tr><tr><td>um 4:46 Uhr am 31.10.2010<\/td><td>4:46 am oct 31 2010<\/td><\/tr><tr><td>zwischen letzten Dienstag und Heute<\/td><td>last tuesday to today<\/td><\/tr><tr><td>zwischen Heute und n\u00e4chstem Freitag<\/td><td>today to next friday<\/td><\/tr><tr><td>zwischen Januar 2005 und Februar 2008<\/td><td>jan 2005 to feb 2008<\/td><\/tr><tr><td>vor einer Woche und Heute<\/td><td>-1 week to now<\/td><\/tr><tr><td>zwischen jetzt und in 2 Stunden<\/td><td>now to +2h<\/td><\/tr><tr><td>vor einem Jahre und 6 Monaten und in zwei Jahren und 23 Tagen<\/td><td>-1y6mo to +2 yrs 23d<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\">Datumsfelder<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Boolesche Operatoren<\/h2>\n\n\n\n<p>Hier spielt Paperless-NGX mit Whoosh seine starke Seite aus, auch wenn das bei komplexen und verketteten Suchanfragen schon einmal dazu f\u00fchrt, dass Paperless-NGX gerne 30 Sekunden oder l\u00e4nger braucht. <\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Boolescher Operator<\/th><th>Erl\u00e4uterung<\/th><th>Beispiel Suchbegriff<\/th><\/tr><\/thead><tbody><tr><td>AND<\/td><td>beide Suchbegriffe m\u00fcssen vorkommen<\/td><td>(content:IPv6) AND (content:IPv4)<\/td><\/tr><tr><td>OR<\/td><td>einer der beiden Suchbegriffe m\u00fcssen vorkommen<\/td><td>(content:Rechnung) OR (content:Abrechnung)<\/td><\/tr><tr><td>ANDMAYBE<\/td><td>Suchbegriff1 muss enthalten sein und m\u00f6glicherweise Suchbegriff2<\/td><td>(content:Central) ANDMAYBE (content:Leistungsabrechnung)<\/td><\/tr><tr><td>NOT<\/td><td>Suchbgeriff1 soll enthalten sein, nicht jedoch Suchbegriff2<\/td><td>(content:IPv6) NOT (content:RIPE)<\/td><\/tr><tr><td>ANDNOT<\/td><td>Suchbgeriff1 soll enthalten sein und nicht Suchbegriff2<\/td><td>(content:IPv6) ANDNOT (title:<em>konzept<\/em>)<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\">Boolesche Operatoren<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Platzhalter\/Fuzzy<\/h2>\n\n\n\n<p>Auch eine unscharfe Suche oder Suchfelder mit Platzhaltern funktioniert ganz gut, allerdings wirkt sich ein zu unscharfer Begriff (fuzzy search) nat\u00fcrlich betr\u00e4chtlich auf die Dauer des Suchlaufs aus(!!!). Aber gerade wenn die Erinnerung nur ein &#8222;das wurde doch so oder so \u00e4hnlich geschrieben&#8220; ergibt, ist es das Mittel der Wahl.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Platzhalter\/Fuzzy<\/th><th>Erl\u00e4uterung<\/th><th>Beispiel Suchbegriff<\/th><\/tr><\/thead><tbody><tr><td>~<\/td><td>Suchbegriff unscharf fassen mittels ~<\/td><td>(content:adresse~)<\/td><\/tr><tr><td>?<\/td><td>Platzhalterausdruck mit ? f\u00fcr ein einzelnes Zeichen<\/td><td>(content:te?t)<\/td><\/tr><tr><td>*<\/td><td>Platzhalterausdruck mit * f\u00fcr eine beliebige Anzahl von Zeichen<\/td><td>(content:test*)<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\">Platzhalter\/Fuzzy<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Verst\u00e4rker\/Abd\u00e4mpfer<\/h2>\n\n\n\n<p>Diese Funktion hat zwar keinen Einfluss auf die Menge der Suchergebnisse, jedoch auf die Reihenfolge, in welcher die Ergebnisse aufgelistet werden. Gerade bei einer hohen Anzahl von Treffern ist diese Verst\u00e4rkung\/Abd\u00e4mpfung sehr n\u00fctzlich.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Verst\u00e4rker\/Abd\u00e4mpfer<\/th><th>Erl\u00e4uterung<\/th><th>Beispiel Suchbegriff<\/th><\/tr><\/thead><tbody><tr><td>^2<\/td><td>doppelt so wichtig<\/td><td>(content:ninja^2)<\/td><\/tr><tr><td>^1<\/td><td>normale\/einfache Gewichtung (default)<\/td><td>(content:cowboy)<\/td><\/tr><tr><td>^0.5<\/td><td>halb so wichtig<\/td><td>(content:b\u00e4r^0.5)<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\">Verst\u00e4rker\/Abd\u00e4mpfer Elemente<\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Komplexe Suchen<\/h2>\n\n\n\n<p>Wenn bei der Suche nach einem Dokument der gew\u00e4hlte Suchbegriff nicht zu einem klaren Ergebnis oder halt zu einer zu gro\u00dfen Anzahl von Ergebnissen f\u00fchrt, so lassen sich die vorher genannten Suchbegriffe gerne beliebig kombinieren. Doch Vorsicht, eine zu gro\u00dfe Anzahl vom Platzhaltern oder Fuzzysuchen konsumieren gut gerne schon einmal Minuten, bevor dann eine mehr oder minder kurze Liste von Ergebnissen heraus purzelt. \ud83d\ude09<\/p>\n\n\n\n<p> <\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Komplexe Suche<\/th><th>Beispiel Suchbegriff<\/th><\/tr><\/thead><tbody><tr><td>Im Inhalt soll \u201eRechnung\u201c vorkommen und das soll vor einem Monat bis Heute hinzugef\u00fcgt worden sein<\/td><td>(content:Rechnung) AND (added:[-1month to now])<\/td><\/tr><tr><td>Im Inhalt soll \u201eDNS\u201c vorkommen und der Korrespondent ist \u201eRIPE NCC\u201c und es soll vor 6 Monaten bis jetzt hinzugef\u00fcgt worden sein<\/td><td>(content:DNS) AND (correspondent:&#8220;RIPE NCC&#8220;) AND (added:[-6month to now])<\/td><\/tr><tr><td>Im Inhalt soll \u201eIPv6\u201c vorkommen und der Korespondent ist \u201eRIPE NCC\u201c und es soll vor 3 Monaten bis jetzt hinzugef\u00fcgt worden sein<\/td><td>(content:IPv6) AND (correspondent:&#8220;RIPE NCC&#8220;) AND (created:[-3month to now])<\/td><\/tr><tr><td>Im Inhalt soll \u201eZone\u201c vorkommen und es soll im Jahr 2021 bis jetzt erzeugt worden sein und hinzugef\u00fcgt worden sein der Korrespondent ist \u201eRIPE NCC\u201c<\/td><td>(content:Zone) AND (created:[2021 to now]) AND (correspondent:&#8220;RIPE NCC&#8220;)<\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\">Komplexe Suche<\/figcaption><\/figure>\n","protected":false},"excerpt":{"rendered":"<p>Nachdem in nun mehr als 3000 Dokumente auf mein Paperless-NGX migriert habe, kommen die ersten Erkenntnisse im Suchalgorithmus. Diese habe ich mal zusammengefasst und hier als PDF zum Downloaden bereitgestellt: Normalerweise nutze ich die&#46;&#46;&#46;<\/p>\n","protected":false},"author":2,"featured_media":1987,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[87,81,97,98],"class_list":["post-1965","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-linux","tag-document-management-system","tag-paperless-ngx","tag-search","tag-whoosh"],"_links":{"self":[{"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/posts\/1965","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=1965"}],"version-history":[{"count":18,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/posts\/1965\/revisions"}],"predecessor-version":[{"id":1988,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/posts\/1965\/revisions\/1988"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=\/wp\/v2\/media\/1987"}],"wp:attachment":[{"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=1965"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=1965"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.fotoandnet.de\/wp\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=1965"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}